Nature調查發現:AI正在改變科學家的研究方式

智東西編譯 徐豫編輯 心緣

智東西10月12日消息,全球頂尖科學學術期刊《Nature》於10月10日發表了一篇科學家利用人工智能(AI)工具做科學研究的行業觀察,發現AI工具正在改變傳統的科研工作方式。目前,許多AI工具可以幫研究人員在大量文獻中篩選出所需資料,從而使科學研究更加高效。

這些用於科學研究檢索的AI工具基於大語言模型(LLM),其不僅可以蒐集、篩選現有研究文獻,還可以總結、列舉文中的關鍵發現。背後的AI公司不斷提升這些模型的性能,並定期推出新的AI工具。

《Nature》雜誌採訪了多位AI科學檢索工具的開發者和使用者後,彙集了他們的實際上手體驗,以及使用這些AI工具的潛在風險。

文章地址:https://doi.org/10.1038/d41586-024-02942-0

一、科學家用AI工具瞭解科研方向、收集科研資料、撰寫文獻綜述

據《Nature》統計,市面上最受歡迎的AI科學檢索工具包括Elicit、Consensus和You,它們爲研究人員提供了多種高效完成文獻綜述的方式。

1、美國AI論文生成公司Elicit:自動化完成文獻綜述

當研究人員在Elicit中輸入一個研究問題後,該AI工具會列出相關論文,並總結這些論文的主要發現。

在此基礎上,研究人員還可以針對某一篇論文繼續提問,以及指定留下某一本期刊或某一種研究類型的內容。

2、美國AI學術搜索引擎公司Consensus:可視化科研行業共識

公司同名AI工具Consensus可以幫研究人員蒐集、整理科學界對某個科學課題有哪些說法和爭議。

舉個例子,當研究人員輸入“氯胺酮可以治療抑鬱症嗎”這個問題後,該AI工具會生成一個“Consensus meter(共識度量器)”,其會總結支持、反對或不確定該假設的論點和論據,以顯示科學界對上述問題的共識程度。

▲Consensus meter(共識度量器)可以更直觀地展示科研行業共識(圖源:《Nature》)

Consensus的首席執行官Eric Olson(埃裡克·奧爾森)稱,其AI工具雖然不能替代研究人員去深入分析論文內容,但可以有效幫助他們速覽研究動態並歸納主流研究方向。

3、美國AI學術搜索引擎公司You:個性化科研研究

You方面自稱其同名AI工具“You”,是第一個結合了文獻最新引用數據的AI檢索工具。該AI工具爲研究人員提供了探索研究問題的多種模式,例如其“genius mode(天才模式)”會以圖表的形式反饋檢索結果。

上個月,You還推出了一款允許多人協作的AI工具。研發人員可以合作定製、共享個性化的AI聊天框,令其自動執行諸如事實覈查之類的特定任務。

二、AI科研檢索工具支持多語種,有望打破學術交流語言壁壘

除了熱門的Elicit、Consensus和You外,其他AI檢索工具也在探索利用AI技術提升科研效率的更多應用場景。

美國AI生物學知識問答平臺BioloGPT能夠針對生物學問題,生成總結性的、更有深度的回答,是大量垂直於單一學科的AI工具之一。

今年9月,英國一站式科研服務公司Clarivate推出了一個AI檢索工具,研究人員可以用其快速調用Web of Science數據庫中的內容。Clarivate方面稱,基於該AI檢索工具,研究人員輸入一個研究問題後,可以以圖譜的形式查看相關的論文摘要、科研主題和引用文獻,並且能看到每一篇參考文獻的標註,從而更高效地找出關鍵論文及其論點。

此外,即便Web of Science中收錄的是英文論文,Clarivate的AI檢索工具也可以用英語外的其他語言總結論文中的關鍵信息。在Clarivate產品副總裁Francesca Buckland(弗朗西斯卡·巴克蘭德)看來,將多語言的翻譯能力融入AI檢索工具背後的大模型中,是一件“非常具有潛力”的事情,它可以減少全球科研資源不平等的情況。

▲研究人員可以用Clarivate的AI工具,梳理Web of Science數據庫中的內容(圖源:《Nature》)

三、建議利用AI檢索工具各自的優勢查資料,但要記得覈查

當被《Nature》問及“最好用的AI檢索工具是什麼”時,加拿大流行病學家Razia Aliani(拉齊婭·阿利亞尼)說:“我認爲這通常取決於實際研究目的。”目前她在澳大利亞一家非營利性的文獻綜述公司工作,公司名爲Covidence。

如果需要了解某個科研主題的不同觀點和共識,Aliani會傾向於使用Consensus。但要審覈大型數據庫時,她會選擇用其他AI檢索工具,比如Elicit。

在Elicit上拋出初始研究方向後,Aliani會根據該AI工具的檢索結果,排除與研究方向無關的論文,然後深入剩餘的關聯性更強的文獻,以微調初始研究方向。

她認爲,AI科研檢索工具不僅節省了時間,還能提高科研工作質量、激發創造力並減輕科研壓力。

Anna Mills(安娜·米爾斯)在美國加利福尼亞州的馬林學院教授基礎寫作課程,平常也會涉及有關如何開展研究過程的課程。她雖然很想向學生推薦這些AI檢索工具,但同時也擔心這些工具會妨礙學生深入理解一些學術研究。

相較於用AI檢索工具獲取科研信息,她更希望教會學生如何辨別AI檢索結果中的錯誤,從而培養他們辯證使用AI工具的能力。

美國AI生物學知識問答平臺BioloGPT的創始人Conner Lambden(康納·蘭登)也認爲:“學會對一切事物保持懷疑態度,包括你自己在用的研究方法,是成爲一名優秀的科學家的必經之路。”

四、AI錯誤引用文獻,有科學家因此停用,開發者正補救

AI大模型在檢索過程中時不時出現“幻覺”,已是一個老生常談的問題。在AI界,“”幻覺(Hallucination)”是指AI模型編造、引用、輸出一些具有誤導性的、虛假的、無中生有的信息。

而對於ChatGPT等主流AI聊天機器人回答準確性的擔憂,也蔓延到了AI科學檢索工具上。多位研究人員提醒應謹慎使用這些AI科學檢索工具。

用AI檢索工具做科研時,常見的錯誤有編造統計數據、誤解引用的論文、AI大模型的偏見。

體育科學家Alec Thomas(亞歷克·托馬斯)目前在瑞士的洛桑大學做研究,他曾一度“非常欣賞AI檢索工具”。

然而,在親自試用一些AI檢索工具後,他的態度卻發生了180度大轉彎。Thomas決定放棄使用這些AI檢索工具,原因是他發現AI生成的答案中有“非常嚴重的基礎性錯誤”。

例如,他用AI檢索工具研究“參與體育活動對患有飲食失調的人的影響”時,AI引用了一篇與研究問題毫無關係的論文來生成研究結論。

Thomas直言:“我們不會相信一個公認可能隨時會出現幻覺的人類,那又憑什麼去相信有類似症狀的AI呢?”

據多位接受《Nature》採訪的AI檢索工具開發者透露,他們已經採取了安全措施,以提高AI檢索的準確性。

美國AI論文生成公司Elicit的項目開發負責人James Brady(詹姆斯·布拉迪)稱,該公司十分重視AI檢索工具的準確性問題,正在使用多個安全系統檢查AI回答中的錯誤。

英國一站式科研服務公司Clarivate產品副總裁Buckland則稱,Web of Science的AI工具有“可靠的保護機制”,以規避AI生成帶有欺騙性的、不準確的內容。在測試期間,她的研發團隊曾與大約1.5萬名研究人員共同整合反饋,以調試AI檢索的準確性。

儘管經過開發者的不斷糾偏,AI檢索工具的使用體驗有所改善,美國AI學術搜索引擎公司Consensus的CEO Olson卻認爲,這非但不能根治AI的“幻覺”,還可能會加重“病情”。

Olson解釋道,通過人爲反饋調試的AI檢索工具,傾向於得出對人類有益的答案,並且會因此自主填補一些不存在的事實。

結語:未來的AI工具需要比拼專業度

從《Nature》的調查中,我們可以看到AI檢索的應用場景,已經逐漸向細分領域滲透。

這也意味着,類似於AI科研檢索領域,未來AI大模型及其產品對專業性、準確性有着更嚴格的要求。

目前來看,面向專業領域微調後的AI模型,出現“幻覺”的概率和頻率會有所降低,而其存在的偏見問題則不能光靠技術更新來解決。

李飛飛於2015年聯合創建了AI4All項目,旨在吸納更多諸如女性、有色人種、工薪階層的AI人才,以減輕開發AI大模型過程中存在的偏見。

Andrew Hoblitzell(安德魯·霍布里策爾)是印度的一名生成式AI研究人員,他已在多所大學開設了圍繞AI4All項目的講座。

在他看來,AI檢索工具可以在一定程度上爲科研過程提供支持,但前提是科學家要親自驗證過AI生成的信息。

Hoblitzell稱:“現階段,這些AI檢索工具應該是科研的輔助工具,而不是最終的成果來源。”

來源:《Nature》