科研過(guò)程可以完全自動(dòng)化嗎?一個(gè)研究機器學(xué)習的國際團隊正在勇闖“無(wú)人區”。
據《自然》網(wǎng)站近日報道,日本Sakana AI公司和加拿大、英國科學(xué)家攜手,創(chuàng )建了一種基于大語(yǔ)言模型的“人工智能(AI)科學(xué)家”。從閱讀文獻到提出新假設,再到嘗試各種解決方案并撰寫(xiě)論文,整個(gè)研究周期,“AI科學(xué)家”能一氣呵成。
Sakana公司在其官網(wǎng)表示,這位科研“新星”是首個(gè)用于自動(dòng)化科研和開(kāi)放式發(fā)現的綜合AI系統,標志著(zhù)科學(xué)發(fā)現新時(shí)代的開(kāi)始。盡管它展現出非凡的潛力,但目前并不完美,應警惕“AI科學(xué)家”被濫用的風(fēng)險。
【資料圖】
大型語(yǔ)言模型可以完成閱讀文獻、撰寫(xiě)論文、審查論文的所有工作。
推進(jìn)流程行云流水
AI技術(shù)不斷進(jìn)步,讓科學(xué)家能借助一些模型來(lái)集思廣益或編寫(xiě)代碼。然而,這些模型仍然需要大量人工監督,或僅囿于執行特定任務(wù)。
那么,能否利用基礎模型將整個(gè)科研過(guò)程自動(dòng)化呢?包括加拿大不列顛哥倫比亞大學(xué)機器學(xué)習專(zhuān)家在內的團隊,成功創(chuàng )建出首位“AI科學(xué)家”。
在想法生成階段,該“AI科學(xué)家”基于一個(gè)起始模板,先進(jìn)行“頭腦風(fēng)暴”,提出多個(gè)不同研究方向,并進(jìn)行廣泛搜索,以確保某些想法是新穎且有趣的;在實(shí)驗迭代階段,對于第一階段提出的某個(gè)想法,“AI科學(xué)家”會(huì )先開(kāi)展實(shí)驗,然后生成圖表可視化結果,并給每個(gè)圖表添加注釋;在論文寫(xiě)作階段,它會(huì )模仿標準機器學(xué)習會(huì )議的風(fēng)格,撰寫(xiě)出一份文字簡(jiǎn)練、內容豐富的論文,并自主查找相關(guān)論文進(jìn)行引用;在自動(dòng)化同行評審階段,研究團隊開(kāi)發(fā)出一個(gè)自動(dòng)化的“AI審稿人”,其評估生成論文的準確性堪與人類(lèi)相媲美。評估結果和建議可用于改進(jìn)該項目,實(shí)現持續的反饋循環(huán),使“AI科學(xué)家”能夠迭代改進(jìn)其研究成果。
在最初的演示中,該“AI科學(xué)家”針對擴散模型、Transformer模型(一種用于處理語(yǔ)言數據的神經(jīng)網(wǎng)絡(luò )模型),以及AI“領(lǐng)悟”(grokking)等機器學(xué)習子領(lǐng)域進(jìn)行了深入研究,總共生成了10篇論文,每篇論文的成本約15美元。
美國華盛頓大學(xué)計算社會(huì )科學(xué)家杰文·韋斯特表示,該“AI科學(xué)家”行云流水般完成了整個(gè)科研流程,令人印象深刻,有望加速科學(xué)發(fā)現的步伐。
功能遠非盡善盡美
盡管這位“AI科學(xué)家”潛能巨大,但它遠非盡善盡美。
Sakana AI公司指出,“AI科學(xué)家”目前還不具備視覺(jué)功能,因此無(wú)法修復論文中出現的圖表問(wèn)題。例如,它生成的圖表有時(shí)無(wú)法讀取,表格有時(shí)會(huì )超出頁(yè)面范圍,頁(yè)面布局也并不美觀(guān)。
此外,該“AI科學(xué)家”有時(shí)會(huì )出現想法正確但執行錯誤的情況,也會(huì )因比較不當而生成誤導性的結果。在撰寫(xiě)論文和評估結論時(shí),它還可能會(huì )犯嚴重錯誤。例如,它很難比較兩個(gè)數字的大小,這是大語(yǔ)言模型的“通病”。為了部分解決這個(gè)問(wèn)題,研究團隊確保所有實(shí)驗結果都可以重復,并存儲了所有執行文件。
研究人員預計,未來(lái)多模態(tài)模型“加入戰局”,將助該“AI科學(xué)家”一臂之力。
另外,該“AI科學(xué)家”只能開(kāi)展機器學(xué)習領(lǐng)域的研究,且缺乏科研過(guò)程的關(guān)鍵部分:動(dòng)手進(jìn)行實(shí)驗的能力。
艾倫人工智能研究所計算機科學(xué)家湯姆·霍普表示,目前該大語(yǔ)言模型“仍無(wú)法提出并制定新穎有用的科學(xué)方向”。勞倫斯伯克利國家實(shí)驗室材料科學(xué)家赫布蘭德·希德則認為,即使該系統在短期內無(wú)法完成更具創(chuàng )造性的工作,仍可將科研過(guò)程中一些重復性?xún)热葑詣?dòng)化。
Sakana AI也強調,此類(lèi)系統能否提出真正的變革型想法仍未有定論。未來(lái)的“AI科學(xué)家”能否發(fā)明出像人工神經(jīng)網(wǎng)絡(luò )或信息論一樣的概念也還是個(gè)未知數。
能力越強越需慎用
研究人員表示,為擴大該“AI科學(xué)家”的能力,讓其能夠研究更抽象的領(lǐng)域,如純數學(xué)領(lǐng)域,可能需要調遣語(yǔ)言模型之外的其他技術(shù)。
例如,解決數學(xué)問(wèn)題需要邏輯推理,而目前大多數AI模型都不擅長(cháng)邏輯推理。鑒于此,谷歌深度思維公司開(kāi)發(fā)出AlphaGeometr,將語(yǔ)言模型與符號引擎(使用符號和邏輯規則進(jìn)行推理)相結合,構建出一種神經(jīng)—符號混合系統。在今年的奧林匹克數學(xué)競賽中,升級后的AlphaGeometry2在19秒內就解答出一道題,令人類(lèi)選手望塵莫及。
研究人員堅信,目前的迭代只是個(gè)開(kāi)始。“AI科學(xué)家”就像AI科研自動(dòng)化領(lǐng)域的GPT-1。隨著(zhù)不斷迭代,它將如目前的GPT-4一樣,引發(fā)新的科研革命。
不過(guò),與許多新技術(shù)一樣,“AI科學(xué)家”也打開(kāi)了“潘多拉魔盒”,甚至可能被濫用。
譬如,“AI 科學(xué)家”能自動(dòng)創(chuàng )建論文并提交,這將顯著(zhù)增加審稿人的工作量,可能阻礙科學(xué)質(zhì)量控制,并給學(xué)術(shù)進(jìn)步帶來(lái)壓力。而且,“AI科學(xué)家”還可能被用來(lái)制造危險的病毒,給人類(lèi)社會(huì )帶來(lái)潛在危害。( 劉 霞)
標簽: