(資料圖片僅供參考)
據了解,o1和GPT系列模型最大的區別主要在于,該系列模型是在思考之后回答用戶(hù)問(wèn)題,輸出高質(zhì)量的內容,而非迅速回應無(wú)效答案,即用模仿人類(lèi)思維過(guò)程的“慢思考”代替過(guò)去追求快速響應的“快思考”,這與國內一家大模型企業(yè)在近兩個(gè)月前提出的觀(guān)點(diǎn)不謀而合——早在今年7月底舉辦的ISC 2024大會(huì )上,360集團創(chuàng )始人周鴻祎就宣布,360將“用基于智能體的框架打造慢思考系統,從而增強大模型的慢思考能力”,并在近期多次強調,將“利用智能體框架,讓大模型從快思考轉成慢思考模式,把多個(gè)大模型組合起來(lái)解決業(yè)務(wù)問(wèn)題”。
對于o1的推出,周鴻祎在其最新發(fā)布的短視頻中表示,過(guò)去建立在大參數、大數據量的模型技術(shù)演進(jìn)終于找到了新的突破方向,也為下一個(gè)階段人工智能的進(jìn)步和應用開(kāi)辟了巨大的空間。“o1不是像大模型一樣用文字來(lái)訓練,而是像自己和自己下棋一樣,通過(guò)強化學(xué)習來(lái)實(shí)現這種思維鏈的能力”,周鴻祎說(shuō)。
周鴻祎用“快思考”和“慢思考”兩項人類(lèi)具備的能力對思維鏈強大的原因進(jìn)行了解讀。他指出,快思考的特點(diǎn)是快速直覺(jué)、無(wú)意識,反應很快但能力不夠強。GPT類(lèi)大模型通過(guò)訓練大量知識,主要學(xué)習的是快思考能力,這也是為什么GPT類(lèi)大模型脫口而出的答案質(zhì)量不夠穩定,“就像人一樣,不假思索出口成章而不出錯非常難實(shí)現”;慢思考的特點(diǎn)則是緩慢、有意識、有邏輯性,需要分很多步驟,類(lèi)似寫(xiě)一篇復雜的文章,要先列提綱,根據提綱去搜集數據,收集素材,根據素材進(jìn)行討論,再把文章寫(xiě)出來(lái),還要進(jìn)行潤色和修改。“這一次o1擁有了人類(lèi)慢思考的特質(zhì),在回答問(wèn)題前會(huì )反復地思考,拆解、理解、推理,可能會(huì )自己?jiǎn)?wèn)自己1000遍,然后才能給出最終的答案。”
不過(guò),盡管在“慢思考”能力上取得了巨大突破,o1依然難稱(chēng)完美。據媒體報道,目前的o1-preview版本依舊存在幻覺(jué)問(wèn)題、運行速度較慢及成本高昂等諸多局限性,限制了其應用范圍。與之相比,更早提出“慢思考”概念的360通過(guò)其首創(chuàng )的CoE(Collaboration of Experts,專(zhuān)家協(xié)同)技術(shù)架構及混合大模型對“慢思考”進(jìn)行落地實(shí)踐,該技術(shù)架構已落地在360 AI搜索、360 AI瀏覽器等多款產(chǎn)品中。AI助手通過(guò)CoE架構還接入了很多小參數專(zhuān)家模型,在回答簡(jiǎn)單問(wèn)題時(shí)調用更精準的“小模型”,在獲得高質(zhì)量回答的同時(shí)還能節約推理資源、提升響應速度,實(shí)現對“慢思考”過(guò)程中速度過(guò)慢等問(wèn)題的改進(jìn)。
據了解,近期有國內技術(shù)團隊通過(guò)將思維鏈優(yōu)化為CoE協(xié)同工作模式,使用任意三個(gè)模型協(xié)同工作達到了和OpenAI o1-preview類(lèi)似的反思決策效果。經(jīng)過(guò)21道復雜邏輯推理題測試結果顯示,其效果與OpenAI o1-preview相當,完全超越GPT-4o,有時(shí)還能超越o1-preview。
“所以,以后比的不是多快能給你答案,而是給的答案完不完整,這也會(huì )改變人工智能服務(wù)的業(yè)態(tài),人工智能到最后還是要參考人類(lèi)大腦的組成來(lái)構造工作模式”,周鴻祎說(shuō)。
標簽: