“隨著(zhù)2017年AlphaGoZero的面世,人工智能技術(shù)發(fā)展開(kāi)啟了第四次浪潮。這個(gè)階段,人工的基本特點(diǎn)發(fā)生了改變?!痹?023年5月18日召開(kāi)的中國家用電器技術(shù)大會(huì )上,中國科學(xué)技術(shù)大學(xué)教授陳小平在介紹人工智能新發(fā)展時(shí)如是說(shuō)。
此次大會(huì )上,陳小平不僅對人工智能的大模型進(jìn)行了詳細介紹,還分享了從大模型到柔性機器人的新發(fā)展,以及這些變化帶來(lái)的新機遇和挑戰。
陳小平在演講中指出,現階段,人工智能呈現出四大特點(diǎn),即大任務(wù)、大訓練、大模型、大系統。
(資料圖)
其中,大任務(wù),指的是大規模的真實(shí)場(chǎng)景任務(wù),如下棋、聊天、語(yǔ)言翻譯、命題、作文、命題繪畫(huà)等。陳小平以圍棋為例,大模型抓取了超過(guò)1億全球用戶(hù)的真實(shí)場(chǎng)景,這在以往是非常少見(jiàn)的。
大訓練,則是指人工智能訓練法已經(jīng)從過(guò)去的大數據驅動(dòng),在2017年以后轉變?yōu)榇笥柧汄寗?dòng)。相比大數據驅動(dòng),大訓練驅動(dòng)的具體表現為四項新要求。陳小平詳細介紹說(shuō):“第一,訓練數據的質(zhì)。在大數據驅動(dòng)的時(shí)候,人工智能對數據的質(zhì)沒(méi)有要求,而現在強調的是原始數據。第二,訓練數據的量?,F在對人工智能原始數據的量給出了新的標準,就是人類(lèi)規模。比如ChatGPT,有人分析它抓取了互聯(lián)網(wǎng)1/3到2/3的文本數據訓練。第三,數據獲取方式。因為原始數據為人類(lèi)規模的量,這就必須要用自動(dòng)或者半自動(dòng)的方式抓取數據。第四,訓練結果發(fā)生了變化?,F在的訓練結果,是一種實(shí)例性的模型?!?
大模型,就是經(jīng)過(guò)大訓練生成的大型實(shí)例性模型,例如,大型語(yǔ)言模型,也簡(jiǎn)稱(chēng)為大模型。大系統則是針對大任務(wù)、圍繞大模型、集成大量技術(shù)的集成智能系統?,F在的人工智能,是集成智能,它里面集成了非常多的、不同種類(lèi)的智能技術(shù)。陳小平表示,中國想要抓住這一階段的發(fā)展機遇,非常關(guān)鍵的是要在概念上跟上時(shí)代,甚至是提前定義。
人工智能現階段的應用是生成式的,且已不再是狹義的生成語(yǔ)言、圖像等內容,而是從人到AI、從AI到人的交互?!拔艺J為,自然語(yǔ)言人機交互的重點(diǎn)是,會(huì )說(shuō)話(huà),能聽(tīng)懂人話(huà),能回答問(wèn)題,但不能保證回答一定正確。對機器語(yǔ)言表達的基本要求,是說(shuō)話(huà)要符合人的語(yǔ)言習慣?!标愋∑奖硎?,語(yǔ)言習慣是什么,現在沒(méi)有科學(xué)標準,但是有經(jīng)驗標準。所以關(guān)鍵是要掌握并利用這個(gè)經(jīng)驗標準,這就要從人類(lèi)規模語(yǔ)料中自動(dòng)提取語(yǔ)言痕跡,并用于人機自然語(yǔ)言交互。
語(yǔ)言痕跡來(lái)源于原始語(yǔ)料。陳小平用兩個(gè)句子組成的語(yǔ)料進(jìn)行簡(jiǎn)單舉例:用于訓練的語(yǔ)料分別為“我要上網(wǎng),請打開(kāi)瀏覽器?!薄拔乙?tīng)歌,請打開(kāi)音響?!边@兩句話(huà)反復說(shuō),且概率分別為0.6和0.4。如果基于相鄰語(yǔ)元之間關(guān)聯(lián)度的預測,也就是給定一個(gè)語(yǔ)元,預測下一個(gè)出現的語(yǔ)元,不確定情況下預測錯誤率過(guò)高。比如從“要”預測“上網(wǎng)”的錯誤率達到40%。如果基于語(yǔ)言痕跡遠程關(guān)聯(lián)度時(shí)(遠距離語(yǔ)元之間的關(guān)聯(lián)強度),“上網(wǎng)”與“瀏覽器”語(yǔ)元雖然不相鄰,但具有高關(guān)聯(lián)度,若已出現“打開(kāi)”和“上網(wǎng)”,預測出“瀏覽器”的錯誤率為0。
對此,陳小平表示,基于語(yǔ)言痕跡遠程關(guān)聯(lián)時(shí),預測錯誤率可以大大降低。這也是為什么大家覺(jué)得大模型好用?!半m然舉例的兩個(gè)句子只有六個(gè)語(yǔ)元,但在實(shí)際應用中,是從人類(lèi)規模語(yǔ)料中提取語(yǔ)元關(guān)聯(lián)度,用于自然語(yǔ)言人機交互,數據的量很大。人工智能可以回看的語(yǔ)元至少超過(guò)4000個(gè),甚至已經(jīng)有可以回看10萬(wàn)個(gè)語(yǔ)元的大模型發(fā)布?!标愋∑街赋?,如果將互聯(lián)網(wǎng)三分之一到三分之二的語(yǔ)言痕跡都抓取做成模型,大模型將非常強大。
上述所說(shuō)的抓取語(yǔ)言痕跡,訓練語(yǔ)言痕跡,對語(yǔ)言痕跡做關(guān)聯(lián),被稱(chēng)為預訓練模型。這是大模型技術(shù)體系中的一部分。陳小平表示,實(shí)際上,預訓練以后的實(shí)際效果可能不夠理想,不夠精細,此時(shí)就可以引入一種方法——細調?!凹氄{類(lèi)似于收音機的調臺旋鈕,一般收音機不清晰時(shí),就需要細調旋鈕,直至內容變得清晰?!标愋∑奖硎?,細調是專(zhuān)門(mén)訓練出的專(zhuān)用模型,通俗來(lái)說(shuō),不是大范圍的調整,而是有一個(gè)目標后,針對當前矛盾去細調。經(jīng)過(guò)細調后的大模型應用效果會(huì )大幅提升。但是細調不是憑空實(shí)現的,需要大量的語(yǔ)言數據進(jìn)行支撐,且用不同的數據進(jìn)行不同的細調。例如聊天用聊天的細調,編程用編程的細調。
然而,細調后的大模型效果可能還是不夠,還可以運用“提示”?!斑@是小規模的訓練,為用戶(hù)引導模型的回答。也就是在提問(wèn)題時(shí),不僅要提問(wèn),還要給出一些提示。如果提示說(shuō)得好,回答的質(zhì)量也會(huì )大幅提升?!?
值得一提的是,大模型是實(shí)例性模型,是從訓練預料中提取的語(yǔ)元和語(yǔ)言關(guān)聯(lián)度的全體組成的模型,它沒(méi)有概括性規則,無(wú)法進(jìn)行數學(xué)-邏輯推理?!按竽P褪且环N顛覆,我們需要用新的觀(guān)念、新的理念去看待?!标愋∑秸f(shuō)。
一些科幻電影刻畫(huà)出的機器人具有自己的情緒、情感,會(huì )有自己的思想。陳小平直言,擬人化想象對大模型以及所有通過(guò)了大規模驗證的人工智能都不成立?!凹词乖诤腿斯ぶ悄芙换サ墓ぷ髦?,會(huì )從語(yǔ)言中感受到情感、情緒,這也是因為語(yǔ)言的投射效應,即腦補?!标愋∑奖硎?,人說(shuō)話(huà)都帶涵義,所以習慣性地將自己理解的涵義投射到大模型上,認為大模型說(shuō)話(huà)也帶涵義?!皩Υ竽P腿斯ぶ悄茏鰯M人化想象,是不科學(xué)的?!?
大模型的應用,也將為人類(lèi)帶來(lái)重大的機遇和挑戰。在機遇方面,陳小平表示,大模型可以應用于很多場(chǎng)景,例如聊天、智能家居的人機交互、文案撰寫(xiě)、智能客服等。人工智能的加持下,能解決很多以往大家無(wú)法解決的問(wèn)題。
同時(shí),大模型還會(huì )帶來(lái)新的挑戰。首先是公共安全,其次是就業(yè)問(wèn)題?!?017年開(kāi)啟人工智能第四次浪潮的標志性實(shí)踐,就是AlphaGoZero圍棋程序面世,且該程序的圍棋水平已經(jīng)超過(guò)職業(yè)選手?,F在,人類(lèi)積累了千年的圍棋知識很少再是人工教授或者看書(shū),大家都開(kāi)始通過(guò)這個(gè)程序進(jìn)行訓練和學(xué)習,人與人的對練已經(jīng)很少?!彼硎?,雖然圍棋是很小的領(lǐng)域,但未來(lái)大模型的應用可能會(huì )延伸到各領(lǐng)域,也有可能發(fā)生類(lèi)似圍棋領(lǐng)域的情況,從而影響就業(yè)。
人工智能如何在物理世界中應用,也是很大的挑戰。比如現實(shí)世界中的家庭、醫院、工業(yè)、農業(yè)場(chǎng)景,現在的大模型是無(wú)法勝任的。陳小平表示,現在在工業(yè)上普遍應用的機械臂,基本上都是剛性的,這類(lèi)機器人重復精度高,但靈巧性、安全性低,適合用于結構化環(huán)境。對于更復雜的非結構化環(huán)境,需要精確測量、建模和計算,這就需要軟體機器臂(柔性機器人手臂),也就是軟體機器人。這類(lèi)產(chǎn)品采用蜂巢氣動(dòng)網(wǎng)絡(luò )結構,為材料-機構-算法的一體化設計。據陳小平介紹,與傳統機械手臂相比,軟體機器人在制作成本、負載能力、后期維護等方面都具有較高的優(yōu)勢。陳小平在現場(chǎng)通過(guò)幾個(gè)視頻,分享了軟體機器人在喂飯、開(kāi)門(mén)、擰瓶蓋、拉抽屜等多個(gè)場(chǎng)景的應用。
對于人工智能在中國的應用,陳小平表示:“我認為,對于中國,大模型在智能制造、智慧農業(yè)、惠普養老三方面能得到很好的應用后,將迎來(lái)巨大的機遇?!?
嚴正聲明:“電器微刊”所有原創(chuàng )文章,轉載均需獲授權。
標簽: