<strong id="ctjbx"></strong>

<ruby id="ctjbx"></ruby>

您現在的位置：首頁(yè) >
家居 >
正文

大語(yǔ)言模型中的涌現現象是不是偽科學(xué)？當前視點(diǎn)

來(lái)源：程序員客棧時(shí)間：2023-06-17 07:19:25

Datawhale干貨

(相關(guān)資料圖)

作者：平凡@知乎，諾桑比亞大學(xué)，在讀博士

今天晚上，花了一點(diǎn)兒時(shí)間看了兩篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

這兩篇講的都是emergent behavior，即涌現現象。

大規模神經(jīng)網(wǎng)絡(luò )下的涌現現象

在機器學(xué)習中使用大規模神經(jīng)網(wǎng)絡(luò )時(shí)，由于增加了參數數量、訓練數據或訓練步驟等因素，出現了定性上的新能力和性質(zhì)，這些能力和性質(zhì)在小規模神經(jīng)網(wǎng)絡(luò )中往往是不存在的。

第一篇文章舉了這個(gè)例子，每個(gè)圖都可以理解為一個(gè)任務(wù)，橫軸是神經(jīng)網(wǎng)絡(luò )的規模，而縱軸是準確率，可以理解為模型的性能。

我們拿圖一來(lái)看，在10的22次方前，這些模型基本上的性能基本上都很穩定在0附近，而在10的22以后，突然在10的24次方上獲得了很大的性能提升，在其他的幾個(gè)任務(wù)上都表現出類(lèi)似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的評論引用在這里：

作者發(fā)現，當我們訓練用網(wǎng)絡(luò )計算同余加法 a+b = ? (mod c) 時(shí)，網(wǎng)絡(luò )在某個(gè)時(shí)間突然獲得了 100% 準確率。分析發(fā)現，神經(jīng)網(wǎng)絡(luò )實(shí)際上“頓悟”了使用傅立葉變換來(lái)計算同余加法！這個(gè)算法可以證明是正確的，反人類(lèi)直覺(jué)的。

從這倆例子里面我的感受是，只要數據量足夠且真實(shí)，且模型沒(méi)有硬錯誤的前提下，不斷的訓練說(shuō)不定真的能夠產(chǎn)生一些意想不到的效果。

還有就是我覺(jué)得人類(lèi)現在積累的知識并不少，但是系統的少，零星的多，如果類(lèi)似ChatGPT這樣的大模型可以拿所有的人類(lèi)已有知識進(jìn)行不斷學(xué)習的話(huà)，我覺(jué)得有很大概率會(huì )讓它涌現出意想不到的能力。

甚至可能把人類(lèi)的生產(chǎn)力解放提前很多。

參考

1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf

標簽：

責任編輯：FD31

上一篇：全球新消息丨vivo全系列型號大全：從旗艦到入門(mén)級，一網(wǎng)打盡！

下一篇：最后一頁(yè)

精彩圖集(熱圖)

熱點(diǎn)圖集

七?。ㄊ校┛鐓^劃檢察協(xié)作守護秦嶺生態(tài)環(huán)境

點(diǎn)擊詳細
微速訊：轉發(fā)收藏！9組易混淆的大學(xué)專(zhuān)業(yè)

點(diǎn)擊詳細
諾基亞E51無(wú)攝像頭版：一個(gè)時(shí)代的回憶

點(diǎn)擊詳細
天天新資訊：持續發(fā)力植物照明，茂碩電源亮相世界頂級商業(yè)花卉園藝展GreenTech

點(diǎn)擊詳細
三星平板型號參數大全

點(diǎn)擊詳細
伊能靜攜7歲女兒臺北逛街，小米粒膝蓋傷疤明顯，小腿大塊淤青

點(diǎn)擊詳細
三國群英傳5秘籍大全_《三國群英傳8》全秘籍

點(diǎn)擊詳細
海南第172例造血干細胞捐獻者：想成為女兒眼中的“英雄爸爸” 當前快訊

點(diǎn)擊詳細
創(chuàng )意微視頻丨倒計時(shí)一天！廊坊經(jīng)洽會(huì )亮點(diǎn)大劇透！

點(diǎn)擊詳細
【全球快播報】2023鄭州經(jīng)開(kāi)區公辦初中小升初報名指南

點(diǎn)擊詳細
河南省建筑業(yè)協(xié)會(huì )第二屆供需對接會(huì )?成功召開(kāi)|環(huán)球快看

點(diǎn)擊詳細
一片綠色生發(fā)百變業(yè)態(tài)——“千萬(wàn)工程”引領(lǐng)浙江鄉村綠色產(chǎn)業(yè)勃發(fā)

點(diǎn)擊詳細
邵陽(yáng)市一中錄取分數線(xiàn)_市一中錄取分數線(xiàn)_焦點(diǎn)消息

點(diǎn)擊詳細
河北省社會(huì )組織“走出去”集中研討活動(dòng)在石舉辦環(huán)球快資訊

點(diǎn)擊詳細
優(yōu)美的祝福語(yǔ)同學(xué)

點(diǎn)擊詳細
長(cháng)沙市中心區域在哪里_長(cháng)沙市中心

點(diǎn)擊詳細
【世界時(shí)快訊】手機排行榜2023前十名

點(diǎn)擊詳細
世界消息！央媒觀(guān)豫丨“這麥子地毯，比什么裝修都好看！”

點(diǎn)擊詳細

最近更新

大語(yǔ)言模型中的涌現現象是不是偽科學(xué)？當前視點(diǎn)

點(diǎn)擊詳細
全球新消息丨vivo全系列型號大全：從旗艦到入門(mén)級，一網(wǎng)打盡！

點(diǎn)擊詳細
南京市公安局一級高級警長(cháng)蔣浩接受紀律審查和監察調查

點(diǎn)擊詳細
全球熱消息：匯豐控股：當日耗資約1.69億港元回購281.12萬(wàn)股

點(diǎn)擊詳細
頭條焦點(diǎn)：激發(fā)國內市場(chǎng)活力二季度消費市場(chǎng)有望保持平穩增長(cháng)態(tài)勢

點(diǎn)擊詳細
時(shí)空穿梭類(lèi)小說(shuō)兩百萬(wàn)字以上的_時(shí)空穿梭類(lèi)小說(shuō)

點(diǎn)擊詳細
【全球快播報】2023鄭州經(jīng)開(kāi)區公辦初中小升初報名指南

點(diǎn)擊詳細
白茶社區： “粽”情重意端午飄香

點(diǎn)擊詳細
普瑞眼科跌3.88% 某券商在其高點(diǎn)喊買(mǎi)入天天新視野

點(diǎn)擊詳細
微速訊：轉發(fā)收藏！9組易混淆的大學(xué)專(zhuān)業(yè)

點(diǎn)擊詳細
創(chuàng )意微視頻丨倒計時(shí)一天！廊坊經(jīng)洽會(huì )亮點(diǎn)大劇透！

點(diǎn)擊詳細
大連市對外開(kāi)放暨招商引資大會(huì )開(kāi)幕！金普現場(chǎng)簽24億！

點(diǎn)擊詳細
每日視點(diǎn)！我國首艘！成功交付

點(diǎn)擊詳細
銅壺燒水泡茶好的是真的嗎_銅壺燒水泡茶好

點(diǎn)擊詳細
天天熱資訊！美國6月密歇根大學(xué)一年期通脹率預期初值為3.3%，前值為4.2%

點(diǎn)擊詳細
《東南傳播》2022年第08期新鮮出爐_東南傳播世界時(shí)快訊

點(diǎn)擊詳細
碧水源：股東擬減持不超過(guò)0.79%公司股份

點(diǎn)擊詳細
當前動(dòng)態(tài):安徽省蚌埠市2023-06-12 09:08發(fā)布雷電黃色預警

點(diǎn)擊詳細
優(yōu)美的祝福語(yǔ)同學(xué)

點(diǎn)擊詳細
每日熱訊!光庫科技漲20.00%

點(diǎn)擊詳細
網(wǎng)傳大學(xué)生跟同伴游泳溺亡？廣西南寧理工學(xué)院嚴正聲明

點(diǎn)擊詳細
地鐵過(guò)江隧道進(jìn)水了怎么辦？這場(chǎng)演練告訴你

點(diǎn)擊詳細
河南省建筑業(yè)協(xié)會(huì )第二屆供需對接會(huì )?成功召開(kāi)|環(huán)球快看

點(diǎn)擊詳細
七?。ㄊ校┛鐓^劃檢察協(xié)作守護秦嶺生態(tài)環(huán)境

點(diǎn)擊詳細
世界消息！央媒觀(guān)豫丨“這麥子地毯，比什么裝修都好看！”

點(diǎn)擊詳細
市場(chǎng)迎來(lái)一段“幸福時(shí)光”

點(diǎn)擊詳細
速訊：最新粽子專(zhuān)項抽檢情況公布不合格樣品均為超范圍使用食品添加劑

點(diǎn)擊詳細
一片綠色生發(fā)百變業(yè)態(tài)——“千萬(wàn)工程”引領(lǐng)浙江鄉村綠色產(chǎn)業(yè)勃發(fā)

點(diǎn)擊詳細
桐梓風(fēng)水：快樂(lè )籃球賽健康向未來(lái)

點(diǎn)擊詳細
“微手術(shù)”避免“通天口” 青濱附院實(shí)現一次手術(shù)治療兩種疾病

點(diǎn)擊詳細

熱詞榜

編輯推薦

精彩圖集

專(zhuān)題策劃

【天天熱聞】長(cháng)江有色：16日鎳價(jià)小漲宏觀(guān)利好提振但現貨交投氛圍偏淡

信用中國

信用信息
行政許可和行政處罰
網(wǎng)站文章

瀏覽排行

久爱免费观看在线精品_亚洲综合一区二区三区_最新国产国模无码视频在线_中文字幕无码精品亚洲资源网久久

<strong id="ctjbx"></strong>

<ruby id="ctjbx"></ruby>