<strong id="ctjbx"></strong>

<ruby id="ctjbx"></ruby>

您現在的位置：首頁(yè) >
民生 >
正文

學(xué)而思被指“偷數據”訓練AI，牽出大模型“隱秘的角落” 天天熱消息

來(lái)源：21世紀經(jīng)濟報道時(shí)間：2023-06-16 18:04:28

南方財經(jīng)全媒體見(jiàn)習記者馬嘉璐 21世紀經(jīng)濟報道記者尤一煒廣州報道

近日，筆神作文指控昔日合作伙伴學(xué)而思“偷數據”訓練自家AI產(chǎn)品，隨后學(xué)而思對此公開(kāi)予以否認。筆神作文稱(chēng)之為國內“AI大模型數據被盜第一案”。不過(guò)，有律師分析，從現有內容來(lái)看，該案應屬于普通的數據侵權糾紛或協(xié)議糾紛，目前還不能判斷學(xué)而思是否違法。

筆神作文與學(xué)而思的糾紛，牽引出大模型的一個(gè)“隱秘的角落”：用于訓練AI大模型的數據，來(lái)源是否合法合規？事實(shí)上，關(guān)于大模型數據集的紛爭已在海內外頻頻上演。

(資料圖)

監管方面正在注意AI大模型訓練數據集的合法合規。國家網(wǎng)信辦于今年4月公布的《生成式人工智能服務(wù)管理辦法（征求意見(jiàn)稿）》明確，預訓練、優(yōu)化訓練數據應保證真實(shí)性、準確性、客觀(guān)性、多樣性，不含有侵犯知識產(chǎn)權的內容，包含個(gè)人信息的應符合“告知-同意”等原則。對外經(jīng)濟貿易大學(xué)數字經(jīng)濟與法律創(chuàng )新研究中心執行主任張欣認為，平衡安全和發(fā)展成為大模型數據集監管的重要挑戰，數據安全審計制度等可以為此提供借鑒。

或為國內“AI大模型數據被盜第一案”

筆神作文與學(xué)而思關(guān)于是否“偷數據”在互聯(lián)網(wǎng)公開(kāi)“喊話(huà)”，已進(jìn)行了一個(gè)半回合。

筆神作文將之稱(chēng)為“AI大模型數據被盜第一案”。6月13日下午，筆神作文通過(guò)自己的微信公眾號、微博和第三方媒體發(fā)布消息，指控其合作伙伴學(xué)而思未經(jīng)授權爬取了筆神作文的數據，用于訓練大模型產(chǎn)品。同日17時(shí)，學(xué)而思官方公眾號對此事作出回應，表示自己對筆神作文數據的使用屬于雙方合同約定的正常合作范圍，筆神作文“主觀(guān)揣測”“與事實(shí)嚴重不符”。

14日19時(shí)，筆神作文再次通過(guò)微信公眾號列舉更多“證據”，力圖證明學(xué)而思在4月13日至17日，通過(guò)“爬蟲(chóng)”技術(shù)非法訪(fǎng)問(wèn)、緩存筆神作文App服務(wù)器數據258萬(wàn)次。

“筆神作文APP”微信公眾號公布的雙方合作API接口“每日數據調用量折線(xiàn)圖”

面對筆神作文的再次“喊話(huà)”，學(xué)而思是否有新的回應？截至發(fā)稿前，學(xué)而思與筆神作文方面均未針對此事向南方財經(jīng)全媒體記者給出相關(guān)回應。

在13日的聲明中，學(xué)而思透露雙方合作的內容：筆神作文為學(xué)而思提供“筆神作文范文素材服務(wù)接口”，用于學(xué)而思相關(guān)服務(wù)中，每月保底費用包含的調用次數為百萬(wàn)次量級。筆神作文則在14日發(fā)布的消息中稱(chēng)，雙方合同明確“甲方（注：三體云聯(lián)公司，為學(xué)而思關(guān)聯(lián)公司）不得在未經(jīng)乙方（注：一筆兩劃公司，“筆神作文”系該司旗下品牌）允許的情況下用于任何其他用途，包括緩存，存儲，作為語(yǔ)料進(jìn)行計算，訓練等?！?/p>

筆神作文表示，將通過(guò)司法程序解決糾紛，要求“學(xué)而思”支付1元賠償金，公開(kāi)道歉，并刪除已爬取的數據。

律師：現有內容難以判斷學(xué)而思違法

“‘AI大模型數據被盜第一案’有些噱頭的成分?！北本┦懈偺旃\律師事務(wù)所合伙人周楊認為，本案爭議的焦點(diǎn)是用于訓練AI大模型的數據，而并非AI大模型的算法，應屬于普通的數據侵權糾紛或協(xié)議糾紛。

海問(wèn)律師事務(wù)所合伙人楊建媛分析，該事件可以從知識產(chǎn)權保護和反不正當競爭兩個(gè)角度來(lái)看。從知識產(chǎn)權保護角度，如果筆神作文對學(xué)而思獲取的內容享有著(zhù)作權，且學(xué)而思的行為不符合著(zhù)作權法規定的“可以不經(jīng)著(zhù)作權人許可”的“例外”情況，則學(xué)而思的行為需經(jīng)過(guò)筆神作文的許可。她還強調，如筆神作文所稱(chēng)為事實(shí)，學(xué)而思對筆神作文數據的使用可能超出了“合理使用”的范疇。

從反不正當競爭角度，學(xué)而思是否存在未經(jīng)授權爬取筆神作文數據的情況、是否利用所獲數據開(kāi)發(fā)實(shí)質(zhì)性替代筆神作文的產(chǎn)品或服務(wù)，是判斷是否構成侵權的關(guān)鍵。楊建媛分析，從筆神作文的敘述來(lái)看，其可能并未對學(xué)而思設置反爬措施，但是在協(xié)議中約定了相關(guān)禁止行為。單純的違約行為較難直接認定為違反了反不正當競爭法下的商業(yè)道德要求。另外，學(xué)而思將數據用于大模型訓練，訓練出來(lái)的產(chǎn)品與筆神作文的產(chǎn)品是否存在競爭關(guān)系，是否會(huì )對筆神作文造成不良后果，還存在爭議。

周楊也表示，學(xué)而思是否違法，關(guān)鍵要看合同中對數據的獲取、處理和使用是如何約定的，以及筆神作文是否對作品、數據庫享有版權。根據現有雙方披露的內容，“還不能判斷”。

數據來(lái)源是否合規牽出“隱秘的角落”

筆神作文與學(xué)而思的糾紛，牽引出大模型的一個(gè)“隱秘的角落”：訓練AI大模型通常需要海量的數據，而這些數據的來(lái)源是否合法合規？

事實(shí)上，隨著(zhù)ChatGPT帶動(dòng)生成式AI的爆火，關(guān)于A(yíng)I大模型訓練數據的紛爭在海內外頻頻上演。

爭議所涉及的數據可以大致分為兩類(lèi)：一類(lèi)有著(zhù)明確的知識產(chǎn)權，如原創(chuàng )的圖片、音樂(lè )、視頻、文章等；一類(lèi)由用戶(hù)在平臺上的零散發(fā)言匯集而成，如百科、社區、貼吧等。

今年年初，Stability AI受到美國大型商業(yè)圖庫提供商Getty Images以及漫畫(huà)家的分別起訴，原因是他們認為Stability AI用于訓練AI圖像生成模型Stable Diffusion的數據“非法復制和處理了受版權保護的圖像”。

此外，推特、“美版貼吧”Reddit也在今年上半年相繼宣布對API接口收費，且價(jià)格不菲。此前，這些平臺的內容可以被谷歌、openAI等公司免費爬取，用作大語(yǔ)言模型的訓練庫。推特CEO馬斯克稱(chēng)“他們（微軟）非法利用推特的數據來(lái)訓練，是時(shí)候起訴他們了?！盧eddit則在其官網(wǎng)更新條款：“未經(jīng)Reddit明確同意，您不得將Reddit上的內容用作任何模型訓練的輸入。未經(jīng)明確批準，禁止將任何使用Reddit數據訓練的模型用于商業(yè)用途?！?/p>

谷歌C4數據集支撐了多個(gè)AI模型的預訓練。今年4月，《華盛頓郵報》與艾倫人工智能研究院合作調查發(fā)現，該數據集中存在只接受付費訂閱的網(wǎng)站，以及近30個(gè)被美國政府認定為盜版和假冒產(chǎn)品市場(chǎng)的網(wǎng)站。

平衡安全與發(fā)展成監管挑戰

監管方面正在注意AI大模型訓練數據集的情況。

當地時(shí)間2023年6月14日，歐洲議會(huì )投票通過(guò)關(guān)于《人工智能法案》的談判授權草案，意味著(zhù)該法案將進(jìn)入歐盟啟動(dòng)監管前的最后階段。該法案要求OpenAI、谷歌和微軟等基礎模型的供應商需要公開(kāi)，他們在訓練模型過(guò)程中，是否使用了受版權保護的數據。

此前，國家網(wǎng)信辦于今年4月公布的《生成式人工智能服務(wù)管理辦法（征求意見(jiàn)稿）》也明確，用于生成式人工智能產(chǎn)品的預訓練、優(yōu)化訓練數據，應符合網(wǎng)安法等法律法規的要求，不含有侵犯知識產(chǎn)權的內容，包含個(gè)人信息的應符合“告知-同意”原則等要求，還應保證數據的真實(shí)性、準確性、客觀(guān)性、多樣性。

“對大模型數據集的監管，如何能做到安全和發(fā)展的平衡，是一個(gè)重要挑戰?！睂ν饨?jīng)濟貿易大學(xué)數字經(jīng)濟與法律創(chuàng )新研究中心執行主任張欣表示，《生成式人工智能服務(wù)管理辦法（征求意見(jiàn)稿）》已對AI訓練數據集的合規要求搭建了清晰的框架，在運用著(zhù)作權和知識產(chǎn)權方式之外，還可以探索使用多種法律手段去實(shí)現。

張欣分析，監管的落地，還存在事后難追溯等問(wèn)題，尤其在算法復雜度日益攀升、出現“算法黑箱”等情況下，如果從事后去還原和追溯數據集是否合規，十分依賴(lài)大模型開(kāi)發(fā)商提供數據處理記錄和日志，很難從外部進(jìn)行確認。此外，從技術(shù)上來(lái)說(shuō)大模型很難精確刪除某個(gè)用戶(hù)的個(gè)人信息，這就限制了個(gè)人信息保護中“刪除權”的行使。

歐盟《人工智能法案》草案設置了吹哨人制度，鼓勵專(zhuān)業(yè)人士從內部進(jìn)行監督，為監管提供了一種創(chuàng )新思路。張欣認為，大模型開(kāi)發(fā)者應做好信息記錄和披露的工作，提高數據集的透明度，在算法解釋性遇到困難的時(shí)候，至少可以通過(guò)數據的透明和可解釋來(lái)尋找答案。數據安全審計制度在國際上也有較為通行的經(jīng)驗，大模型數據監管也可以探索使用審計的方式，找到透明度與保護商業(yè)秘密之間的平衡。

標簽：

責任編輯：FD31

上一篇：老賴(lài)對幾代人有影響環(huán)球今日訊

下一篇：最后一頁(yè)

精彩圖集(熱圖)

熱點(diǎn)圖集

環(huán)球報道:田洪川：融合創(chuàng )新加速工業(yè)互聯(lián)網(wǎng)規?；l(fā)展

點(diǎn)擊詳細
備受鼓舞丨拉塞特受邀參加全國現代設施農業(yè)建設推進(jìn)會(huì )

點(diǎn)擊詳細
今日聚焦!聯(lián)想小新Pro 2023酷睿版618狂歡降價(jià)700

點(diǎn)擊詳細
國內首個(gè) 北京亦莊智能制造領(lǐng)域再突破

點(diǎn)擊詳細
河南博愛(ài)：“空心村”變身“美家園”

點(diǎn)擊詳細
商場(chǎng)中心開(kāi)業(yè)美陳設計如何進(jìn)行？肆墨設計

點(diǎn)擊詳細
最后期限逼近，中方拖船現身，沒(méi)有退路的小馬科斯，打起了感情牌|當前速看

點(diǎn)擊詳細
陜西省部署強化散煤生產(chǎn)加工儲運銷(xiāo)售使用環(huán)節監管

點(diǎn)擊詳細
下半年投資機會(huì )在哪？多位明星基金經(jīng)理最新發(fā)聲！天天熱議

點(diǎn)擊詳細
學(xué)而思被指“偷數據”訓練AI，牽出大模型“隱秘的角落” 天天熱消息

點(diǎn)擊詳細
讓青少年陽(yáng)光“沖浪”！上海公安網(wǎng)安部門(mén)推出四項舉措

點(diǎn)擊詳細
寶通科技:公司代理發(fā)行《白荊回廊》韓國地區版本世界新動(dòng)態(tài)

點(diǎn)擊詳細
老賴(lài)對幾代人有影響環(huán)球今日訊

點(diǎn)擊詳細
fps是什么意思（fps幀數越高越好嗎）-環(huán)球動(dòng)態(tài)

點(diǎn)擊詳細
電源模塊的穩定運行，離不開(kāi)導熱結構膠的幫助

點(diǎn)擊詳細
關(guān)公的大刀多重相當于現在多重_關(guān)公大刀多少斤

點(diǎn)擊詳細
百濟神州凌晨回應：澤布替尼研發(fā)是原創(chuàng )性的股價(jià)開(kāi)市回彈_環(huán)球報道

點(diǎn)擊詳細
環(huán)球熱門(mén):歐委會(huì )稱(chēng)將不再采購華為中興設備外交部：有罪推定、堅決反對

點(diǎn)擊詳細

最近更新

學(xué)而思被指“偷數據”訓練AI，牽出大模型“隱秘的角落” 天天熱消息

點(diǎn)擊詳細
正月不能剪頭發(fā)嗎（正月不能剪頭發(fā)嗎是迷信嗎）-當前速讀

點(diǎn)擊詳細
蔚來(lái)ET5衍生車(chē)型ET5 touring 正式打入旅游車(chē)市場(chǎng)，售價(jià)29.8-35.6萬(wàn)_環(huán)球簡(jiǎn)訊

點(diǎn)擊詳細
這些商品，不得以盲盒形式銷(xiāo)售！市場(chǎng)監管總局發(fā)話(huà)→

點(diǎn)擊詳細
硬核科技論｜別被洗腦雙電機有時(shí)候并非你所想_全球速遞

點(diǎn)擊詳細
今日聚焦!聯(lián)想小新Pro 2023酷睿版618狂歡降價(jià)700

點(diǎn)擊詳細
讓青少年陽(yáng)光“沖浪”！上海公安網(wǎng)安部門(mén)推出四項舉措

點(diǎn)擊詳細
商場(chǎng)中心開(kāi)業(yè)美陳設計如何進(jìn)行？肆墨設計

點(diǎn)擊詳細
起跑助力向新加速科創(chuàng )企業(yè)上市培育發(fā)展論壇順利舉行

點(diǎn)擊詳細
顧客就餐遇賬單刺客8碗米飯要價(jià)90 餐廳反駁：為了拍段子博取流量

點(diǎn)擊詳細
可可愛(ài)愛(ài)，Fiat Topolino

點(diǎn)擊詳細
天天新資訊：助力宣傳零碳未來(lái)，財華社斬獲“第二屆國際綠色零碳節”兩項殊榮

點(diǎn)擊詳細
世界球精選！富信科技漲20.00%

點(diǎn)擊詳細
西延高鐵馬坊隧道及北村隧道相繼貫通|每日觀(guān)察

點(diǎn)擊詳細
五部門(mén)：積極支持符合條件的國家種業(yè)陣型企業(yè)、農業(yè)科技創(chuàng )新企業(yè)上市、掛牌融資和再融資世界熱推薦

點(diǎn)擊詳細
多地網(wǎng)約車(chē)新增按下“暫停鍵”，靈活就業(yè)者還能入場(chǎng)嗎？

點(diǎn)擊詳細
簡(jiǎn)訊：適馬 14mm F1.4 DG DN｜Art 鏡頭國行價(jià)格公布：9797 元

點(diǎn)擊詳細
世界頭條：16日晚《奔跑吧11》延吉篇開(kāi)播看兄弟團在延吉默契開(kāi)玩！

點(diǎn)擊詳細
國防部：加方在涉華問(wèn)題上應謹言慎行

點(diǎn)擊詳細
人事任命 | 通快光電器件新一任執行總裁|世界信息

點(diǎn)擊詳細
國內首個(gè) 北京亦莊智能制造領(lǐng)域再突破

點(diǎn)擊詳細
備受鼓舞丨拉塞特受邀參加全國現代設施農業(yè)建設推進(jìn)會(huì )

點(diǎn)擊詳細
陳功偉（陳功藝術(shù)家）全球速遞

點(diǎn)擊詳細
富士康如果不“跑路”，還有什么選擇？|世界熱訊

點(diǎn)擊詳細
激光雷達:技術(shù)概述-漫反射目標在測試和校準高級駕駛輔助系統 (ADAS) 中的作用_每日快播

點(diǎn)擊詳細
為啥在江西看病醫藥費越來(lái)越低？答案來(lái)了！|速讀

點(diǎn)擊詳細
河南博愛(ài)：“空心村”變身“美家園”

點(diǎn)擊詳細
構建職業(yè)教育與產(chǎn)業(yè)發(fā)展相融互促的良好格局天天報道

點(diǎn)擊詳細
生物谷回復年報問(wèn)詢(xún)函，內容涉及多個(gè)問(wèn)題回復-天天時(shí)快訊

點(diǎn)擊詳細
“鳥(niǎo)中大熊貓”白頸長(cháng)尾雉現身邵陽(yáng)縣河伯嶺國有林場(chǎng)

點(diǎn)擊詳細

熱詞榜

編輯推薦

精彩圖集

專(zhuān)題策劃

2023年二級建造師多少分及格-今日訊

信用中國

信用信息
行政許可和行政處罰
網(wǎng)站文章

瀏覽排行

久爱免费观看在线精品_亚洲综合一区二区三区_最新国产国模无码视频在线_中文字幕无码精品亚洲资源网久久

<strong id="ctjbx"></strong>

<ruby id="ctjbx"></ruby>