<strong id="ctjbx"></strong>

  1. <strong id="ctjbx"></strong>
    <ruby id="ctjbx"></ruby>

    全球熱推薦:大模型時(shí)代的三道鴻溝:數據、成本與想象力

    來(lái)源:投資界時(shí)間:2023-06-17 09:34:09

    To B or not to B?這是 AI 大模型的「哈姆雷特之問(wèn)」。

    跨入2023年,大模型興起、諸多公司「跑步進(jìn)場(chǎng)」的頭幾個(gè)月,大模型一邊倒向 C 端類(lèi) ChatGPT 的研發(fā),對成本、效率更敏感的企業(yè)客戶(hù)似乎不在關(guān)注焦點(diǎn)。

    然而近兩個(gè)月,情況發(fā)生了變化?;卺t療、金融、教育等垂直行業(yè)的大模型開(kāi)始出現。而已經(jīng)發(fā)布通用大模型的公司,也在針對行業(yè)推出模型服務(wù)。


    (資料圖片僅供參考)

    這將給大模型的市場(chǎng)發(fā)展帶來(lái)什么變化?

    01MaaS的疑問(wèn)

    隨著(zhù)「大模型是AI時(shí)代的基礎設施」的提法深入人心,MaaS(Model as a Service,模型即服務(wù))的概念逐漸廣為人知。簡(jiǎn)單來(lái)說(shuō),用戶(hù)可以直接在云端調用、開(kāi)發(fā)與部署模型,而無(wú)需投資構建和維護自己的模型所需的基礎設施、硬件和專(zhuān)業(yè)知識。

    但從「用家」的角度來(lái)看,這一模式還有疑問(wèn)。

    現任某知名智能家居品牌 CTO 的陳平告訴雷峰網(wǎng),他們的智能產(chǎn)品銷(xiāo)往全球各地,對大模型有突出需求,就是想用大模型來(lái)提升多國語(yǔ)言識別與處理的能力。以前的語(yǔ)音識別做不到「一模通用」,而是要根據不同的國家設計不同的方案,但 ChatGPT 出來(lái)后,他們調用 API 調試,發(fā)現大模型能有效地解決這個(gè)問(wèn)題。

    在海外,該品牌與亞馬遜進(jìn)行合作。他們的產(chǎn)品本身就需要通過(guò)亞馬遜的平臺在海外銷(xiāo)售,亞馬遜自己做的 Echo 音箱也賣(mài)到海外很多個(gè)國家,驗證了亞馬遜語(yǔ)音識別技術(shù)的成熟度。盡管亞馬遜的效率成本比較高,但能夠較好地滿(mǎn)足他們的需求。

    但在國內,他們還不知道該用哪一家的模型:目前國內已發(fā)布的大模型數量太多,如果他們要將所有的模型都驗證一遍、一一對比模型的效果,那么所消耗的人力成本會(huì )非常大。

    國內模型能力的「賣(mài)方」可分為兩類(lèi):一類(lèi)是BAT等大廠(chǎng)和大模型初創(chuàng )公司(如智譜、MiniMax)為主;此外還有大模型的「中間商」,主要是基于大模型開(kāi)發(fā)應用型服務(wù)的創(chuàng )始團隊,包括底層算力與框架的提供者,甚至還包括提供大模型微調的第三方公司。

    陳平的想法,反映了部分B端大客戶(hù)的需求,他們希望有一個(gè)專(zhuān)屬于自身行業(yè)的大模型,這正好介于兩類(lèi)賣(mài)方所提供的產(chǎn)品與服務(wù)之間。

    一位大廠(chǎng)工程師在與雷峰網(wǎng)的交談中,將市場(chǎng)需求分為金字塔的底層、中層與上層:

    底層是通用大模型,如 ChatGPT。據不完全統計,過(guò)去三個(gè)月里,國內發(fā)布了超過(guò) 70 個(gè) To C 通用大模型產(chǎn)品,如百度的文心一言、阿里的通義千問(wèn)、科大訊飛的星火等等。

    中層是行業(yè)大模型,如彭博發(fā)布的金融大模型 Bloomberg GPT,這類(lèi)大模型或是與底層想做大模型基礎設施的通用大模型廠(chǎng)商合作定制,或直接調用 API 接口,或大廠(chǎng)云廠(chǎng)商自研。

    上層是一系列應用型服務(wù),基于通用大模型或行業(yè)大模型開(kāi)發(fā) AI 工具,如構建一個(gè)專(zhuān)注于論文解讀(含翻譯、摘要總結、生成等等)的學(xué)術(shù)平臺。

    從數據安全的角度看,陳平更青睞與大廠(chǎng)合作,因為第三方公司雖然懂得訓練大模型,但不懂智能家居的知識,他們依然要提供大量的數據給對方訓練,而數據提供過(guò)去后,他們一是無(wú)法保障模型的能力得到延展,二是無(wú)法避免第三方公司將這些數據與對應的模型賣(mài)給陳平所在品牌的競爭對手。

    當理論落地現實(shí),陳平的困境也是許多 B 端企業(yè)的共同難題。

    02重回焦點(diǎn)

    過(guò)去三個(gè)月,國內大模型產(chǎn)品設計一味追隨 ChatGPT,將問(wèn)題的定義交給用戶(hù)自由發(fā)揮(俗稱(chēng)「AI 召喚師」),造成了嚴重的同質(zhì)化,大模型的應用局限于文本生成、代碼生成等通識屬性強的場(chǎng)景上,滿(mǎn)足用戶(hù)社交、娛樂(lè )或創(chuàng )作的需求。

    更接近生產(chǎn),對于成本效率要求更高的產(chǎn)業(yè)市場(chǎng),并未被過(guò)多提及。

    今年 5 月份,陳平曾經(jīng)嘗試聯(lián)系一家大廠(chǎng)的大模型團隊,希望探討大模型落地方案,得到的回復是優(yōu)先級不在智能家居行業(yè)。

    但眼下,大廠(chǎng)和創(chuàng )業(yè)公司們正在將眼光重新聚焦于產(chǎn)業(yè)。

    之前,國內類(lèi) ChatGPT 的大模型產(chǎn)品都無(wú)一例外地側重「對話(huà)交互型」,而非「知識增強型」,大多數 C 端用戶(hù)與 AI 的對話(huà)內容趨向于「Chat」(閑聊)而非「GPT」(生成/創(chuàng )造)。但另一方面,C 端用戶(hù)的付費意愿低,To C 的通用大模型產(chǎn)品短期內無(wú)法復制 ChatGPT 的成功模式,在同質(zhì)化產(chǎn)品的圍攻下被迫加入資源競賽的燒錢(qián)游戲?;剡^(guò)頭看,To B 客戶(hù)付費意愿高。隨著(zhù)市場(chǎng)回歸理性,大模型選擇 To B 幾乎成為行業(yè)內心照不宣的一個(gè)范式。

    有報告指出,B端的Mass服務(wù)需要針對行業(yè)領(lǐng)域和業(yè)務(wù)場(chǎng)景進(jìn)行大量工程工作,但B/G端客戶(hù)付費能力更強,未來(lái)盈利空間以及成長(cháng)空間廣闊。

    但To B客戶(hù)的需求也更「強勢」,一不小心走歪,很可能回到上一代 AI 模型定制化的老路。

    例如,市面上已經(jīng)出現了一些專(zhuān)門(mén)提供模型精調服務(wù)的第三方公司。

    雷峰網(wǎng)了解到,這類(lèi)第三方公司采用一次性開(kāi)發(fā)+訂閱的收費模式,如初始研發(fā)費用 100 萬(wàn)、再加上終身授權許可的設備費用(8塊錢(qián)一個(gè)),幫助 B 端客戶(hù)根據需求訓練出滿(mǎn)足它們行業(yè)需求的大模型,然后在客戶(hù)的平臺上進(jìn)行私有化部署。因為在市面上暫時(shí)找不到合適的標化產(chǎn)品,這類(lèi)公司受到了沒(méi)有自主研發(fā)團隊、同時(shí)又渴求大模型能力的B 端企業(yè)客戶(hù)(區別于大 B)的青睞。

    03兩個(gè)盲區

    雷峰網(wǎng)也關(guān)注到,越來(lái)越多大模型的研發(fā)團隊準備彎道超車(chē),繞過(guò)激烈的C端市場(chǎng),專(zhuān)注研究面向行業(yè)的大模型,如王小川建立的百川智能就剛剛推出了一個(gè)參數規模 7B的開(kāi)源商用模型。

    騰訊也計劃在 6 月 19 日發(fā)布行業(yè)大模型及商用訓練平臺。在此前4月,騰訊發(fā)布了的面向大模型訓練的新一代HCC高性能計算集群,整體性能比過(guò)去提升了3倍,并通過(guò)騰訊云MaaS面向企業(yè)輸出模型訓練相關(guān)服務(wù)。

    看起來(lái),騰訊沒(méi)有急于推出聊天助手產(chǎn)品,而是選擇了通用大模型、行業(yè)大模型兩條腿走路,進(jìn)一步對外釋放行業(yè)大模型服務(wù)能力。在剛剛結束的中關(guān)村論壇上表示,李彥宏提出未來(lái)每一個(gè)行業(yè)都會(huì )有屬于自己的大模型。大模型會(huì )深度融合到實(shí)體經(jīng)濟當中去,賦能千行百業(yè),助力中國經(jīng)濟開(kāi)創(chuàng )下一個(gè)黃金30年。阿里公布的模型即服務(wù)三層架構中,也涵蓋了企業(yè)專(zhuān)屬大模型。

    可以看出,企業(yè)客戶(hù)對大模型落地很迫切,各類(lèi)廠(chǎng)商與創(chuàng )業(yè)者也在追趕需求。

    事實(shí)上,B 端企業(yè)客戶(hù)往往自帶場(chǎng)景與數據,是大模型落地的*檢驗場(chǎng)。那么,在大模型的落地上,企業(yè)客戶(hù)最關(guān)心什么?

    據雷峰網(wǎng)調研,大模型在企業(yè)落地有兩個(gè)盲區:一是數據安全,二是成本可控。

    數據安全包含「數據隱私」與「專(zhuān)業(yè)知識」兩塊,行業(yè)人士認為,ChatGPT 生成的答案應該由相關(guān)領(lǐng)域的專(zhuān)業(yè)人士判斷?;谕ㄓ么竽P?,目前用戶(hù)并非將專(zhuān)業(yè)知識輸入模型后就能得到專(zhuān)業(yè)的結果。此外,陳平指出,應用型的公司基本不愿意將自身微調的模型貢獻到公有版本里與其他人分享,所以企業(yè)還是傾向于訓練自己的大模型。訓練完后在本地進(jìn)行私有部署。

    行業(yè)現有的通常做法是,提供一個(gè)通用大模型,然后開(kāi)放給行業(yè)的客戶(hù)去微調,再進(jìn)行私有化部署??申惼降慕?jīng)驗是,以 Open AI 為例,雖然它們開(kāi)放了 API,但API無(wú)法私有化部署,客戶(hù)無(wú)法在最新的模型版本上微調;大模型的技術(shù)變化太快,對企業(yè)來(lái)說(shuō),跟上潮流的成本太高。

    一家企業(yè)的CTO向雷鋒網(wǎng)表示,目前大模型在企業(yè)落地的成本分兩塊:一是模型前期微調與訓練的成本,二是模型后期與業(yè)務(wù)結合的運行成本。大模型的訓練需要算力、數據與工程等幾塊體系的支持?!钙髽I(yè)要考慮訓練定制化模型的人力與時(shí)間成本,更傾向于選擇能同時(shí)提供兩種能力的廠(chǎng)商,將模型訓練與運行成本降到*?!?/p>

    一個(gè)值得警惕的點(diǎn)是:目前看來(lái),并非所有的場(chǎng)景都適合大模型落地。大模型剛火起來(lái)時(shí),一些行業(yè)與未及時(shí)推出大模型技術(shù)或產(chǎn)品的公司擔心自身業(yè)務(wù)被大模型改寫(xiě),觀(guān)望兩個(gè)月后,他們發(fā)現「自己想多了」。他們認為,原因可能有兩塊:一是缺少提出好問(wèn)題的 AI 產(chǎn)品經(jīng)理,二是大模型的技術(shù)屬性所限。找場(chǎng)景一直是技術(shù)公司的難題,同樣也是 ToB 的難題。大模型團隊尋找合適的場(chǎng)景,也是深入 To B 服務(wù)的關(guān)鍵一步。

    每個(gè)掌握大模型自研能力的公司都想做大模型時(shí)代的「基礎設施運營(yíng)商」。三個(gè)月下來(lái),行業(yè)目前只能確定,如果大模型真的是 AI 時(shí)代的智能運營(yíng)商,如水電網(wǎng)等社會(huì )基礎設施,無(wú)論現有的行業(yè)玩家再多,最終也只有少數幾家能成功。

    先發(fā)有先發(fā)制人的優(yōu)勢,后發(fā)有后來(lái)居上的可能,大模型驅動(dòng)新生產(chǎn)力的游戲還在繼續。如果大模型真的代表一個(gè)新時(shí)代,行業(yè)集體多花點(diǎn)時(shí)間進(jìn)行深入思考也無(wú)可厚非,目前看來(lái),繼續留在牌桌上就已經(jīng)是正確的一步。

    【本文由投資界合作伙伴微信公眾號:雷峰網(wǎng)授權發(fā)布,本平臺僅提供信息存儲服務(wù)?!咳缬腥魏我蓡?wèn),請聯(lián)系(editor@zero2ipo.com.cn)投資界處理。

    標簽:

    責任編輯:FD31
    上一篇:思食 全球播資訊
    下一篇:最后一頁(yè)

    精彩圖集(熱圖)

    熱點(diǎn)圖集

    最近更新

    信用中國

    • 信用信息
    • 行政許可和行政處罰
    • 網(wǎng)站文章

    久爱免费观看在线精品_亚洲综合一区二区三区_最新国产国模无码视频在线_中文字幕无码精品亚洲资源网久久

      <strong id="ctjbx"></strong>

    1. <strong id="ctjbx"></strong>
      <ruby id="ctjbx"></ruby>