中新網(wǎng)8月17日電 題:AIGC加速商業(yè)化落地,如何應對算力需求激增?
(資料圖片)
中新財經(jīng)記者 夏賓
以大模型為代表的AIGC熱潮帶來(lái)了AI算力需求的爆發(fā)式增長(cháng),AI算力已成推動(dòng)人工智能發(fā)展的關(guān)鍵要素。
“今年,在全球范圍都掀起了一場(chǎng)AI范式轉化革命,在政策和資本雙重驅動(dòng)下,AIGC在加速商業(yè)化落地,超千億參數的AIGC大模型在不斷涌現?,F在中國已經(jīng)發(fā)布了AIGC的模型數量超過(guò)了110個(gè),引發(fā)了巨量化的人工智能的算力需求?!崩顺毙畔⒎?wù)器產(chǎn)品線(xiàn)總經(jīng)理趙帥近日在參加2023年開(kāi)放計算中國社區技術(shù)峰會(huì )(OCP China Day2023)時(shí)如是說(shuō)。
計算力就是生產(chǎn)力,智算力就是創(chuàng )新力,更豐富的算力資源成為人工智能競爭的核心基石。IDC預計,全球AI計算市場(chǎng)規模將從2022年的195億美元增長(cháng)到2026年的346.6億美元,其中生成式AI計算市場(chǎng)規模將從2022年的8.2億美元增長(cháng)到2026年的109.9億美元。生成式AI計算占整體AI計算市場(chǎng)的比例將從4.2%增長(cháng)到31.7%。
解決算力需求激增是當前市場(chǎng)面臨的共同挑戰。趙帥指出,隨著(zhù)市場(chǎng)對于A(yíng)I計算力的攀升,全球有上百家公司在投入新型的AI硬件方面的研發(fā)和設計,由于各廠(chǎng)商技術(shù)路線(xiàn)不同,多個(gè)方面都在兼容性上存在問(wèn)題,導致整個(gè)AI的計算基礎設施在建設當中不得不面臨著(zhù)硬件分裂化和生態(tài)離散化的重大挑戰。
“由于專(zhuān)有的硬件系統的挑戰和設計復雜性,把他們集成到一套整機系統中,我們所需要花費的時(shí)間和費用也更多,嚴重阻礙了AI加速器的創(chuàng )新應用和開(kāi)發(fā)推廣?!壁w帥直言,大模型訓練對于算力平臺有較高要求,我們需要計算系統具備更高的計算性能,更快的卡間互連帶寬,以及更強的橫向拓展能力。
趙帥對中新財經(jīng)記者說(shuō),為了更好去支撐大模型訓練,必須要實(shí)現多機互聯(lián)的集群架構,在這個(gè)擴展過(guò)程中,系統間的通信以及整體的散熱、接口、測試等各種各樣的標準都必須更加細化。
他進(jìn)一步稱(chēng),開(kāi)放加速系統架構憑借其散熱、供電、互聯(lián)、擴展性等設計特點(diǎn),本身在設計之初可支持更高功耗、更大互聯(lián)帶寬、更強擴展能力的AI加速卡,通過(guò)支持跨節點(diǎn)的高速直連和橫向擴展,可以很快地實(shí)現萬(wàn)卡級以上的集群規模,天然就適用于超大規模神經(jīng)網(wǎng)絡(luò )的并行訓練。
同時(shí),開(kāi)放加速計算社區提供了統一的主機接口、供電方式、散熱方式、管理接口、卡間的互聯(lián)拓撲等規范,無(wú)需做任何硬件修改,就可以讓上百家AI創(chuàng )新企業(yè),更好更快地把其AI算力的相關(guān)硬件融合到AI計算服務(wù)器中去,以系統化方式呈現更好的算力,顯著(zhù)降低開(kāi)發(fā)投入。
此外,值得注意的是,數據中心可持續發(fā)展的技術(shù)方案正得到越來(lái)越多OCP社區成員與用戶(hù)的重視,可持續發(fā)展已成為一種社區共識。趙帥也認為,促進(jìn)數據中心可持續發(fā)展已經(jīng)成為必須采取的行動(dòng),從開(kāi)發(fā)環(huán)保產(chǎn)品,到使用清潔能源改善能源結構,到應用液冷技術(shù)降低碳排,乃至電子垃圾回收及再利用,可持續發(fā)展的理念應貫徹數據中心生命周期的始終。(完)
標簽: