21世紀經(jīng)濟報道記者 張賽男 南京報道
ChatGPT帶火算力產(chǎn)業(yè)鏈,當市場(chǎng)還在熱議算力的商業(yè)化應用將在哪個(gè)行業(yè)率先落地時(shí),鮮為人知的是,高校早已開(kāi)啟了一場(chǎng)“算力革命”,賦能前沿學(xué)科的研究。
(資料圖)
據記者不完全統計,上海交通大學(xué)、清華大學(xué)、中南大學(xué)、南京大學(xué),北京大學(xué)、江蘇大學(xué)、南方科技大學(xué)、廈門(mén)大學(xué)、青海大學(xué)等都已建設自己的算力中心。
近日,21世紀經(jīng)濟報道記者走進(jìn)南京大學(xué)高性能計算中心看到:一個(gè)個(gè)指示燈閃爍不停,機房?jì)任宋俗黜?,數十個(gè)機柜緊密排列,上千臺服務(wù)器正在高效運轉。這座“超級大腦”正在為南大師生提供高效可靠的高性能計算資源和服務(wù)。
(圖為南京大學(xué)高性能計算中心內部)
早在2000年,南大就建設了第一臺高性能計算機,隨后進(jìn)行了多次增建。2010年,高性能計算中心正式成立。但隨著(zhù)科技飛速發(fā)展,學(xué)校師生對高性能計算的需求日益增長(cháng),南京大學(xué)的計算資源缺口依然很大,2019年-2022年中心擴容速度明顯加快。
高校作為基礎研究的主陣地,正扛起推進(jìn)AI研發(fā)和應用的大旗,如何構建AI所需的超高算力并加速科研成果轉化早已提上日程。高性能計算中心,儼然成為高??蒲械臉伺?,悄然引領(lǐng)著(zhù)潮水的方向。
科研創(chuàng )新基座
在政策支持下,近年來(lái)從國家到地方、再到企業(yè)都在布局數據中心集群,高校為什么還要建自己的計算中心?
這就不得不談科研所面臨的現實(shí)問(wèn)題?!霸谑褂闷渌阒行牡倪^(guò)程中,面臨著(zhù)數據存取的困難。我們的老師都在學(xué)校里搞科研,最方便的自然是把數據計算完后拿到自己那里分析、處理。如果在遠端計算,要處理的數據量特別大,正常的網(wǎng)絡(luò )傳輸都要七、八天,如果是這樣的傳輸效率,可能我們的數據還沒(méi)傳到,其他科研組的計算結果就算出來(lái)了,你的科研工作就永遠比人家慢了一拍?!蹦暇┐髮W(xué)高性能計算中心高級工程師盛樂(lè )標博士對21世紀經(jīng)濟報道記者表示。
2010年,南京大學(xué)高性能中心應運而生,是國內高校中較早成立的超算中心,旨在為全校各理工科院系的教師和學(xué)生提供高性能計算服務(wù)。發(fā)展至今,南京大學(xué)高性能計算中心已成為國內頂尖高校高性能計算中心之一,全系統共有33280個(gè)CPU核,理論浮點(diǎn)運算峰值1500萬(wàn)億次/秒。
目前,高性能計算在南大科研中應用于多個(gè)領(lǐng)域,包括數據驅動(dòng)磁流體力學(xué)模擬、量子力學(xué)與分子力學(xué)的混合計算、生物大分子全原子動(dòng)力學(xué)模擬、系統仿真、新材料設計、中大尺度氣象模式模擬、新冠病毒相關(guān)研究等。
“高性能計算平臺在助力學(xué)校學(xué)科發(fā)展中,發(fā)揮了不可替代的重要作用?!蹦暇┐髮W(xué)高性能計算中心副主任周慶林表示,“僅2019至2021三年,高性能計算中心超算平臺就支持了超百篇卓越學(xué)科論文的發(fā)表,并支撐學(xué)校教師承擔三十多項國家重大科研項目?!?/p>
以高性能計算典型應用場(chǎng)景——行星物理環(huán)境模擬為例,受限于客觀(guān)條件,對行星內部環(huán)境和物質(zhì)的實(shí)驗觀(guān)測、研究挑戰巨大,有必要采用理論模擬計算。依托南京大學(xué)高性能計算中心的高性能算力,物理學(xué)院師生研究了行星內部高壓下的新材料,且大幅提高了研究效率,目前相關(guān)成果已在Nature、Physics、PRX、NSR等國際一流學(xué)術(shù)刊物發(fā)表。
地質(zhì)探測也是高性能計算的典型應用場(chǎng)景,中國石油集團東方地球物理公司數據中心原總工程師賴(lài)能和表示:“高性能計算與AI技術(shù)結合大幅提升了油氣勘探效率,同時(shí)企業(yè)與高校的合作,進(jìn)一步促進(jìn)了產(chǎn)學(xué)研用融合發(fā)展?!?/p>
“各個(gè)學(xué)科其實(shí)是類(lèi)似的,計算資源越大,所能研究的科學(xué)問(wèn)題就更多、可以做得更好。比如以前測試的精度是一公里,通過(guò)高性能計算能把精度做到10米;以前研究的維度是分子層次,現在能研究細胞層次,這些都是算力帶來(lái)的?!笔?lè )標對21世紀經(jīng)濟報道記者說(shuō)。
出于上述種種原因,算力中心建設在高校如火如荼。2021年,上海交通大學(xué)也啟用了高性能計算機群——“思源一號”,一度在該領(lǐng)域搶盡風(fēng)頭。其總計算力達到6000萬(wàn)億次/秒(雙精度),在中國高校高性能計算排名第一,算力超過(guò)哈佛、劍橋等國際名校。自2013年以來(lái),“思源一號”累計服務(wù)一級學(xué)科30多個(gè),支撐用戶(hù)發(fā)表高水平論文600多篇(其中CNS及其子刊47篇),為10多個(gè)學(xué)科提供了學(xué)科融合的計算服務(wù)。
軟硬件儲備和機遇
高性能計算中心(HPC,高性能計算)在高校如雨后春筍般興起,背后是軟硬件基礎設施建設的完善。從產(chǎn)業(yè)鏈角度看,HPC涉及的資源有算力芯片(GPU/CPU)、ICT整機設備領(lǐng)域(交換機、路由器、服務(wù)器、安全設備、WLAN等)、基礎電信運營(yíng)、存儲、液冷、云計算及系統集成等。
市場(chǎng)人士認為,長(cháng)期來(lái)看,以ChatGPT為代表的AI應用正快速發(fā)展,而軟端的迭代離不開(kāi)硬件基礎設備的保障,AI數據中心內部的各類(lèi)的硬件基礎設施環(huán)節有望充分受益。
近年來(lái),無(wú)論是高校還是企業(yè),都對高性能計算的需求不斷增加,其產(chǎn)業(yè)鏈的自主可控也越發(fā)受到關(guān)注。
“目前我國高性能計算發(fā)展取得了非常好的成績(jì),中國TOP100高性能計算機平均能力比全球TOP500高出30%,其中自主研發(fā)的集群占95%,100臺集群中有42臺由聯(lián)想制造,中國高性能計算已經(jīng)進(jìn)入全球第一梯隊?!?賴(lài)能和介紹稱(chēng)。前述提到的包括南京大學(xué)在內多個(gè)高校的高性能計算中心就由聯(lián)想幫助完成建設。
“在建造高性能計算系統的時(shí)候,聯(lián)想一直秉承開(kāi)放融合的態(tài)度,不僅支持傳統的X86架構,還完成了對飛騰、海光等國產(chǎn)生態(tài)的支持?!?聯(lián)想高性能計算和人工智能主任技術(shù)顧問(wèn)郝常杰介紹說(shuō),聯(lián)想目前已經(jīng)具備了支持兩條高性能計算產(chǎn)品線(xiàn)和解決方案的能力。
回顧起搭建校級平臺的過(guò)程,郝常杰有諸多感慨:“會(huì )有些眾口難調,高校有不同的需求,比如希望能夠增加不同的配置,是用內存更大的、內存中等的還是夠用的?還有加速的節點(diǎn)、用幾路CPU去支撐各個(gè)學(xué)科的研究?我們一直在思考,怎樣在高校建一個(gè)綜合平臺去滿(mǎn)足各個(gè)學(xué)科不同的需求?!?/p>
在這個(gè)過(guò)程中,聯(lián)想摸出了一些經(jīng)驗?!拔覀儠?huì )關(guān)注整個(gè)系統架構的情況,比如要使用高帶寬、低延遲、高速的網(wǎng)絡(luò ),在計算的部分我們要有普通的CPU計算節點(diǎn)、GPU的加速節點(diǎn),或者增加人工智能的研究、登錄管理以及存儲系統等?!焙鲁=苷f(shuō)。
而隨著(zhù)新興技術(shù)的不斷涌現,高性能計算也面臨著(zhù)新的機遇和挑戰。中科院計算技術(shù)研究所、高通量計算機研究中心、處理器芯片重點(diǎn)實(shí)驗室高級工程師李明宇指出:“AI與算力網(wǎng)絡(luò )的發(fā)展給高性能計算帶來(lái)新的挑戰,比如各種模型、算法、開(kāi)源項目快速發(fā)展,第三方庫更新頻繁,相互依賴(lài)關(guān)系復雜;算力需求和供給快速增長(cháng),跨站點(diǎn)算力調度需求大幅增長(cháng),環(huán)境配置和管理的復雜度與工作量也大大提升?!?/p>
“現在A(yíng)I for science有了一些新的突破,無(wú)論是科研還是其他行業(yè)都會(huì )有很多機會(huì )?!崩蠲饔顚τ浾弑硎?,“從科研角度來(lái)說(shuō),一個(gè)最直接的變化就是,以前科研遇到的問(wèn)題不太能解決了,但換AI以后可能就解決了,這對于搞科研的人來(lái)說(shuō)非常值得嘗試。一旦嘗試就需要算力,這個(gè)需求就產(chǎn)生了,而這個(gè)量可能比以前更大?!?/p>
更多內容請下載21財經(jīng)APP
責任編輯:
標簽: