復(fù)旦上線中國(guó)高校最大云上科研智算平臺(tái),45億參數(shù)科學(xué)大模型一天訓(xùn)完
6月27日,國(guó)內(nèi)高校最大的云上科研智算平臺(tái)CFFF(Computing for the Future at Fudan)在復(fù)旦大學(xué)正式上線。這臺(tái)為發(fā)現(xiàn)和解決復(fù)雜科學(xué)問(wèn)題而建的科研“超級(jí)計(jì)算機(jī)”由復(fù)旦大學(xué)與阿里云、中國(guó)電信共同打造,以公共云模式提供超千卡并行智能計(jì)算,支持千億參數(shù)的大模型訓(xùn)練。
根據(jù)此前的招投標(biāo)公告,CFFF專用計(jì)算平臺(tái)的整體系統(tǒng)組成如下:集群系統(tǒng)包含登錄管理節(jié)點(diǎn)、高性能超級(jí)計(jì)算機(jī)(包括GPU計(jì)算節(jié)點(diǎn)-前期已購(gòu)置和本次購(gòu)置的、CPU計(jì)算節(jié)點(diǎn)、胖節(jié)點(diǎn)、國(guó)產(chǎn)CPU計(jì)算集群和超融合集群)等計(jì)算設(shè)備、存儲(chǔ)系統(tǒng)(包括高速存儲(chǔ)系統(tǒng)-全閃、混閃-和低速存儲(chǔ)系統(tǒng)-溫存、磁帶庫(kù))、網(wǎng)絡(luò)系統(tǒng)(包括高速計(jì)算網(wǎng)絡(luò)、管理業(yè)務(wù)網(wǎng)絡(luò)、帶外管理網(wǎng)絡(luò)、校內(nèi)網(wǎng)對(duì)接網(wǎng)絡(luò)),虛擬機(jī)系統(tǒng)、安全設(shè)備、集群統(tǒng)一管理、集群統(tǒng)一登錄門(mén)戶網(wǎng)站、作業(yè)調(diào)度系統(tǒng)、并行開(kāi)發(fā)環(huán)境等全套軟硬件,機(jī)房托管,跨校區(qū)大數(shù)據(jù)傳輸網(wǎng)系統(tǒng)等。
據(jù)介紹,部署在復(fù)旦校內(nèi)的“近思”一號(hào)是專用高性能計(jì)算集群,托管在1500公里外阿里云烏蘭察布數(shù)據(jù)中心的“切問(wèn)”一號(hào)將面向多學(xué)科融合創(chuàng)新的AI for Science。
目前,CFFF平臺(tái)上的第一個(gè)科研成果已經(jīng)誕生。復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院李昊團(tuán)隊(duì)近期發(fā)布了45億參數(shù)量的中短期天氣預(yù)報(bào)大模型,預(yù)測(cè)效果在公開(kāi)數(shù)據(jù)集上首次達(dá)到業(yè)界公認(rèn)的ECMWF(歐洲中期天氣預(yù)報(bào)中心)集合平均水平,并將預(yù)測(cè)速度從原來(lái)的小時(shí)級(jí)縮短到了3秒內(nèi)?!盎贑FFF平臺(tái)的千卡并行智能計(jì)算,這樣一個(gè)規(guī)模的大模型只用一天就完成了訓(xùn)練。傳統(tǒng)的計(jì)算平臺(tái)是很難做到的。”李昊說(shuō)。
“隨著大數(shù)據(jù)資源的不斷增長(zhǎng),隨著需要求解的科學(xué)問(wèn)題日益復(fù)雜,引發(fā)了對(duì)于科學(xué)研究‘第五范式’的探索,即在數(shù)據(jù)范式的基礎(chǔ)上,引入智能技術(shù),強(qiáng)調(diào)人的決策機(jī)制與數(shù)據(jù)分析的融合,將數(shù)據(jù)科學(xué)和計(jì)算智能有效結(jié)合起來(lái)?!睆?fù)旦大學(xué)校長(zhǎng)、中國(guó)科學(xué)院院士金力認(rèn)為,人工智能在科學(xué)研究中的地位,要從科研范式變革的角度去看。傳統(tǒng)科研范式已經(jīng)歷了四個(gè)階段的演化發(fā)展歷程,從通過(guò)實(shí)驗(yàn)描述自然現(xiàn)象的經(jīng)驗(yàn)范式,到通過(guò)模型或歸納進(jìn)行研究的理論范式,到應(yīng)用計(jì)算機(jī)仿真模擬解決學(xué)科問(wèn)題的計(jì)算范式,發(fā)展到了通過(guò)大數(shù)據(jù)分析研究事物內(nèi)在關(guān)系的數(shù)據(jù)范式。
未來(lái),CFFF平臺(tái)還將持續(xù)擴(kuò)大其算力規(guī)模,并向復(fù)旦校外的科研機(jī)構(gòu)、高校、醫(yī)院、高科技企業(yè)等開(kāi)放。當(dāng)天,面向全球科研人員的首屆世界科學(xué)智能大賽也宣布正式啟動(dòng),大賽設(shè)置生命科學(xué)、量子化學(xué)等五大賽道,CFFF平臺(tái)將為參賽隊(duì)伍提供免費(fèi)訓(xùn)練算力,并以更普惠的算力長(zhǎng)期支持部分科研項(xiàng)目。