9月28日,2024中國(guó)算力大會(huì)發(fā)布“算力中國(guó)·最佳學(xué)術(shù)論文”,其中多篇論文的研究成果為業(yè)內(nèi)首創(chuàng),涵蓋算力模型優(yōu)化、綠色算力等領(lǐng)域,將為算力科技突破、應(yīng)用賦能發(fā)揮積極作用。
基礎(chǔ)研究是科技創(chuàng)新的源頭。黨的二十屆三中全會(huì)提出,強(qiáng)化基礎(chǔ)研究領(lǐng)域、交叉前沿領(lǐng)域、重點(diǎn)領(lǐng)域前瞻性、引領(lǐng)性布局。算力作為新質(zhì)生產(chǎn)力的代表,是推動(dòng)新一輪科技革命和產(chǎn)業(yè)變革的加速器,夯實(shí)算力領(lǐng)域研究基礎(chǔ),對(duì)產(chǎn)業(yè)自主創(chuàng)新和高質(zhì)量發(fā)展具有重要意義。為進(jìn)一步促進(jìn)算力及相關(guān)產(chǎn)業(yè)基礎(chǔ)科研探索,鼓勵(lì)基礎(chǔ)理論、方法模式研究,2024中國(guó)算力大會(huì)面向全球算力及相關(guān)領(lǐng)域的專(zhuān)業(yè)人士發(fā)起“算力中國(guó)·最佳學(xué)術(shù)論文”征集活動(dòng)。
據(jù)介紹,論文包括但不限于通用算力、高性能算力、智能計(jì)算、算力應(yīng)用、算力基礎(chǔ)設(shè)施等領(lǐng)域。論文需具備一定的創(chuàng)新性、科學(xué)性、典型性和推廣價(jià)值,在算力及相關(guān)產(chǎn)業(yè)的基礎(chǔ)理論、應(yīng)用研究中取得重要突破,在核心技術(shù)、創(chuàng)新應(yīng)用等方面取得顯著成果。
征集活動(dòng)自啟動(dòng)以來(lái),得到社會(huì)各界廣泛關(guān)注和大力支持。經(jīng)過(guò)嚴(yán)格篩選與評(píng)審,10篇論文獲評(píng)“算力中國(guó)·最佳學(xué)術(shù)論文”,包括《面向新一代神威超級(jí)計(jì)算機(jī)的69.7PFLOPS量級(jí)超大規(guī)模地震模擬》《Centauri:通過(guò)通信切分實(shí)現(xiàn)大模型訓(xùn)練中通信計(jì)算重疊的高效調(diào)度》《考慮云計(jì)算任務(wù)依賴(lài)關(guān)系的數(shù)據(jù)中心園區(qū)用能靈活性方法構(gòu)建與評(píng)估》《基于重復(fù)博弈視角的跨孤島聯(lián)邦學(xué)習(xí)中的長(zhǎng)期合作》《基于自適應(yīng)引導(dǎo)融合的域泛化深度特征學(xué)習(xí)》《用于分布式訓(xùn)練的傳輸層透明網(wǎng)內(nèi)聚合》《自具微孔聚合物用于膜法精確分離》《NFV網(wǎng)絡(luò)中基于深度學(xué)習(xí)的虛擬網(wǎng)絡(luò)功能優(yōu)化部署研究》《混合概率數(shù)及其神經(jīng)網(wǎng)絡(luò)計(jì)算》《深度時(shí)序圖聚類(lèi)》。其中,論文提出的“業(yè)界首個(gè)面向AI網(wǎng)絡(luò)的基于RoCE實(shí)現(xiàn)的在網(wǎng)計(jì)算創(chuàng)新方案”“首次分析并統(tǒng)一了二進(jìn)制數(shù)、概率數(shù)和混合概率數(shù)等三種數(shù)系間的數(shù)理關(guān)系”“首次全面定義了深度時(shí)序圖聚類(lèi)”等成果為業(yè)內(nèi)首創(chuàng)。
評(píng)審專(zhuān)家表示,這一系列學(xué)術(shù)研究成果將助推算力基礎(chǔ)研究走深走實(shí),助力我國(guó)算力及相關(guān)領(lǐng)域核心技術(shù)自立自強(qiáng)。
“算力中國(guó)·最佳學(xué)術(shù)論文”篇目如下:
論文一:
中文名稱(chēng):面向新一代神威超級(jí)計(jì)算機(jī)的69.7PFLOPS量級(jí)超大規(guī)模地震模擬
第一作者:萬(wàn)吳兵
第一作者單位:清華大學(xué)
通訊作者:甘霖、王文強(qiáng)、殷澤坤
合作作者:張振國(guó)、田浩東、王一諾、花夢(mèng)圓、劉小慧、項(xiàng)盛業(yè)、宋澤宇、何仲秋、王子加、高萍、陳垚鍵、段曉輝、劉鑫、張偉、付昊桓、薛巍、劉衛(wèi)國(guó)、楊廣文、陳曉非
推薦理由:論文基于新一代國(guó)產(chǎn)超級(jí)計(jì)算機(jī)設(shè)計(jì)了一系列全新并行計(jì)算方法,形成了一套高精度、高性能地震模擬算法;谡撐某晒麑(shí)現(xiàn)了可高效擴(kuò)展至3900萬(wàn)核計(jì)算規(guī)模(擴(kuò)展效率達(dá)98.2%)的超大規(guī)模地震模擬軟件,計(jì)算性能達(dá)69.7PFlops。論文進(jìn)一步開(kāi)展了復(fù)雜地形、真三維復(fù)雜介質(zhì)、12米分辨率、22.6Hz的加州地震模擬。該工作對(duì)于使用超級(jí)計(jì)算機(jī)理解地震的產(chǎn)生原理、傳播機(jī)理和破壞程度等具有重要意義。
論文二:
中文名稱(chēng):Centauri:通過(guò)通信切分實(shí)現(xiàn)大模型訓(xùn)練中通信計(jì)算重疊的高效調(diào)度
第一作者:陳暢
第一作者單位:上海人工智能實(shí)驗(yàn)室
通訊作者:楊超、李秀紅
合作作者:朱錢(qián)超、段江飛、孫鵬、張行程
推薦理由:Centauri是針對(duì)大規(guī)模模型訓(xùn)練過(guò)程中巨大的通信開(kāi)銷(xiāo),進(jìn)行通信-計(jì)算覆蓋優(yōu)化的框架。Centauri包含通信切分和重疊調(diào)度兩個(gè)部分。針對(duì)“通信是負(fù)載在設(shè)備群上的映射變換”這一核心抽象和模型訓(xùn)練任務(wù)的層級(jí)特點(diǎn),構(gòu)造出全面并且可以系統(tǒng)化探索的切分空間和調(diào)度層級(jí)。針對(duì)多種不同分布式并行配置下,Centauri對(duì)于流行大模型可以提升45%的訓(xùn)練性能。該論文獲得計(jì)算機(jī)體系結(jié)構(gòu)國(guó)際頂級(jí)會(huì)議ASPLOS2024最佳論文獎(jiǎng)項(xiàng)。
論文三:
中文名稱(chēng):考慮云計(jì)算任務(wù)依賴(lài)關(guān)系的數(shù)據(jù)中心園區(qū)用能靈活性方法構(gòu)建與評(píng)估
第一作者:馬佳豪
第一作者單位:阿里云計(jì)算有限公司、香港大學(xué)
通訊作者:閆月君、王朝陽(yáng)
合作作者:姚睿洋、張博超
推薦理由:AI技術(shù)和AI智算市場(chǎng)的快速發(fā)展下,云計(jì)算基礎(chǔ)設(shè)施數(shù)據(jù)中心的能耗問(wèn)題備受關(guān)注。通過(guò)挖掘云計(jì)算任務(wù)和數(shù)據(jù)中心用能設(shè)備的靈活性,實(shí)現(xiàn)數(shù)據(jù)中心彈性用電,對(duì)于解決數(shù)據(jù)中心能源問(wèn)題至關(guān)重要。該論文提出了考慮子任務(wù)依賴(lài)關(guān)系的數(shù)據(jù)中心園區(qū)靈活用能模型構(gòu)建方法,通過(guò)挖掘AI智算數(shù)據(jù)中心用能靈活性,促進(jìn)園區(qū)同電網(wǎng)協(xié)同用能,服務(wù)AI綠色技術(shù)創(chuàng)新和用戶對(duì)綠色服務(wù)的需求,支撐國(guó)家東數(shù)西算和雙碳行動(dòng),具有積極推廣意義和應(yīng)用價(jià)值。
論文四:
中文名稱(chēng):基于重復(fù)博弈視角的跨孤島聯(lián)邦學(xué)習(xí)中的長(zhǎng)期合作
第一作者:張寧
第一作者單位:中國(guó)電信股份有限公司研究院
通訊作者:馬倩
合作作者:陳旭
推薦理由:跨孤島聯(lián)邦學(xué)習(xí)中的搭便車(chē)者問(wèn)題一直對(duì)聯(lián)邦學(xué)習(xí)訓(xùn)練造成很大困擾,本文提供了一種具有理論保證的搭便車(chē)者的解決方案。本文從階段博弈和重復(fù)博弈角度分別進(jìn)行了理論分析,揭示了搭便車(chē)者存在的原因,并提出分布式算法通過(guò)鼓勵(lì)搭便車(chē)者考慮長(zhǎng)期收益轉(zhuǎn)而參與訓(xùn)練來(lái)解決搭便車(chē)者問(wèn)題,符合現(xiàn)實(shí)情況中用戶之間信息不互通的事實(shí)。模擬結(jié)果表明文章在最小化搭便車(chē)者數(shù)量和最大化模型訓(xùn)練數(shù)據(jù)量的有良好表現(xiàn)。
論文五:
中文名稱(chēng):基于自適應(yīng)引導(dǎo)融合的域泛化深度特征學(xué)習(xí)
第一作者:劉麗娜
第一作者單位:中國(guó)移動(dòng)研究院業(yè)務(wù)研究所、浙江大學(xué)
通訊作者:劉勇、宋希彬
合作作者:宋希彬、王蒙蒙、戴玉超、劉勇、張良俊
推薦理由:該論文提出了一種合成到真實(shí)域泛化地單目深度估計(jì)算法,能夠有效地應(yīng)用在智能交通、智慧城市和三維重建等領(lǐng)域,獲取準(zhǔn)確的深度信息。該論文是發(fā)表于計(jì)算機(jī)視覺(jué)與模式識(shí)別領(lǐng)域國(guó)際頂級(jí)知名期刊IEEE T-PAMI的最新成果,具有較大的創(chuàng)新性和可推廣價(jià)值。可為算力相關(guān)的應(yīng)用領(lǐng)域如數(shù)字孿生、世界模型、工業(yè)制造、交通物流和智慧城市等提供可靠和泛化性高的深度結(jié)果和三維信息,對(duì)未來(lái)提升三維視覺(jué)任務(wù)精度和效率提供了重要技術(shù)參考。
論文六:
中文名稱(chēng):用于分布式訓(xùn)練的傳輸層透明網(wǎng)內(nèi)聚合
第一作者:劉碩
第一作者單位:華為技術(shù)有限公司
通訊作者:吳文斐
合作作者:Qiaoling Wang、Junyi Zhang、Qinliang Lin、Yao Liu、Meng Xu、Marco Canini、Ray C. C. Cheung、Jianfei He
推薦理由:論文提出的業(yè)界首個(gè)面向AI網(wǎng)絡(luò)的基于RoCE實(shí)現(xiàn)的在網(wǎng)計(jì)算創(chuàng)新方案NetReduce,計(jì)劃對(duì)標(biāo)英偉達(dá)商用產(chǎn)品SHArP(Scalable Hierachical Aggregation Protocol)可擴(kuò)展層級(jí)化聚合協(xié)議。相較于英偉達(dá)基于閉源生態(tài)IB組網(wǎng),NetReduce具有組網(wǎng)規(guī)模更大,成本更低的優(yōu)勢(shì)。IB在網(wǎng)計(jì)算依賴(lài)特定的物理硬件,組網(wǎng)規(guī)模限于子網(wǎng)規(guī)模48K。而以太組網(wǎng)成本大約為IB的0.7~0.8,且擴(kuò)展性方面無(wú)子網(wǎng)規(guī)模限制。IB在網(wǎng)計(jì)算中,交換機(jī)與服務(wù)器建立RDMA連接,交換機(jī)維護(hù)連接狀態(tài),網(wǎng)絡(luò)復(fù)雜度高。NetReduce保持計(jì)算節(jié)點(diǎn)間端到端的可靠傳輸連接,避免在網(wǎng)絡(luò)中維護(hù)過(guò)多的狀態(tài)。NetReudce在提升AI網(wǎng)絡(luò)性能的同時(shí),最大程度兼容現(xiàn)有以太網(wǎng)協(xié)議棧,未來(lái)可廣泛部署于基于以太網(wǎng)的AI智算中心。
論文七:
中文名稱(chēng):自具微孔聚合物用于膜法精確分離
第一作者:馮孝權(quán)
第一作者單位:鄭州大學(xué)
通訊作者:張亞濤、朱軍勇
合作作者:靳健、汪勇、Bart Vander Bruggen
推薦理由:論文以一種具有自具微孔特征的高分子材料(PIMs)為主題,主要對(duì)其合成、結(jié)構(gòu)及其在膜分離應(yīng)用領(lǐng)域的發(fā)展做了詳細(xì)闡述。隨著材料科學(xué)快速發(fā)展,文中提出機(jī)器學(xué)習(xí)+AI大模型是設(shè)計(jì)、篩選具有特定功能的目標(biāo)材料的一種新范式;诜肿铀缴系目煽卦O(shè)計(jì),從材料設(shè)計(jì)和功能導(dǎo)向的角度為高性能聚合物材料的設(shè)計(jì)、篩選、開(kāi)發(fā)及分離應(yīng)用提供參考和指導(dǎo)。
論文八:
中文名稱(chēng):NFV網(wǎng)絡(luò)中基于深度學(xué)習(xí)的虛擬網(wǎng)絡(luò)功能優(yōu)化部署研究
第一作者:岳毅
第一作者單位:中國(guó)聯(lián)通研究院通訊作者:唐雄燕
合作作者:孫世丁、唐雄燕、曹暢、楊文聰
推薦理由:本論文緊密契合算力及相關(guān)產(chǎn)業(yè)的基礎(chǔ)理論與應(yīng)用研究需求,創(chuàng)新性地將深度學(xué)習(xí)應(yīng)用于網(wǎng)絡(luò)功能虛擬化中的虛擬網(wǎng)絡(luò)功能部署。通過(guò)構(gòu)建智能節(jié)點(diǎn)選擇神經(jīng)網(wǎng)絡(luò),顯著提高服務(wù)功能鏈(SFC)請(qǐng)求的處理效率和網(wǎng)絡(luò)資源利用率,同時(shí)解決了傳統(tǒng)方法在復(fù)雜網(wǎng)絡(luò)環(huán)境下的擴(kuò)展性與靈活性問(wèn)題,大幅降低計(jì)算復(fù)雜度和時(shí)間消耗。研究成果已發(fā)表在國(guó)際知名的通信領(lǐng)域頂會(huì)IEEE WCNC會(huì)議上。為未來(lái)網(wǎng)絡(luò)架構(gòu)的發(fā)展提供了理論和方法支持的同時(shí),還為智能算力的發(fā)展提供積極啟發(fā)。
論文九:
中文名稱(chēng):混合概率數(shù)及其神經(jīng)網(wǎng)絡(luò)計(jì)算
第一作者:李洪革
第一作者單位:北京航空航天大學(xué)
通訊作者:李洪革
合作作者:陳宇昊、宋印杰、朱新宇
推薦理由:該研究工作提出了一種全新的二進(jìn)制數(shù)和隨機(jī)概率數(shù)表示的混合數(shù)系統(tǒng)-混合概率數(shù)(Hybrid Stochastic Numbe,HSN)。該研究首次分析并統(tǒng)一了二進(jìn)制數(shù)、概率數(shù)和混合概率數(shù)等三種數(shù)系間的數(shù)理關(guān)系,構(gòu)建了三種數(shù)系間的數(shù)學(xué)表征并分析其高容錯(cuò)、抗輻照等特性,實(shí)現(xiàn)了由該數(shù)系構(gòu)造的智能計(jì)算芯片,為進(jìn)一步擴(kuò)展未來(lái)顛覆性智能計(jì)算體系打下了堅(jiān)實(shí)的數(shù)理基礎(chǔ)。近三年來(lái),該研究成果先后先后被IEEE TVLSI24、TCAS、TVLSI22、ESL、電子學(xué)報(bào)和CCF-CHIP、ISVLSI24、ISCAS、DAC61等國(guó)際國(guó)內(nèi)頂級(jí)權(quán)威期刊和大會(huì)的多位國(guó)際專(zhuān)家高度認(rèn)可并全文發(fā)表。獲2021年度第四屆“華為杯”全國(guó)研究生創(chuàng)芯大賽特等獎(jiǎng)。2022年榮獲全國(guó)集成電路大賽特等獎(jiǎng)。該原創(chuàng)性理論和技術(shù)被國(guó)務(wù)院發(fā)展研究中心收錄到2023年《世界前沿技術(shù)發(fā)展報(bào)告》。
論文十:
中文名稱(chēng):深度時(shí)序圖聚類(lèi)
第一作者:劉猛
第一作者單位:國(guó)防科技大學(xué)
通訊作者:劉新旺
合作作者:劉悅、梁科、涂文軒、王思為、周思航、劉新旺
推薦理由:該論文首次全面定義了深度時(shí)序圖聚類(lèi)這一新興任務(wù),著重強(qiáng)調(diào)了時(shí)序圖聚類(lèi)因其基于交互序列的批次處理范式,能夠有效緩解在大規(guī)模數(shù)據(jù)集上帶來(lái)的內(nèi)存溢出和算力瓶頸問(wèn)題,是從智能計(jì)算視角解決算力問(wèn)題的典型案例。論文還指出,時(shí)序圖聚類(lèi)因其能夠捕獲關(guān)鍵動(dòng)態(tài)信息的特性,有望成為現(xiàn)實(shí)世界動(dòng)態(tài)復(fù)雜場(chǎng)景的有效解決方案。該論文發(fā)表于機(jī)器學(xué)習(xí)頂級(jí)會(huì)議ICLR 2024,受邀在AI TIME、VALSE、PRCV等平臺(tái)作宣傳或報(bào)告。