日前,2024數字基礎設施高質量發(fā)展大會在深圳成功召開,中國信通院云大所總工程師郭亮應邀發(fā)表《智算發(fā)展現狀與趨勢》的主題報告;中國算力平臺在會議現場同步設置演示展區(qū),圍繞算力生態(tài)開展宣介活動。
近日,IEEE《2025年及以后的技術影響》的評選中,AI當之無愧得到了最多的票數,被認為是2025年最重要的技術,且將在安全、教育、健康、能源等方面發(fā)揮重要的賦能作用。斯坦福大學的《全球人工智能實力排行榜》,從8個方面42個維度對全球36個國家的人工智能實力進行了評估,美國加權指數總分位居第一;中國在研發(fā)、經濟和基礎設施方面表現突出,位居全球第二。據公開信息,我國2024年發(fā)布招投標信息的200多個智算中心分布于全國26個省市自治區(qū)的100多個地市,有遍地開花之勢;截止2024年11月,我國備案的大模型達到252個。
郭亮認為,集群是智算用得好的首要關鍵。只要Scaling Law繼續(xù)生效,大規(guī)模算力就具有其獨特的優(yōu)勢。另外,大集群對基礎設施帶來了巨大的挑戰(zhàn),液冷已經在xAI的10萬卡集群中得到了規(guī)模部署;亞馬遜、微軟等開始加大對小型核反應堆的關注。近日,ODCC(開放數據中心委員會)啟動聚焦百萬量級GPU集群的MegaScaleOut項目,是網絡領域的很好應對。
邊緣是智算用得好的關鍵之二。推理是訓練之外的第二大場景,Nvidia表示,2023年其數據中心部門收入有超過40%的業(yè)務是有關部署AI模型(推理)。Intel和AMD在積極使用其CPU應用于推理場景,取得了不錯的效果。2024“華彩杯”算力大賽中,中國電信 “基于通用算力的網絡大模型泛在推理能力研發(fā)與創(chuàng)新實踐”得到了評審的一致認可,獲得了總決賽的一等獎。
生態(tài)是智算用得好的關鍵之三。從企業(yè)來看,Nvidia在多年的積累中,形成了GPU+NVlink+IB+CUDA的一整套生態(tài)體系,取得了巨大的成功;從產業(yè)來看,算力+算法+數據構成了智算生態(tài)的三駕馬車,美國在這三方面都具有較大優(yōu)勢。而我國面臨著30+以上的AI芯片及多種技術路線的混戰(zhàn),任重而道遠。
市場是智算用得好的關鍵之四。智算的供給側旺盛,中國算力平臺的匹配系統(tǒng)(閱讀原文可直接訪問)仍是智算供需對接的不二選擇。通過整合全國算力資源,優(yōu)化算力基礎設施、網絡、資源匹配等監(jiān)測能力,實現算力資源優(yōu)化配置和共享,推進全國供給方、需求方和服務方三位一體的整體架構的形成,助力算存運資源統(tǒng)一化、常態(tài)化、便捷化建設管理運營。
賦能是智算用得好的關鍵第五。市場對接完成之后,算力的最終使命是去賦能。近年來,各行業(yè)的數字化轉型如火如荼,但是如何讓大家更好的使用算力、如何讓算力發(fā)揮更大的效用,是智算及IT從業(yè)者當前階段需要重點處理的任務,讓算力真正成為社會經濟發(fā)展的新引擎,為新質生產力添磚加瓦。