近一年以來(lái),隨著基于大模型技術(shù)的新一輪人工智能技術(shù)浪潮崛起,如何有效應(yīng)對(duì)AI部署帶來(lái)的功耗和成本挑戰(zhàn)?如何構(gòu)建可持續(xù)的算力系統(tǒng)?AI PC能改善消費(fèi)電子需求減弱的現(xiàn)狀嗎?一系列的問(wèn)題,成為整個(gè)科技行業(yè)的熱門議題。
近日,新浪科技《科創(chuàng)100人》采訪了英特爾研究院副總裁、英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)。對(duì)話中,宋繼強(qiáng)指出,“應(yīng)對(duì)大模型部署的功耗和成本挑戰(zhàn),可以從芯片制程、系統(tǒng)架構(gòu)、異構(gòu)算力以及數(shù)據(jù)中心規(guī)劃設(shè)計(jì)等多維度入手!
作為最為底層的芯片算力企業(yè),英特爾和國(guó)內(nèi)外眾多云廠商、電信廠商已有超過(guò)十年的合作,其間作為顧問(wèn)去幫這些企業(yè)成立數(shù)據(jù)中心,做架構(gòu)優(yōu)化,過(guò)程中積累了大量的經(jīng)驗(yàn)。談及國(guó)內(nèi)該如何構(gòu)建可持續(xù)的算力系統(tǒng)時(shí),宋繼強(qiáng)強(qiáng)調(diào),“在新建數(shù)據(jù)中心的時(shí)候,一定要嚴(yán)卡能效比!
在宋繼強(qiáng)看來(lái),AI PC概念的提出,類似于之前在計(jì)算機(jī)上加上WiFi功能一樣的變革。因?yàn)轶w積和算力的原因,電腦可以把多種算力架構(gòu)組合進(jìn)去,支持更多的生成式AI創(chuàng)新。
“與手機(jī)相比,PC能支持更多生成式AI創(chuàng)新”
近一年以來(lái),隨著生成式AI技術(shù)的快速發(fā)展,越來(lái)越多的PC和消費(fèi)電子廠商紛紛圍繞AI技術(shù)展開(kāi)創(chuàng)新,AI PC的概念也隨之出現(xiàn)。作為個(gè)人電腦領(lǐng)域最為底層的芯片算力提供商,英特爾如何看待這一輪AI浪潮對(duì)于PC等消費(fèi)電子行業(yè)的影響呢?
宋繼強(qiáng)表示,AI PC這一波新的技術(shù)增長(zhǎng)或應(yīng)用增長(zhǎng)拐點(diǎn),就像當(dāng)年把WiFi做到筆記本上一樣,因?yàn)樗蝗唤o傳統(tǒng)的 PC或筆記本增加了一些AI能力,這會(huì)導(dǎo)致交互方式發(fā)生很大的變化,如果PC再去結(jié)合諸如邊緣智能設(shè)備進(jìn)行工作,這將帶來(lái)很多生產(chǎn)力上的改變,催生出一些新興的應(yīng)用。
“這些被催生出的新興應(yīng)用都跟終端設(shè)備有關(guān),但目前在手機(jī)上的挑戰(zhàn)可能要比在 PC上更大!彼卫^強(qiáng)表示。
在宋繼強(qiáng)看來(lái),由于手機(jī)體積較小能夠支撐的算力有限,而筆記本或者臺(tái)式機(jī)則可以把多種架構(gòu)組合起來(lái)去實(shí)現(xiàn)更多的功能,因此也將能夠支撐更多的硬件創(chuàng)新。
“應(yīng)對(duì)AI大模型部署挑戰(zhàn),要從三方面下手”
在部署大模型的過(guò)程中,AI工作負(fù)載帶來(lái)的功耗和成本挑戰(zhàn),是目前業(yè)界迫切希望解決的。在宋繼強(qiáng)看來(lái),AI工作的功耗問(wèn)題,實(shí)際上可以從四方面分別進(jìn)行解讀。
第一,芯片本身是否來(lái)自高能效比的工藝節(jié)點(diǎn)。如果我們想讓AI性能和能效提高,就要選用更具有高能效比的工藝節(jié)點(diǎn)去生產(chǎn)。比如,英特爾現(xiàn)在4年5個(gè)節(jié)點(diǎn)往前推進(jìn),從Intel 7、Intel 4、Intel 3,到2024年上半年和下半年分別會(huì)大批量生產(chǎn)的Intel 20A和Intel 18A,這些節(jié)點(diǎn)每代都會(huì)比前一代有兩位數(shù)性能提升。
“這些都是相對(duì)絕對(duì)的,因?yàn)樗前雽?dǎo)體制程所帶來(lái),能定義出一個(gè)晶體管的能效比、漏電情況、計(jì)算次數(shù)等,這是最底層的,也是芯片級(jí)的!彼卫^強(qiáng)表示。
第二,架構(gòu)設(shè)計(jì)是否能夠跟工作負(fù)載特點(diǎn)吻合。有了基礎(chǔ)的晶體管制造工藝后,上面就是架構(gòu)層的事,是如何組織晶體管并讓它去形成技術(shù)。這里會(huì)涉及CPU、GPU、NPU以及DPU等不同的架構(gòu),這些架構(gòu)由于工作模式不同,所以對(duì)于自己擅長(zhǎng)那部分的工作負(fù)載能效比就挺好。比如在模型部署應(yīng)用里,有一些是屬于前期的數(shù)據(jù)清洗和處理分析,包括數(shù)據(jù)結(jié)構(gòu)的優(yōu)化等,這些通過(guò)傳統(tǒng)CPU加上一些內(nèi)存架構(gòu)優(yōu)化,其實(shí)就挺好。如果后面涉及大模型,再引入GPU或者一些專門的AI加速器,性價(jià)比會(huì)更好。
在宋繼強(qiáng)看來(lái),現(xiàn)在的大模型所面臨的其實(shí)不是計(jì)算式主瓶頸,而是內(nèi)存的帶寬和容量是一個(gè)很大的瓶頸,所以整個(gè)系統(tǒng)的架構(gòu)里面是不是把這部分專門進(jìn)行優(yōu)化,也是它最后效率高低的一個(gè)差別。因?yàn)橹灰阖?fù)載沒(méi)運(yùn)行完,這些都在耗電,不管它是在空轉(zhuǎn)地等數(shù)據(jù),還是其他的都在耗電。同時(shí),一些復(fù)雜的工作也可以用更具突破性的架構(gòu)去實(shí)現(xiàn),比如說(shuō)類腦計(jì)算芯片,做同一類任務(wù),你用類腦芯片去實(shí)現(xiàn)和用這個(gè)傳統(tǒng)的CPU+GPU實(shí)現(xiàn),他們的能效比、能耗能相差到千倍以上。
上層系統(tǒng)是否從網(wǎng)絡(luò)到軟件都進(jìn)行了優(yōu)化。以數(shù)據(jù)中心服務(wù)器是否用最先進(jìn)的綠色計(jì)算方案為例,在整個(gè)服務(wù)器數(shù)據(jù)中心里,要知道怎么給它供電、散熱,怎么去減少空調(diào)的功率。因?yàn)樵跀?shù)據(jù)中心里邊,除了數(shù)據(jù)中心計(jì)算消耗的電量外,它產(chǎn)生了熱,空調(diào)就要去對(duì)它進(jìn)行冷卻,所以空調(diào)的電量也是能耗的一部分。
當(dāng)然,宋繼強(qiáng)也看到,對(duì)于想要提高AI能效比的企業(yè)而言,想要很好地兼顧好這些不同層面的技術(shù)因素,難度也是非常大的。在數(shù)智化需求側(cè)期待快速提升時(shí),有什么基于現(xiàn)在技術(shù)更靈活、快速的方案呢?據(jù)他介紹,在芯片制造、處理器架構(gòu)以及整個(gè)計(jì)算系統(tǒng)構(gòu)成環(huán)節(jié),英特爾IDM2.0所提供的系統(tǒng)級(jí)代工服務(wù),能夠給客戶提供全棧式的優(yōu)化計(jì)算方案。此外,英特爾還可以通過(guò)專用軟件工具或合作客戶解決方案,去幫客戶優(yōu)化并構(gòu)造解決相應(yīng)的AI能耗和成本問(wèn)題。
“建數(shù)據(jù)中心,生態(tài)不統(tǒng)一最讓人頭疼”
據(jù)宋繼強(qiáng)介紹,在數(shù)據(jù)中心能耗優(yōu)化和算網(wǎng)融合的能效比優(yōu)化方面,英特爾和國(guó)內(nèi)外支持的眾多云廠商、電信廠商,已有超過(guò)十年的合作歷史,英特爾通常會(huì)作為顧問(wèn)去幫這些企業(yè)成立數(shù)據(jù)中心,并做整個(gè)架構(gòu)的優(yōu)化,過(guò)程中也積累了大量的經(jīng)驗(yàn)。
在宋繼強(qiáng)看來(lái),在推動(dòng)可持續(xù)的算力生態(tài)建設(shè)過(guò)程中,一定要嚴(yán)卡能效比。畢竟,現(xiàn)在國(guó)內(nèi)數(shù)據(jù)中心上量太快了,各個(gè)城市都在建設(shè)。因此,一定要通過(guò)數(shù)智驅(qū)動(dòng)等手段,把能效真正地降下來(lái)。比如,通過(guò)加上傳感器做運(yùn)維輔助,讓整個(gè)IT系統(tǒng)在運(yùn)行工作負(fù)載的時(shí)候能夠節(jié)能;又或者通過(guò)優(yōu)化空調(diào)用電,做到非IT系統(tǒng)的節(jié)能。
他結(jié)合英特爾綠色數(shù)據(jù)中心技術(shù)框架2.0分享表示,在建數(shù)據(jù)中心時(shí)鼓勵(lì)要更多地采用稍微先進(jìn)一些的數(shù)據(jù)中心架構(gòu)模式!耙?yàn)椋坏⿺?shù)據(jù)中心建成并成為基礎(chǔ)設(shè)施,都是朝著使用10—15年去的,如果中間再去替換的話,成本都非常高”。因此,在做實(shí)施時(shí),盡量找有前瞻性的企業(yè)或顧問(wèn)團(tuán)來(lái)做方案,也是非常重要的。
宋繼強(qiáng)表示,國(guó)內(nèi)現(xiàn)在在建一些新的計(jì)算中心時(shí),有時(shí)候也會(huì)找英特爾去做咨詢。會(huì)發(fā)現(xiàn),他們遇到的一些問(wèn)題是,之前采用的一些異構(gòu)算力或者技術(shù)供應(yīng)商,經(jīng)歷一年兩年以后都消失了,又得重新迭代!八袁F(xiàn)在國(guó)內(nèi)建計(jì)算中心的時(shí)候也是很頭疼的,而且大家的生態(tài)都不統(tǒng)一,在這上面開(kāi)發(fā)應(yīng)用是很大的一個(gè)投資風(fēng)險(xiǎn)!
據(jù)他介紹,目前英特爾也會(huì)參與國(guó)內(nèi)一些智能算力中心的硬件能效比或計(jì)算能力評(píng)測(cè)中,去定制一些行業(yè)標(biāo)準(zhǔn),去比較不同芯片或不同架構(gòu)組合對(duì)于解決問(wèn)題的能力,做類似于基準(zhǔn)測(cè)試的定義,進(jìn)而促進(jìn)行業(yè)的規(guī)范發(fā)展。