依據(jù)IDC發(fā)布的《中國(guó)智算服務(wù)市場(chǎng)(2023下半年)跟蹤》報(bào)告,我國(guó)智算服務(wù)市場(chǎng)的增量幾乎全部來(lái)自GenAI IaaS和智算集成服務(wù)。其中,GenAI IaaS市場(chǎng)由火山引擎、阿里巴巴和商湯科技等引領(lǐng),智算集成服務(wù)市場(chǎng)則是華為一家獨(dú)大,呈現(xiàn)出與公有云和IT集成服務(wù)截然不同的市場(chǎng)格局,但又遵循著與云服務(wù)類(lèi)似的發(fā)展規(guī)律。
我國(guó)智算服務(wù)市場(chǎng)格局
據(jù)IDC統(tǒng)計(jì),2023年下半年,我國(guó)智算服務(wù)1市場(chǎng)整體規(guī)模達(dá)到114.1億元,同比增長(zhǎng)85.8%。其中,GenAI IaaS市場(chǎng)呈0到1式增長(zhǎng),規(guī)模達(dá)到32.2億元,為整體智算服務(wù)貢獻(xiàn)了59%的增量;Non-GenAI IaaS市場(chǎng)緩慢增長(zhǎng)至45.9億元,僅貢獻(xiàn)3%的增量;智算集成服務(wù)2受各地政府大力推進(jìn)智算中心建設(shè)等因素驅(qū)動(dòng),市場(chǎng)規(guī)模達(dá)到36.0億元,同比增長(zhǎng)129.4%,貢獻(xiàn)了38%的增量。
競(jìng)爭(zhēng)格局方面,火山引擎、商湯科技和華為的表現(xiàn)引人注目。
GenAI IaaS市場(chǎng):火山引擎、阿里巴巴、商湯科技、百度和騰訊占據(jù)前五位,份額合計(jì)約70%,市場(chǎng)集中度與公有云IaaS相近。其中,火山引擎和商湯科技這兩家并不屬于公有云第一梯隊(duì)的廠(chǎng)商,份額分別達(dá)到21%和15%,這意味著生成式AI或?qū)⒋呱碌脑凭揞^。
智算集成服務(wù)市場(chǎng):華為、新華三、百度、寒武紀(jì)和中國(guó)電子云占據(jù)前五位,份額合計(jì)約55%,市場(chǎng)集中度遠(yuǎn)高于IT咨詢(xún)與集成服務(wù)以及定制化開(kāi)發(fā)服務(wù)等市場(chǎng)(CR5僅為15%~20%)。其中,華為獨(dú)占超過(guò)45%的份額,成為絕對(duì)霸主;百度、寒武紀(jì)、中國(guó)電子云等主營(yíng)業(yè)務(wù)各異的非傳統(tǒng)系統(tǒng)集成服務(wù)廠(chǎng)商,也分別取得了2%上下的份額。這或許說(shuō)明與傳統(tǒng)IT服務(wù)相比,智算集成服務(wù)更加要求供應(yīng)商在資源和服務(wù)等方面擁有差異化優(yōu)勢(shì)。
TOP廠(chǎng)商的核心競(jìng)爭(zhēng)力
1.火山引擎:背靠字節(jié)跳動(dòng),火山終于“爆發(fā)”
作為字節(jié)跳動(dòng)旗下的云廠(chǎng)商,火山引擎依托豐沛智算資源、領(lǐng)先萬(wàn)卡集群和開(kāi)放模型平臺(tái)等在2023年實(shí)現(xiàn)高速擴(kuò)張,同比增速超過(guò)150%,并正通過(guò)進(jìn)一步激發(fā)應(yīng)用生態(tài)為增長(zhǎng)飛輪注入更多動(dòng)能。
豐沛智算資源:在人工智能被打上“落地變緩”“負(fù)增長(zhǎng)”等這些標(biāo)簽的2022年,火山引擎為滿(mǎn)足抖音等字節(jié)跳動(dòng)自有業(yè)務(wù),以及自動(dòng)駕駛和生物信息計(jì)算等新興領(lǐng)域頭部客戶(hù)的需求,持續(xù)囤積智算資源,順理成章地在生成式AI爆發(fā)且算力供不應(yīng)求的情況下,成為了智譜AI、月之暗面、Minimax、零一萬(wàn)物和百川智能等一眾AI初創(chuàng)公司的算力底座。
萬(wàn)卡集群技術(shù):隨模型參數(shù)量從千億邁向萬(wàn)億,以及推理需求不斷增長(zhǎng),大模型的算力要求升級(jí),高效率且高穩(wěn)定的萬(wàn)卡集群成為新一輪智算基礎(chǔ)設(shè)施競(jìng)賽的必選項(xiàng)。字節(jié)跳動(dòng)聯(lián)合北京大學(xué)發(fā)表論文3,針對(duì)在萬(wàn)卡集群上訓(xùn)練大模型的效率和穩(wěn)定性問(wèn)題提出MegaScale生產(chǎn)系統(tǒng)。論文顯示,在12288塊GPU上訓(xùn)練1750億參數(shù)大語(yǔ)言模型時(shí),MegaScale實(shí)現(xiàn)了55.2%的算力利用率(MFU),是英偉達(dá)Megatron-LM的1.34倍。
開(kāi)放模型平臺(tái):與阿里云、百度智能云等先卷大模型不同,火山引擎首先將匯聚和開(kāi)放第三方大模型作為重點(diǎn),推出火山方舟MaaS平臺(tái)。通過(guò)搭建模型需求端和供給側(cè)間的橋梁,火山引擎在幫助模型廠(chǎng)商拓展客戶(hù)的同時(shí)也實(shí)現(xiàn)了自身收入增長(zhǎng)。
激發(fā)應(yīng)用生態(tài):隨AI大模型的普及度和滲透率不斷提升,推理工作負(fù)載將遠(yuǎn)大于訓(xùn)練工作負(fù)載;鹕揭婵礈(zhǔn)這一趨勢(shì),將字節(jié)跳動(dòng)豆包大模型的推理輸入價(jià)格降至0.8厘/千tokens,以期降低客戶(hù)試錯(cuò)成本,繁榮AI應(yīng)用生態(tài)。
2.商湯科技:大裝置發(fā)揮大作用
商湯科技2014年以視覺(jué)AI起家,2018年開(kāi)始打造由模型層、深度學(xué)習(xí)平臺(tái)和計(jì)算基礎(chǔ)設(shè)施等三部分構(gòu)成的AI基礎(chǔ)設(shè)施——SenseCore商湯AI大裝置。依托大裝置,商湯科技不僅對(duì)外提供豐富的AI云產(chǎn)品和行業(yè)解決方案,也實(shí)現(xiàn)了自有“日日新”大模型體系的高速迭代。在“大裝置+大模型”驅(qū)動(dòng)下,商湯科技2023年生成式AI收入突破11.8億元,同比增長(zhǎng)近200%。
前瞻性布局智算中心:商湯科技2020年起陸續(xù)在上海、深圳、廣州、福州、濟(jì)南和重慶等多地建設(shè)智算中心,截至2023年底,上線(xiàn)GPU數(shù)量達(dá)到45000張,總運(yùn)營(yíng)算力達(dá)到12 EFLOPS。其中,上海臨港智算中心于2020年啟動(dòng)建設(shè),2022年正式運(yùn)營(yíng),24年4月算力規(guī)模達(dá)到8.1 EFLOPS,位居我國(guó)乃至全球前列。
打造高效穩(wěn)定萬(wàn)卡集群:商湯科技已實(shí)現(xiàn)萬(wàn)卡互聯(lián),集群線(xiàn)性加速比超過(guò)90%,同時(shí)保證超30天穩(wěn)定訓(xùn)練不間斷和訓(xùn)練間斷半小時(shí)恢復(fù)。
高性?xún)r(jià)比推理服務(wù):商湯科技2023年將推理服務(wù)性?xún)r(jià)比提升300%,大幅降低大模型推理單位成本。
3.華為:領(lǐng)先芯片和全棧服務(wù)顯身手
領(lǐng)先AI芯片:在美不斷升級(jí)對(duì)華半導(dǎo)體出口管制和我國(guó)信創(chuàng)進(jìn)程加速的背景下,華為昇騰910B作為少數(shù)可與英偉達(dá)A100等海外高端GPU抗衡的國(guó)產(chǎn)AI芯片之一,是華為得以拿下眾多智算中心建設(shè)項(xiàng)目的殺手锏。
全棧智算服務(wù):基于30余年的ICT服務(wù)經(jīng)驗(yàn),華為已形成從規(guī)劃、集成、運(yùn)維到模型使能和人才培養(yǎng)等的端到端智算集成服務(wù),幫助客戶(hù)建好和用好智算基礎(chǔ)設(shè)施。
運(yùn)營(yíng)商競(jìng)爭(zhēng)策略
回顧云服務(wù)發(fā)展歷程,1.0階段,亞馬遜和阿里巴巴等互聯(lián)網(wǎng)大廠(chǎng)將自有資源和技術(shù)向其他互聯(lián)網(wǎng)企業(yè)開(kāi)放,順利打開(kāi)市場(chǎng);2.0階段,中國(guó)電信等運(yùn)營(yíng)商抓住政企上云機(jī)遇,憑借不斷提升的技術(shù)實(shí)力和長(zhǎng)年累積的服務(wù)經(jīng)驗(yàn)實(shí)現(xiàn)規(guī)模擴(kuò)張。
如今,智算服務(wù)1.0因“百模大戰(zhàn)”開(kāi)啟,火山引擎和商湯科技等對(duì)智算資源和技術(shù)早有儲(chǔ)備的企業(yè)占得市場(chǎng)先機(jī)。面對(duì)將由行業(yè)大模型帶動(dòng)的智算服務(wù)2.0,運(yùn)營(yíng)商已從資源、技術(shù)、產(chǎn)品和服務(wù)等多方面做好準(zhǔn)備,如中國(guó)電信規(guī)劃并建設(shè)覆蓋全國(guó)的“2+3+7+X”公共智算云池,打造國(guó)產(chǎn)萬(wàn)卡智算集群,加快構(gòu)建“息壤”一體化智算服務(wù)體系和能力等。
然而,由于其他智算服務(wù)提供商,如AI企業(yè)、互聯(lián)網(wǎng)/云廠(chǎng)商和其他央國(guó)企等,多同樣具備政企服務(wù)經(jīng)驗(yàn),因此運(yùn)營(yíng)商在智算服務(wù)2.0將面臨比云服務(wù)2.0更為嚴(yán)峻的競(jìng)爭(zhēng)環(huán)境。建議:
一是強(qiáng)化安全可信,針對(duì)在A(yíng)I時(shí)代被進(jìn)一步放大的數(shù)據(jù)(含算法、代碼等)隱私與安全問(wèn)題,依托機(jī)密計(jì)算4等技術(shù),打造可在A(yíng)I全生命周期內(nèi)保障數(shù)據(jù)和模型等的機(jī)密性與完整性的智算基礎(chǔ)設(shè)施,讓客戶(hù)安心使用AI IaaS;
二是繁榮模型生態(tài),秉持開(kāi)放共贏(yíng)理念,幫助自研和第三方模型、MaaS平臺(tái)與AI應(yīng)用等觸達(dá)客戶(hù);
三是升級(jí)集成服務(wù),理解與把握政企客戶(hù)對(duì)智算基礎(chǔ)設(shè)施的當(dāng)下和長(zhǎng)遠(yuǎn)需求,提供從建到用再到后續(xù)升級(jí)的高水平全棧服務(wù)。
注釋?zhuān)?/P>
1.IDC將智算服務(wù)定義為以GPU、FPGA、ASIC等AI專(zhuān)用算力為主的基礎(chǔ)設(shè)施服務(wù),主要包括智算集成服務(wù)和智算基礎(chǔ)設(shè)施即服務(wù)(AI IaaS)。其中,AI IaaS市場(chǎng)又分為面向生成式AI的GenAI IaaS和面向渲染、仿真、視聯(lián)網(wǎng)推理等非生成式AI的Non-GenAI IaaS等兩個(gè)細(xì)分市場(chǎng)。
2.智算集成服務(wù)指廠(chǎng)商在幫助客戶(hù)建設(shè)私有智算基礎(chǔ)設(shè)施過(guò)程中提供的咨詢(xún)、集成、開(kāi)發(fā)、運(yùn)維等專(zhuān)業(yè)和管理服務(wù)。
3.《MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs》。
4.機(jī)密計(jì)算是一種通過(guò)在基于硬件的可信執(zhí)行環(huán)境(TEE)中執(zhí)行計(jì)算來(lái)保護(hù)使用中的數(shù)據(jù)的技術(shù)。
本文作者
魏玥
戰(zhàn)略發(fā)展研究所
副主任分析師
碩士,高級(jí)工程師,長(zhǎng)期從事ICT產(chǎn)業(yè)研究,近年來(lái)專(zhuān)注云計(jì)算、人工智能、產(chǎn)業(yè)數(shù)字化等領(lǐng)域。