首頁(yè)|必讀|視頻|專(zhuān)訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 人工智能 >> 正文

云計(jì)算大廠暗戰(zhàn)大模型

2024年1月12日 08:13  界面新聞  

在大模型成為風(fēng)口之初,頭部初創(chuàng)公司Minimax曾舉辦了一場(chǎng)招標(biāo)會(huì)來(lái)采購(gòu)算力。

阿里云、百度云和字節(jié)旗下的火山引擎均在競(jìng)標(biāo)受邀之列,現(xiàn)場(chǎng)出現(xiàn)了互聯(lián)網(wǎng)行業(yè)許久不見(jiàn)的火藥味。

各家自有算盤(pán),也對(duì)這個(gè)客戶(hù)志在必得:阿里云市場(chǎng)份額還在第一,但已經(jīng)有下跌之勢(shì),保住地位是當(dāng)務(wù)之急;百度云在基礎(chǔ)架構(gòu)服務(wù)層的客戶(hù)積累比較薄弱,想多搶一些份額;火山引擎連市場(chǎng)份額排名的榜單都進(jìn)不去,想借著大模型客戶(hù)的機(jī)會(huì)再往上沖一沖。

三家工作人員在精心制作的PPT里展示自己的技術(shù)特點(diǎn)和優(yōu)勢(shì),但Minimax方面參評(píng)的技術(shù)專(zhuān)家們對(duì)此并不感興趣。價(jià)格,是他們最終且唯一關(guān)注的要素。

局面最終演變成了競(jìng)價(jià)會(huì)。

“5折!

“4.8折!

“4.5折。”

對(duì)于常規(guī)客戶(hù),各家云計(jì)算平臺(tái)能夠給到的價(jià)格在6折到5折左右,但此次競(jìng)價(jià)已經(jīng)沖破原來(lái)的標(biāo)準(zhǔn)——互聯(lián)網(wǎng)大廠也在降本提效,最近一兩年大家已經(jīng)不愿意以低價(jià)換市場(chǎng)份額。但一位參與競(jìng)標(biāo)的架構(gòu)師把當(dāng)時(shí)的場(chǎng)面形容為“大家奔著不要錢(qián)的方向去了”,最后的成交價(jià)低至2折。

在競(jìng)標(biāo)之前,這位架構(gòu)師根本沒(méi)有意料到如此競(jìng)價(jià)的場(chǎng)面,底價(jià)也沒(méi)有提前在公司內(nèi)部溝通。到最后他根本不敢再出價(jià),最終丟了這個(gè)標(biāo)。

贏家是火山引擎。他們不惜一切代價(jià)想要爭(zhēng)奪下這家大客戶(hù),延續(xù)了字節(jié)跳動(dòng)“大力出奇跡”的慣性。

但并不是每一次“大力”都能出奇跡。幾個(gè)月后,火山引擎又丟掉了這個(gè)大客戶(hù)。

“核心競(jìng)爭(zhēng)力是什么?”

無(wú)論是阿里云、百度云還是火山引擎,這些大廠的云計(jì)算平臺(tái),都太需要大模型客戶(hù)了。

甚至在大模型還沒(méi)有被打上聚光燈前,Minimax、智譜AI等頭部大模型客戶(hù)已經(jīng)成為兵家必爭(zhēng)之地——這是云計(jì)算廠商近幾年來(lái)為數(shù)不多的增量客戶(hù)。

隨著這些大模型公司業(yè)務(wù)體量的擴(kuò)張,每天的調(diào)用量都在指數(shù)級(jí)增長(zhǎng)。早期他們往往依靠自建的小規(guī)模算力平臺(tái)即可滿足需求,但兩三年以后,自己的算力肯定是不夠用了。

去年3月,大模型被ChatGPT驟然推上風(fēng)口。頭部初創(chuàng)公司融資屢創(chuàng)記錄,投資人和大廠也接連涌入。大模型對(duì)外要講的第一個(gè)故事就是大模型能力,訓(xùn)練參數(shù)規(guī)模是其中重要指標(biāo),而算力決定了大模型訓(xùn)練的質(zhì)量和速度。

拿到足夠多的錢(qián)之后,大模型公司進(jìn)入了一個(gè)瘋狂采購(gòu)算力的階段!笆遣皇谴嬖诶速M(fèi)的情況,根本不是他們關(guān)注的重點(diǎn)!币晃粩(shù)據(jù)中心從業(yè)者對(duì)界面新聞?wù)f。

大模型公司向云計(jì)算公司傳遞焦慮,而云計(jì)算平臺(tái)轉(zhuǎn)而瘋狂向英偉達(dá)采購(gòu)用于AI計(jì)算的GPU芯片。在目前的形勢(shì)下,英偉達(dá)GPU等同于“算力”,幾乎沒(méi)有替代品,A800是國(guó)內(nèi)能買(mǎi)到最好的芯片。

但英偉達(dá)的產(chǎn)能完全跟不上全球大模型公司洶涌而至的AI算力需求。

一位知情人士告訴界面新聞,國(guó)內(nèi)云計(jì)算平臺(tái)中,火山引擎采購(gòu)量比較大,規(guī)模約有幾萬(wàn)張計(jì)算卡,但英偉達(dá)根本無(wú)法保證交貨時(shí)間。據(jù)其透露,火山引擎一家去年和英偉達(dá)簽的訂單量已經(jīng)達(dá)到了前年BAT三家的總和,而B(niǎo)AT幾家大廠和英偉達(dá)的訂單已經(jīng)簽到了2024年。

也正是在這個(gè)關(guān)鍵時(shí)間,因?yàn)樗懔Ω簧,火山引擎最終丟掉了靠低價(jià)競(jìng)標(biāo)得來(lái)的大客戶(hù)Minimax。

就連更早向英偉達(dá)采購(gòu)GPU芯片的公司也未能如愿。云從科技副總裁張立告訴界面新聞,其在前年12月采購(gòu)的A800芯片按約定在23年4月到貨,但因?yàn)?月大模型被炒出風(fēng)口,訂單延期三四個(gè)月才交付!熬拖袷菙D牙膏一樣,每個(gè)月供一點(diǎn)。”

在對(duì)A800芯片的爭(zhēng)奪中,英偉達(dá)處于絕對(duì)強(qiáng)勢(shì)的位置。上述知情人士透露,在和國(guó)內(nèi)各家云計(jì)算平臺(tái)的交付合同中,英偉達(dá)不接受不能按時(shí)交付需支付違約金的懲罰性條款,能交付多少就交付多少!叭绻銏(jiān)持想要違約金,那對(duì)方一張都不賣(mài)了!

A800買(mǎi)不到,但大模型訓(xùn)練不能停。Minimax只能放棄火山引擎,再次多方尋找算力——但阿里云和百度云也沒(méi)有搶到這個(gè)覬覦已久的客戶(hù),因?yàn)樗麄円矝](méi)有足夠多的GPU。

Minimax甚至找到了一家服務(wù)器公司,而這家服務(wù)器公司又試圖通過(guò)參與競(jìng)標(biāo)的大廠購(gòu)買(mǎi)顯卡——產(chǎn)業(yè)鏈上下游邏輯被徹底打亂了,無(wú)人在意服務(wù)器公司根本沒(méi)有支撐大模型訓(xùn)練的能力,只要你有A800,跟誰(shuí)買(mǎi)都行。

“我們的核心競(jìng)爭(zhēng)力是什么?根本沒(méi)有核心競(jìng)爭(zhēng)力。”其中一家大廠的云計(jì)算平臺(tái)銷(xiāo)售負(fù)責(zé)人李武對(duì)界面新聞?wù)f。

最終,這家優(yōu)質(zhì)的大模型客戶(hù)被擁有足夠數(shù)量英偉達(dá)芯片的騰訊云挖角。

目睹了Minimax尋找算力全過(guò)程的李武告訴界面新聞,騰訊云對(duì)外宣稱(chēng)自己的異構(gòu)計(jì)算能力等等優(yōu)勢(shì),但這些能力都沒(méi)那么重要。大模型公司最核心的需求就是模型跑起來(lái)之后不能宕機(jī),否則需要從頭再跑一遍,浪費(fèi)時(shí)間就等于浪費(fèi)錢(qián)。幾家互聯(lián)網(wǎng)大廠都在努力保證服務(wù)的穩(wěn)定性,實(shí)際上技術(shù)能力的差異性并不大。

產(chǎn)品沒(méi)有獨(dú)特的競(jìng)爭(zhēng)力,這意味著誰(shuí)家擁有更多的A800,誰(shuí)就擁有了“核心競(jìng)爭(zhēng)力”。

從搶客戶(hù)到搶卡大戰(zhàn)

誰(shuí)也沒(méi)有預(yù)料到,云計(jì)算平臺(tái)的競(jìng)爭(zhēng)已經(jīng)演變?yōu)榱艘粓?chǎng)“搶卡大戰(zhàn)”。

去年10月17日,美國(guó)更新了針對(duì)人工智能芯片的出口管制規(guī)定,英偉達(dá)包括A800和H800在內(nèi)的GPU芯片對(duì)華出口都受到影響。

A800的價(jià)格隨之水漲船高,到了一天一個(gè)價(jià)格的地步。

而國(guó)內(nèi)云計(jì)算平臺(tái)在前年第四季度給英偉達(dá)下的訂單,到去年底才幾乎供齊。去年二三季度的訂單對(duì)于這些甲方來(lái)說(shuō),交付依然遙遙無(wú)期。

“雖然訂單已經(jīng)下了,但英偉達(dá)會(huì)不會(huì)違約?這些訂單到底啥時(shí)候能供貨?到貨的時(shí)候大模型的算力需求還存不存在?還能不能賺到錢(qián)?這些問(wèn)題我們真的判斷不了!币患以朴(jì)算平臺(tái)高管對(duì)此非常頭疼。

從23年年中到現(xiàn)在,A800芯片的價(jià)格已經(jīng)從8萬(wàn)元左右一路上漲到了17萬(wàn)元左右。買(mǎi)到卡囤幾個(gè)月再賣(mài)掉,變成了一個(gè)投機(jī)的好生意,但并不是所有人都有這樣的眼光。

當(dāng)各家云計(jì)算平臺(tái)和服務(wù)器公司都瘋狂找卡的時(shí)候,一個(gè)“笑話”在業(yè)界流傳:2022年初,騰訊云囤了幾萬(wàn)張英偉達(dá)計(jì)算卡,但他們覺(jué)得沒(méi)有太大多用處,年中又把一批卡轉(zhuǎn)手賣(mài)給了火山引擎。后來(lái)騰訊自然是十分后悔,因?yàn)檫@相當(dāng)于幾億元的利潤(rùn)沒(méi)了。

到了2023年,騰訊云也因?yàn)槿笨绷恕?jù)一位和騰訊云合作的服務(wù)器廠商高管透露,后來(lái)騰訊云拿到一批A800之后,因?yàn)橐逼壬暇,騰訊云的工程師和服務(wù)器廠商的工程師現(xiàn)場(chǎng)攢機(jī),一天可以攢8-10臺(tái),攢完就立即交付上線。

而算力價(jià)格波動(dòng)甚至讓云計(jì)算平臺(tái)的產(chǎn)研們也非?鄲馈幢闼麄兘(jīng)歷過(guò)云計(jì)算行業(yè)殘酷的價(jià)格戰(zhàn),也沒(méi)有見(jiàn)過(guò)要每天要像盯股市大盤(pán)一樣盯A800價(jià)格的陣仗。

作為一個(gè)服務(wù)產(chǎn)品,云計(jì)算銷(xiāo)售給予不同客戶(hù)的折扣尺度有相當(dāng)大的浮動(dòng)空間,背后依托的正是產(chǎn)研對(duì)成本和利潤(rùn)的核算。傳統(tǒng)意義上,低于3折的價(jià)格肯定會(huì)讓公司成本難以為繼,但如果為了爭(zhēng)取到一個(gè)優(yōu)質(zhì)客戶(hù),這樣的虧損可以通過(guò)時(shí)間和其他客戶(hù)的利潤(rùn)攤平——這也是過(guò)去廠商們價(jià)格戰(zhàn)的核心策略,能夠計(jì)算準(zhǔn)確的前提是成本保持穩(wěn)定。

但沒(méi)有人能預(yù)見(jiàn)A800之后幾個(gè)月的價(jià)格,而新的芯片供給還需要再等——英偉達(dá)計(jì)劃在今年第二季度量產(chǎn)符合美國(guó)出口規(guī)定的AI芯片H20。這款芯片本來(lái)應(yīng)該在去年11月推出,但服務(wù)器廠商在集成芯片時(shí)遇到了困難。屆時(shí)國(guó)內(nèi)的大客戶(hù)們誰(shuí)能夠搶到這一批芯片,還很難有定論。

因此,對(duì)于廠商來(lái)說(shuō),定價(jià)還是難題;蛟S這個(gè)月打三折,公司還有毛利;再過(guò)幾個(gè)月,報(bào)價(jià)打五折都不一定能夠回本。

客戶(hù)也在精打細(xì)算的過(guò)日子。雖然去年3月以來(lái),各家初創(chuàng)公司對(duì)算力的需求迫切,但隨著下半年風(fēng)口漸停,融資變得沒(méi)有那么容易了,在采購(gòu)算力的時(shí)候,大模型公司也更加看重價(jià)格。

原本在降本增效的背景下,從2023年開(kāi)始,阿里、騰訊和百度等幾家大廠在整體戰(zhàn)略上已經(jīng)放棄了以?xún)r(jià)格戰(zhàn)換市場(chǎng)的思路,僅僅針對(duì)個(gè)別優(yōu)質(zhì)客戶(hù)去打價(jià)格戰(zhàn)。

而在目前缺卡的背景下,價(jià)格甚至也缺乏說(shuō)服力,資源變成了唯一的子彈。行業(yè)內(nèi)的挖角方式變成了,即使甲方已經(jīng)和某家平臺(tái)簽下了訂單,依然會(huì)有人找上門(mén)來(lái),“告訴你對(duì)方缺卡,我們這里還有算力,要不你先過(guò)來(lái)跑!

在大模型風(fēng)口之下,想要通過(guò)出售算力賺錢(qián)的“賣(mài)水人”——那些云計(jì)算平臺(tái),沒(méi)人有底氣說(shuō)自己賺到錢(qián)了。只有英偉達(dá),成為了那家真正賺到錢(qián)的公司。

大模型不是云計(jì)算大廠的出路

“你希望算力能夠?qū)崿F(xiàn)什么價(jià)值?”

在不斷被客戶(hù)問(wèn)“有沒(méi)有卡”時(shí),AWS的銷(xiāo)售總監(jiān)趙孟總是試圖把話題推向另一個(gè)維度。

一卡難求的局面不僅影響到了大模型行業(yè),互聯(lián)網(wǎng)、游戲等領(lǐng)域的客戶(hù)也有各自新增的算力需求。如何在有限的資源條件下平衡不同的客戶(hù),也是云計(jì)算平臺(tái)面臨的另一個(gè)難題。

在大模型公司對(duì)云計(jì)算方的考察中,有沒(méi)有卡成為了決定性因素,但云計(jì)算平臺(tái)自身能力的差異化缺被忽視。在趙孟看來(lái),只有了解對(duì)方想用算力解決什么問(wèn)題,云計(jì)算平臺(tái)才能發(fā)揮出更大的價(jià)值。

簡(jiǎn)單來(lái)說(shuō),云計(jì)算平臺(tái)賺的錢(qián)本身就是其附加價(jià)值——從上游采購(gòu)服務(wù)器資源,再通過(guò)提供統(tǒng)一化、標(biāo)準(zhǔn)化的服務(wù)接口,可以讓客戶(hù)在無(wú)需關(guān)注服務(wù)器設(shè)備的情況下,更靈活的使用計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源。

這是云計(jì)算平臺(tái)作為“中間商”能夠替客戶(hù)省心的作用,但當(dāng)上游服務(wù)器所需要的GPU不斷漲價(jià)也一卡難求時(shí),云計(jì)算平臺(tái)能從附加價(jià)值中賺到的錢(qián)已經(jīng)所剩無(wú)幾。

趙孟更希望自己出售給客戶(hù)的不僅僅是算力,而是幫助他們解決問(wèn)題的工程化支持和工具,“OpenAI本質(zhì)上也提供算力,真正有價(jià)值的是能被應(yīng)用層使用的能力!

實(shí)際上,包括阿里云和百度云也是類(lèi)似的思路,他們都在訓(xùn)練自己的大模型,希望向應(yīng)用層的公司出售其大模型的能力。

但并不是所有人都接受云計(jì)算廠商們的方案?蛻(hù)兩極分化非常明顯,而不接受的客戶(hù)占比更大。

當(dāng)趙孟去向游戲和互聯(lián)網(wǎng)客戶(hù)講述大模型的能力,客戶(hù)們的心態(tài)往往會(huì)經(jīng)歷三個(gè)階段:第一階段是受到震撼;第二階段是展開(kāi)想象、想象大模型能力能夠如何為自己落地應(yīng)用;到真正收斂需求的第三個(gè)階段,沒(méi)有人真正知道大模型能提供什么實(shí)際的價(jià)值。

除了價(jià)值模糊,這條路的另一個(gè)阻力是收入微薄。

從界面新聞獲得的一份百度智能云千帆大模型平臺(tái)的調(diào)用數(shù)據(jù)情況來(lái)看,大模型應(yīng)用層給云計(jì)算平臺(tái)帶來(lái)的商業(yè)收益十分有限,甚至遠(yuǎn)不如直接出售算力。

這份數(shù)據(jù)顯示,目前百度智能云千帆大模型平臺(tái)周調(diào)用量過(guò)萬(wàn)的已經(jīng)是超級(jí)大客戶(hù)。但核算成收入每個(gè)月僅為幾萬(wàn)元,這與預(yù)訓(xùn)練大模型的前期投入成本完全不成比例。相比之下,一個(gè)新能源汽車(chē)客戶(hù)一年給百度云帶來(lái)的收入可以達(dá)到幾億元。

百度千帆大模型平臺(tái)的一位業(yè)務(wù)負(fù)責(zé)人向界面新聞表示,“業(yè)界對(duì)大語(yǔ)言模型的預(yù)期被炒的過(guò)高,但它并不是萬(wàn)能的!蹦壳捌鋺(yīng)用也僅限于文檔處理、客服等少數(shù)幾個(gè)場(chǎng)景,真正需要人工智能提升生產(chǎn)力的工業(yè)制造領(lǐng)域,大模型目前還談不上有可發(fā)揮的空間。

“年初想大干一場(chǎng),現(xiàn)在已經(jīng)不抱什么希望!边@位負(fù)責(zé)人在2023年下半年接到了一家頭部大模型初創(chuàng)公司的橄欖枝,對(duì)方承諾了數(shù)量可觀的期權(quán)。在過(guò)去五到十年的風(fēng)口中,這樣的挖角可能意味著財(cái)富自由的機(jī)會(huì),但這一次,這位負(fù)責(zé)人并沒(méi)有太多興奮感。

“大模型的風(fēng)口真的存在嗎?”他問(wèn)出了心中盤(pán)旋已久的疑惑!叭绻竽P偷娘L(fēng)口都不存在,云計(jì)算大廠的出路又在哪里呢?”

(應(yīng)采訪對(duì)象要求,文中李武、趙孟為化名)

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張?jiān)泼鳎捍蟛糠謬?guó)家新劃分了中頻段6G頻譜資源
精彩專(zhuān)題
專(zhuān)題丨“汛”速出動(dòng) 共筑信息保障堤壩
2023MWC上海世界移動(dòng)通信大會(huì)
中國(guó)5G商用四周年
2023年中國(guó)國(guó)際信息通信展覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像