在大模型成為風(fēng)口之初,頭部初創(chuàng)公司Minimax曾舉辦了一場招標(biāo)會來采購算力。
阿里云、百度云和字節(jié)旗下的火山引擎均在競標(biāo)受邀之列,現(xiàn)場出現(xiàn)了互聯(lián)網(wǎng)行業(yè)許久不見的火藥味。
各家自有算盤,也對這個客戶志在必得:阿里云市場份額還在第一,但已經(jīng)有下跌之勢,保住地位是當(dāng)務(wù)之急;百度云在基礎(chǔ)架構(gòu)服務(wù)層的客戶積累比較薄弱,想多搶一些份額;火山引擎連市場份額排名的榜單都進不去,想借著大模型客戶的機會再往上沖一沖。
三家工作人員在精心制作的PPT里展示自己的技術(shù)特點和優(yōu)勢,但Minimax方面參評的技術(shù)專家們對此并不感興趣。價格,是他們最終且唯一關(guān)注的要素。
局面最終演變成了競價會。
“5折!
“4.8折!
“4.5折!
對于常規(guī)客戶,各家云計算平臺能夠給到的價格在6折到5折左右,但此次競價已經(jīng)沖破原來的標(biāo)準(zhǔn)——互聯(lián)網(wǎng)大廠也在降本提效,最近一兩年大家已經(jīng)不愿意以低價換市場份額。但一位參與競標(biāo)的架構(gòu)師把當(dāng)時的場面形容為“大家奔著不要錢的方向去了”,最后的成交價低至2折。
在競標(biāo)之前,這位架構(gòu)師根本沒有意料到如此競價的場面,底價也沒有提前在公司內(nèi)部溝通。到最后他根本不敢再出價,最終丟了這個標(biāo)。
贏家是火山引擎。他們不惜一切代價想要爭奪下這家大客戶,延續(xù)了字節(jié)跳動“大力出奇跡”的慣性。
但并不是每一次“大力”都能出奇跡。幾個月后,火山引擎又丟掉了這個大客戶。
“核心競爭力是什么?”
無論是阿里云、百度云還是火山引擎,這些大廠的云計算平臺,都太需要大模型客戶了。
甚至在大模型還沒有被打上聚光燈前,Minimax、智譜AI等頭部大模型客戶已經(jīng)成為兵家必爭之地——這是云計算廠商近幾年來為數(shù)不多的增量客戶。
隨著這些大模型公司業(yè)務(wù)體量的擴張,每天的調(diào)用量都在指數(shù)級增長。早期他們往往依靠自建的小規(guī)模算力平臺即可滿足需求,但兩三年以后,自己的算力肯定是不夠用了。
去年3月,大模型被ChatGPT驟然推上風(fēng)口。頭部初創(chuàng)公司融資屢創(chuàng)記錄,投資人和大廠也接連涌入。大模型對外要講的第一個故事就是大模型能力,訓(xùn)練參數(shù)規(guī)模是其中重要指標(biāo),而算力決定了大模型訓(xùn)練的質(zhì)量和速度。
拿到足夠多的錢之后,大模型公司進入了一個瘋狂采購算力的階段。“是不是存在浪費的情況,根本不是他們關(guān)注的重點!币晃粩(shù)據(jù)中心從業(yè)者對界面新聞?wù)f。
大模型公司向云計算公司傳遞焦慮,而云計算平臺轉(zhuǎn)而瘋狂向英偉達采購用于AI計算的GPU芯片。在目前的形勢下,英偉達GPU等同于“算力”,幾乎沒有替代品,A800是國內(nèi)能買到最好的芯片。
但英偉達的產(chǎn)能完全跟不上全球大模型公司洶涌而至的AI算力需求。
一位知情人士告訴界面新聞,國內(nèi)云計算平臺中,火山引擎采購量比較大,規(guī)模約有幾萬張計算卡,但英偉達根本無法保證交貨時間。據(jù)其透露,火山引擎一家去年和英偉達簽的訂單量已經(jīng)達到了前年BAT三家的總和,而BAT幾家大廠和英偉達的訂單已經(jīng)簽到了2024年。
也正是在這個關(guān)鍵時間,因為算力跟不上,火山引擎最終丟掉了靠低價競標(biāo)得來的大客戶Minimax。
就連更早向英偉達采購GPU芯片的公司也未能如愿。云從科技副總裁張立告訴界面新聞,其在前年12月采購的A800芯片按約定在23年4月到貨,但因為3月大模型被炒出風(fēng)口,訂單延期三四個月才交付!熬拖袷菙D牙膏一樣,每個月供一點!
在對A800芯片的爭奪中,英偉達處于絕對強勢的位置。上述知情人士透露,在和國內(nèi)各家云計算平臺的交付合同中,英偉達不接受不能按時交付需支付違約金的懲罰性條款,能交付多少就交付多少!叭绻銏猿窒胍`約金,那對方一張都不賣了。”
A800買不到,但大模型訓(xùn)練不能停。Minimax只能放棄火山引擎,再次多方尋找算力——但阿里云和百度云也沒有搶到這個覬覦已久的客戶,因為他們也沒有足夠多的GPU。
Minimax甚至找到了一家服務(wù)器公司,而這家服務(wù)器公司又試圖通過參與競標(biāo)的大廠購買顯卡——產(chǎn)業(yè)鏈上下游邏輯被徹底打亂了,無人在意服務(wù)器公司根本沒有支撐大模型訓(xùn)練的能力,只要你有A800,跟誰買都行。
“我們的核心競爭力是什么?根本沒有核心競爭力!逼渲幸患掖髲S的云計算平臺銷售負責(zé)人李武對界面新聞?wù)f。
最終,這家優(yōu)質(zhì)的大模型客戶被擁有足夠數(shù)量英偉達芯片的騰訊云挖角。
目睹了Minimax尋找算力全過程的李武告訴界面新聞,騰訊云對外宣稱自己的異構(gòu)計算能力等等優(yōu)勢,但這些能力都沒那么重要。大模型公司最核心的需求就是模型跑起來之后不能宕機,否則需要從頭再跑一遍,浪費時間就等于浪費錢。幾家互聯(lián)網(wǎng)大廠都在努力保證服務(wù)的穩(wěn)定性,實際上技術(shù)能力的差異性并不大。
產(chǎn)品沒有獨特的競爭力,這意味著誰家擁有更多的A800,誰就擁有了“核心競爭力”。
從搶客戶到搶卡大戰(zhàn)
誰也沒有預(yù)料到,云計算平臺的競爭已經(jīng)演變?yōu)榱艘粓觥皳尶ù髴?zhàn)”。
去年10月17日,美國更新了針對人工智能芯片的出口管制規(guī)定,英偉達包括A800和H800在內(nèi)的GPU芯片對華出口都受到影響。
A800的價格隨之水漲船高,到了一天一個價格的地步。
而國內(nèi)云計算平臺在前年第四季度給英偉達下的訂單,到去年底才幾乎供齊。去年二三季度的訂單對于這些甲方來說,交付依然遙遙無期。
“雖然訂單已經(jīng)下了,但英偉達會不會違約?這些訂單到底啥時候能供貨?到貨的時候大模型的算力需求還存不存在?還能不能賺到錢?這些問題我們真的判斷不了。”一家云計算平臺高管對此非常頭疼。
從23年年中到現(xiàn)在,A800芯片的價格已經(jīng)從8萬元左右一路上漲到了17萬元左右。買到卡囤幾個月再賣掉,變成了一個投機的好生意,但并不是所有人都有這樣的眼光。
當(dāng)各家云計算平臺和服務(wù)器公司都瘋狂找卡的時候,一個“笑話”在業(yè)界流傳:2022年初,騰訊云囤了幾萬張英偉達計算卡,但他們覺得沒有太大多用處,年中又把一批卡轉(zhuǎn)手賣給了火山引擎。后來騰訊自然是十分后悔,因為這相當(dāng)于幾億元的利潤沒了。
到了2023年,騰訊云也因為缺卡急了。據(jù)一位和騰訊云合作的服務(wù)器廠商高管透露,后來騰訊云拿到一批A800之后,因為要急迫上線,騰訊云的工程師和服務(wù)器廠商的工程師現(xiàn)場攢機,一天可以攢8-10臺,攢完就立即交付上線。
而算力價格波動甚至讓云計算平臺的產(chǎn)研們也非?鄲馈幢闼麄兘(jīng)歷過云計算行業(yè)殘酷的價格戰(zhàn),也沒有見過要每天要像盯股市大盤一樣盯A800價格的陣仗。
作為一個服務(wù)產(chǎn)品,云計算銷售給予不同客戶的折扣尺度有相當(dāng)大的浮動空間,背后依托的正是產(chǎn)研對成本和利潤的核算。傳統(tǒng)意義上,低于3折的價格肯定會讓公司成本難以為繼,但如果為了爭取到一個優(yōu)質(zhì)客戶,這樣的虧損可以通過時間和其他客戶的利潤攤平——這也是過去廠商們價格戰(zhàn)的核心策略,能夠計算準(zhǔn)確的前提是成本保持穩(wěn)定。
但沒有人能預(yù)見A800之后幾個月的價格,而新的芯片供給還需要再等——英偉達計劃在今年第二季度量產(chǎn)符合美國出口規(guī)定的AI芯片H20。這款芯片本來應(yīng)該在去年11月推出,但服務(wù)器廠商在集成芯片時遇到了困難。屆時國內(nèi)的大客戶們誰能夠搶到這一批芯片,還很難有定論。
因此,對于廠商來說,定價還是難題。或許這個月打三折,公司還有毛利;再過幾個月,報價打五折都不一定能夠回本。
客戶也在精打細算的過日子。雖然去年3月以來,各家初創(chuàng)公司對算力的需求迫切,但隨著下半年風(fēng)口漸停,融資變得沒有那么容易了,在采購算力的時候,大模型公司也更加看重價格。
原本在降本增效的背景下,從2023年開始,阿里、騰訊和百度等幾家大廠在整體戰(zhàn)略上已經(jīng)放棄了以價格戰(zhàn)換市場的思路,僅僅針對個別優(yōu)質(zhì)客戶去打價格戰(zhàn)。
而在目前缺卡的背景下,價格甚至也缺乏說服力,資源變成了唯一的子彈。行業(yè)內(nèi)的挖角方式變成了,即使甲方已經(jīng)和某家平臺簽下了訂單,依然會有人找上門來,“告訴你對方缺卡,我們這里還有算力,要不你先過來跑!
在大模型風(fēng)口之下,想要通過出售算力賺錢的“賣水人”——那些云計算平臺,沒人有底氣說自己賺到錢了。只有英偉達,成為了那家真正賺到錢的公司。
大模型不是云計算大廠的出路
“你希望算力能夠?qū)崿F(xiàn)什么價值?”
在不斷被客戶問“有沒有卡”時,AWS的銷售總監(jiān)趙孟總是試圖把話題推向另一個維度。
一卡難求的局面不僅影響到了大模型行業(yè),互聯(lián)網(wǎng)、游戲等領(lǐng)域的客戶也有各自新增的算力需求。如何在有限的資源條件下平衡不同的客戶,也是云計算平臺面臨的另一個難題。
在大模型公司對云計算方的考察中,有沒有卡成為了決定性因素,但云計算平臺自身能力的差異化缺被忽視。在趙孟看來,只有了解對方想用算力解決什么問題,云計算平臺才能發(fā)揮出更大的價值。
簡單來說,云計算平臺賺的錢本身就是其附加價值——從上游采購服務(wù)器資源,再通過提供統(tǒng)一化、標(biāo)準(zhǔn)化的服務(wù)接口,可以讓客戶在無需關(guān)注服務(wù)器設(shè)備的情況下,更靈活的使用計算、存儲和網(wǎng)絡(luò)資源。
這是云計算平臺作為“中間商”能夠替客戶省心的作用,但當(dāng)上游服務(wù)器所需要的GPU不斷漲價也一卡難求時,云計算平臺能從附加價值中賺到的錢已經(jīng)所剩無幾。
趙孟更希望自己出售給客戶的不僅僅是算力,而是幫助他們解決問題的工程化支持和工具,“OpenAI本質(zhì)上也提供算力,真正有價值的是能被應(yīng)用層使用的能力!
實際上,包括阿里云和百度云也是類似的思路,他們都在訓(xùn)練自己的大模型,希望向應(yīng)用層的公司出售其大模型的能力。
但并不是所有人都接受云計算廠商們的方案?蛻魞蓸O分化非常明顯,而不接受的客戶占比更大。
當(dāng)趙孟去向游戲和互聯(lián)網(wǎng)客戶講述大模型的能力,客戶們的心態(tài)往往會經(jīng)歷三個階段:第一階段是受到震撼;第二階段是展開想象、想象大模型能力能夠如何為自己落地應(yīng)用;到真正收斂需求的第三個階段,沒有人真正知道大模型能提供什么實際的價值。
除了價值模糊,這條路的另一個阻力是收入微薄。
從界面新聞獲得的一份百度智能云千帆大模型平臺的調(diào)用數(shù)據(jù)情況來看,大模型應(yīng)用層給云計算平臺帶來的商業(yè)收益十分有限,甚至遠不如直接出售算力。
這份數(shù)據(jù)顯示,目前百度智能云千帆大模型平臺周調(diào)用量過萬的已經(jīng)是超級大客戶。但核算成收入每個月僅為幾萬元,這與預(yù)訓(xùn)練大模型的前期投入成本完全不成比例。相比之下,一個新能源汽車客戶一年給百度云帶來的收入可以達到幾億元。
百度千帆大模型平臺的一位業(yè)務(wù)負責(zé)人向界面新聞表示,“業(yè)界對大語言模型的預(yù)期被炒的過高,但它并不是萬能的!蹦壳捌鋺(yīng)用也僅限于文檔處理、客服等少數(shù)幾個場景,真正需要人工智能提升生產(chǎn)力的工業(yè)制造領(lǐng)域,大模型目前還談不上有可發(fā)揮的空間。
“年初想大干一場,現(xiàn)在已經(jīng)不抱什么希望!边@位負責(zé)人在2023年下半年接到了一家頭部大模型初創(chuàng)公司的橄欖枝,對方承諾了數(shù)量可觀的期權(quán)。在過去五到十年的風(fēng)口中,這樣的挖角可能意味著財富自由的機會,但這一次,這位負責(zé)人并沒有太多興奮感。
“大模型的風(fēng)口真的存在嗎?”他問出了心中盤旋已久的疑惑!叭绻竽P偷娘L(fēng)口都不存在,云計算大廠的出路又在哪里呢?”
(應(yīng)采訪對象要求,文中李武、趙孟為化名)