首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 人工智能 >> 正文

云計算大廠暗戰(zhàn)大模型

2024年1月12日 08:13  界面新聞  

在大模型成為風(fēng)口之初,頭部初創(chuàng)公司Minimax曾舉辦了一場招標(biāo)會來采購算力。

阿里云、百度云和字節(jié)旗下的火山引擎均在競標(biāo)受邀之列,現(xiàn)場出現(xiàn)了互聯(lián)網(wǎng)行業(yè)許久不見的火藥味。

各家自有算盤,也對這個客戶志在必得:阿里云市場份額還在第一,但已經(jīng)有下跌之勢,保住地位是當(dāng)務(wù)之急;百度云在基礎(chǔ)架構(gòu)服務(wù)層的客戶積累比較薄弱,想多搶一些份額;火山引擎連市場份額排名的榜單都進不去,想借著大模型客戶的機會再往上沖一沖。

三家工作人員在精心制作的PPT里展示自己的技術(shù)特點和優(yōu)勢,但Minimax方面參評的技術(shù)專家們對此并不感興趣。價格,是他們最終且唯一關(guān)注的要素。

局面最終演變成了競價會。

“5折!

“4.8折!

“4.5折!

對于常規(guī)客戶,各家云計算平臺能夠給到的價格在6折到5折左右,但此次競價已經(jīng)沖破原來的標(biāo)準(zhǔn)——互聯(lián)網(wǎng)大廠也在降本提效,最近一兩年大家已經(jīng)不愿意以低價換市場份額。但一位參與競標(biāo)的架構(gòu)師把當(dāng)時的場面形容為“大家奔著不要錢的方向去了”,最后的成交價低至2折。

在競標(biāo)之前,這位架構(gòu)師根本沒有意料到如此競價的場面,底價也沒有提前在公司內(nèi)部溝通。到最后他根本不敢再出價,最終丟了這個標(biāo)。

贏家是火山引擎。他們不惜一切代價想要爭奪下這家大客戶,延續(xù)了字節(jié)跳動“大力出奇跡”的慣性。

但并不是每一次“大力”都能出奇跡。幾個月后,火山引擎又丟掉了這個大客戶。

“核心競爭力是什么?”

無論是阿里云、百度云還是火山引擎,這些大廠的云計算平臺,都太需要大模型客戶了。

甚至在大模型還沒有被打上聚光燈前,Minimax、智譜AI等頭部大模型客戶已經(jīng)成為兵家必爭之地——這是云計算廠商近幾年來為數(shù)不多的增量客戶。

隨著這些大模型公司業(yè)務(wù)體量的擴張,每天的調(diào)用量都在指數(shù)級增長。早期他們往往依靠自建的小規(guī)模算力平臺即可滿足需求,但兩三年以后,自己的算力肯定是不夠用了。

去年3月,大模型被ChatGPT驟然推上風(fēng)口。頭部初創(chuàng)公司融資屢創(chuàng)記錄,投資人和大廠也接連涌入。大模型對外要講的第一個故事就是大模型能力,訓(xùn)練參數(shù)規(guī)模是其中重要指標(biāo),而算力決定了大模型訓(xùn)練的質(zhì)量和速度。

拿到足夠多的錢之后,大模型公司進入了一個瘋狂采購算力的階段。“是不是存在浪費的情況,根本不是他們關(guān)注的重點!币晃粩(shù)據(jù)中心從業(yè)者對界面新聞?wù)f。

大模型公司向云計算公司傳遞焦慮,而云計算平臺轉(zhuǎn)而瘋狂向英偉達采購用于AI計算的GPU芯片。在目前的形勢下,英偉達GPU等同于“算力”,幾乎沒有替代品,A800是國內(nèi)能買到最好的芯片。

但英偉達的產(chǎn)能完全跟不上全球大模型公司洶涌而至的AI算力需求。

一位知情人士告訴界面新聞,國內(nèi)云計算平臺中,火山引擎采購量比較大,規(guī)模約有幾萬張計算卡,但英偉達根本無法保證交貨時間。據(jù)其透露,火山引擎一家去年和英偉達簽的訂單量已經(jīng)達到了前年BAT三家的總和,而BAT幾家大廠和英偉達的訂單已經(jīng)簽到了2024年。

也正是在這個關(guān)鍵時間,因為算力跟不上,火山引擎最終丟掉了靠低價競標(biāo)得來的大客戶Minimax。

就連更早向英偉達采購GPU芯片的公司也未能如愿。云從科技副總裁張立告訴界面新聞,其在前年12月采購的A800芯片按約定在23年4月到貨,但因為3月大模型被炒出風(fēng)口,訂單延期三四個月才交付!熬拖袷菙D牙膏一樣,每個月供一點!

在對A800芯片的爭奪中,英偉達處于絕對強勢的位置。上述知情人士透露,在和國內(nèi)各家云計算平臺的交付合同中,英偉達不接受不能按時交付需支付違約金的懲罰性條款,能交付多少就交付多少!叭绻銏猿窒胍`約金,那對方一張都不賣了。”

A800買不到,但大模型訓(xùn)練不能停。Minimax只能放棄火山引擎,再次多方尋找算力——但阿里云和百度云也沒有搶到這個覬覦已久的客戶,因為他們也沒有足夠多的GPU。

Minimax甚至找到了一家服務(wù)器公司,而這家服務(wù)器公司又試圖通過參與競標(biāo)的大廠購買顯卡——產(chǎn)業(yè)鏈上下游邏輯被徹底打亂了,無人在意服務(wù)器公司根本沒有支撐大模型訓(xùn)練的能力,只要你有A800,跟誰買都行。

“我們的核心競爭力是什么?根本沒有核心競爭力!逼渲幸患掖髲S的云計算平臺銷售負責(zé)人李武對界面新聞?wù)f。

最終,這家優(yōu)質(zhì)的大模型客戶被擁有足夠數(shù)量英偉達芯片的騰訊云挖角。

目睹了Minimax尋找算力全過程的李武告訴界面新聞,騰訊云對外宣稱自己的異構(gòu)計算能力等等優(yōu)勢,但這些能力都沒那么重要。大模型公司最核心的需求就是模型跑起來之后不能宕機,否則需要從頭再跑一遍,浪費時間就等于浪費錢。幾家互聯(lián)網(wǎng)大廠都在努力保證服務(wù)的穩(wěn)定性,實際上技術(shù)能力的差異性并不大。

產(chǎn)品沒有獨特的競爭力,這意味著誰家擁有更多的A800,誰就擁有了“核心競爭力”。

從搶客戶到搶卡大戰(zhàn)

誰也沒有預(yù)料到,云計算平臺的競爭已經(jīng)演變?yōu)榱艘粓觥皳尶ù髴?zhàn)”。

去年10月17日,美國更新了針對人工智能芯片的出口管制規(guī)定,英偉達包括A800和H800在內(nèi)的GPU芯片對華出口都受到影響。

A800的價格隨之水漲船高,到了一天一個價格的地步。

而國內(nèi)云計算平臺在前年第四季度給英偉達下的訂單,到去年底才幾乎供齊。去年二三季度的訂單對于這些甲方來說,交付依然遙遙無期。

“雖然訂單已經(jīng)下了,但英偉達會不會違約?這些訂單到底啥時候能供貨?到貨的時候大模型的算力需求還存不存在?還能不能賺到錢?這些問題我們真的判斷不了。”一家云計算平臺高管對此非常頭疼。

從23年年中到現(xiàn)在,A800芯片的價格已經(jīng)從8萬元左右一路上漲到了17萬元左右。買到卡囤幾個月再賣掉,變成了一個投機的好生意,但并不是所有人都有這樣的眼光。

當(dāng)各家云計算平臺和服務(wù)器公司都瘋狂找卡的時候,一個“笑話”在業(yè)界流傳:2022年初,騰訊云囤了幾萬張英偉達計算卡,但他們覺得沒有太大多用處,年中又把一批卡轉(zhuǎn)手賣給了火山引擎。后來騰訊自然是十分后悔,因為這相當(dāng)于幾億元的利潤沒了。

到了2023年,騰訊云也因為缺卡急了。據(jù)一位和騰訊云合作的服務(wù)器廠商高管透露,后來騰訊云拿到一批A800之后,因為要急迫上線,騰訊云的工程師和服務(wù)器廠商的工程師現(xiàn)場攢機,一天可以攢8-10臺,攢完就立即交付上線。

而算力價格波動甚至讓云計算平臺的產(chǎn)研們也非?鄲馈幢闼麄兘(jīng)歷過云計算行業(yè)殘酷的價格戰(zhàn),也沒有見過要每天要像盯股市大盤一樣盯A800價格的陣仗。

作為一個服務(wù)產(chǎn)品,云計算銷售給予不同客戶的折扣尺度有相當(dāng)大的浮動空間,背后依托的正是產(chǎn)研對成本和利潤的核算。傳統(tǒng)意義上,低于3折的價格肯定會讓公司成本難以為繼,但如果為了爭取到一個優(yōu)質(zhì)客戶,這樣的虧損可以通過時間和其他客戶的利潤攤平——這也是過去廠商們價格戰(zhàn)的核心策略,能夠計算準(zhǔn)確的前提是成本保持穩(wěn)定。

但沒有人能預(yù)見A800之后幾個月的價格,而新的芯片供給還需要再等——英偉達計劃在今年第二季度量產(chǎn)符合美國出口規(guī)定的AI芯片H20。這款芯片本來應(yīng)該在去年11月推出,但服務(wù)器廠商在集成芯片時遇到了困難。屆時國內(nèi)的大客戶們誰能夠搶到這一批芯片,還很難有定論。

因此,對于廠商來說,定價還是難題。或許這個月打三折,公司還有毛利;再過幾個月,報價打五折都不一定能夠回本。

客戶也在精打細算的過日子。雖然去年3月以來,各家初創(chuàng)公司對算力的需求迫切,但隨著下半年風(fēng)口漸停,融資變得沒有那么容易了,在采購算力的時候,大模型公司也更加看重價格。

原本在降本增效的背景下,從2023年開始,阿里、騰訊和百度等幾家大廠在整體戰(zhàn)略上已經(jīng)放棄了以價格戰(zhàn)換市場的思路,僅僅針對個別優(yōu)質(zhì)客戶去打價格戰(zhàn)。

而在目前缺卡的背景下,價格甚至也缺乏說服力,資源變成了唯一的子彈。行業(yè)內(nèi)的挖角方式變成了,即使甲方已經(jīng)和某家平臺簽下了訂單,依然會有人找上門來,“告訴你對方缺卡,我們這里還有算力,要不你先過來跑!

在大模型風(fēng)口之下,想要通過出售算力賺錢的“賣水人”——那些云計算平臺,沒人有底氣說自己賺到錢了。只有英偉達,成為了那家真正賺到錢的公司。

大模型不是云計算大廠的出路

“你希望算力能夠?qū)崿F(xiàn)什么價值?”

在不斷被客戶問“有沒有卡”時,AWS的銷售總監(jiān)趙孟總是試圖把話題推向另一個維度。

一卡難求的局面不僅影響到了大模型行業(yè),互聯(lián)網(wǎng)、游戲等領(lǐng)域的客戶也有各自新增的算力需求。如何在有限的資源條件下平衡不同的客戶,也是云計算平臺面臨的另一個難題。

在大模型公司對云計算方的考察中,有沒有卡成為了決定性因素,但云計算平臺自身能力的差異化缺被忽視。在趙孟看來,只有了解對方想用算力解決什么問題,云計算平臺才能發(fā)揮出更大的價值。

簡單來說,云計算平臺賺的錢本身就是其附加價值——從上游采購服務(wù)器資源,再通過提供統(tǒng)一化、標(biāo)準(zhǔn)化的服務(wù)接口,可以讓客戶在無需關(guān)注服務(wù)器設(shè)備的情況下,更靈活的使用計算、存儲和網(wǎng)絡(luò)資源。

這是云計算平臺作為“中間商”能夠替客戶省心的作用,但當(dāng)上游服務(wù)器所需要的GPU不斷漲價也一卡難求時,云計算平臺能從附加價值中賺到的錢已經(jīng)所剩無幾。

趙孟更希望自己出售給客戶的不僅僅是算力,而是幫助他們解決問題的工程化支持和工具,“OpenAI本質(zhì)上也提供算力,真正有價值的是能被應(yīng)用層使用的能力!

實際上,包括阿里云和百度云也是類似的思路,他們都在訓(xùn)練自己的大模型,希望向應(yīng)用層的公司出售其大模型的能力。

但并不是所有人都接受云計算廠商們的方案?蛻魞蓸O分化非常明顯,而不接受的客戶占比更大。

當(dāng)趙孟去向游戲和互聯(lián)網(wǎng)客戶講述大模型的能力,客戶們的心態(tài)往往會經(jīng)歷三個階段:第一階段是受到震撼;第二階段是展開想象、想象大模型能力能夠如何為自己落地應(yīng)用;到真正收斂需求的第三個階段,沒有人真正知道大模型能提供什么實際的價值。

除了價值模糊,這條路的另一個阻力是收入微薄。

從界面新聞獲得的一份百度智能云千帆大模型平臺的調(diào)用數(shù)據(jù)情況來看,大模型應(yīng)用層給云計算平臺帶來的商業(yè)收益十分有限,甚至遠不如直接出售算力。

這份數(shù)據(jù)顯示,目前百度智能云千帆大模型平臺周調(diào)用量過萬的已經(jīng)是超級大客戶。但核算成收入每個月僅為幾萬元,這與預(yù)訓(xùn)練大模型的前期投入成本完全不成比例。相比之下,一個新能源汽車客戶一年給百度云帶來的收入可以達到幾億元。

百度千帆大模型平臺的一位業(yè)務(wù)負責(zé)人向界面新聞表示,“業(yè)界對大語言模型的預(yù)期被炒的過高,但它并不是萬能的!蹦壳捌鋺(yīng)用也僅限于文檔處理、客服等少數(shù)幾個場景,真正需要人工智能提升生產(chǎn)力的工業(yè)制造領(lǐng)域,大模型目前還談不上有可發(fā)揮的空間。

“年初想大干一場,現(xiàn)在已經(jīng)不抱什么希望!边@位負責(zé)人在2023年下半年接到了一家頭部大模型初創(chuàng)公司的橄欖枝,對方承諾了數(shù)量可觀的期權(quán)。在過去五到十年的風(fēng)口中,這樣的挖角可能意味著財富自由的機會,但這一次,這位負責(zé)人并沒有太多興奮感。

“大模型的風(fēng)口真的存在嗎?”他問出了心中盤旋已久的疑惑!叭绻竽P偷娘L(fēng)口都不存在,云計算大廠的出路又在哪里呢?”

(應(yīng)采訪對象要求,文中李武、趙孟為化名)

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像