首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|智能汽車|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 移動互聯(lián)網(wǎng) >> 正文

為什么說MEMS—OXC在智算場景沒有未來?

2024年12月12日 17:16  CCTIME飛象網(wǎng)  

文章轉(zhuǎn)自:腦極體

智算中心是這一輪科技革命的算力“心臟”,更是國際科技博弈的長期焦點。智算中心建設(shè)方案,一直牽動著國人的神經(jīng)。

近期,OXC光交換技術(shù)在智算場景的應(yīng)用,走進(jìn)了大眾視野。這個技術(shù)及其解決方案,撐得起智算中心網(wǎng)絡(luò)嗎?

深入技術(shù)本質(zhì)、落地實踐、產(chǎn)業(yè)進(jìn)程來看,恐怕都要說一句,OXC技術(shù)在智算場景其實沒有未來。

技術(shù)上看,OXC光交換技術(shù)在智算場景中會面臨光電協(xié)同、不支持AI任務(wù)多對多傳輸?shù)燃夹g(shù)挑戰(zhàn),很難有效解決。

實踐上看,當(dāng)前業(yè)界僅谷歌一家商用MEMS OXC設(shè)備,而谷歌TPU集群用OXC的核心目的是為了解決Torus拓?fù)涞目捎枚葐栴},但網(wǎng)絡(luò)可用度的短板其實是在接入端口,OXC不解決網(wǎng)絡(luò)可用度問題,所以實際上跟自動配線架沒有本質(zhì)區(qū)別。

產(chǎn)業(yè)上看,谷歌商用OXC全球僅此一家,根據(jù)LightCounting預(yù)測,到2029年OXC的全球市場空間約為5億美元,其中大部分是谷歌, 產(chǎn)業(yè)規(guī)模僅為電交換的20分之一。

綜合上述維度,不難得出結(jié)論,OXC技術(shù)在智算場景中只是配線架,無法真的規(guī);涞,也支撐不了超萬卡集群智算中心網(wǎng)絡(luò)。

接下來咱們就從技術(shù)的起點到產(chǎn)業(yè)的終點,全面掀開智算場景MEMS—OXC的面紗。

技術(shù)為起點:為什么說MEMS-OXC只是配線架

簡單來說,OXC光交換技術(shù)就是在不同的光路徑之間進(jìn)行光信號交換。技術(shù)路徑包括MEMS、DLC、和DLBS,其中,MEMS技術(shù)是目前最主流的方案, MEMS- OXC設(shè)備也是目前唯一被谷歌這一家所商用的。

但在超萬卡集群的智算中心網(wǎng)絡(luò)中,MEMS -OXC發(fā)揮的作用其實就是配線架。

我們先來看看,智算中心組網(wǎng)是怎么實現(xiàn)的。ODCC(開放數(shù)據(jù)中心委員會)發(fā)布的《AI 數(shù)據(jù)中心網(wǎng)絡(luò)建網(wǎng)》報告提到,AI參數(shù)面網(wǎng)絡(luò)有兩層Spine-Leaf,以及三層CLOS架構(gòu)組網(wǎng),而在AI集群組網(wǎng)實踐中,通過三層組網(wǎng)達(dá)到十萬卡以上的組網(wǎng)規(guī)模。

目前,Meta、OpenAI、微軟等AI巨頭,都是通過從兩層向三層擴(kuò)展的組網(wǎng)模式,去構(gòu)建超大規(guī)模集群的。也就是在Leaf層、Spine層之外增加Core層。其中,兩層組網(wǎng)使用的是電交換機。比如目前業(yè)界唯一的OXC商用實踐——谷歌也采用的是光電混合架構(gòu)。

可以看到,智算中心網(wǎng)絡(luò),如果采用兩層組網(wǎng),不需要OXC;如果是三層組網(wǎng),MEMS -OXC設(shè)備在Core層主要發(fā)揮的作用是靈活配線,與自動配線架沒有本質(zhì)區(qū)別。

引入MEMS -OXC,不僅無法給網(wǎng)絡(luò)帶來增益,還可能制造出額外的問題:

首先,光電協(xié)同問題。

如果在第三層引入OXC光交換機,但數(shù)據(jù)中心網(wǎng)絡(luò)底層用的還是電交換機,這就需要光電之間的協(xié)同、通信、配合,對整個數(shù)據(jù)中心網(wǎng)絡(luò),沖擊是比較大的。

舉個例子,OXC技術(shù)有靈活切換的特征,但對于整網(wǎng)來說,光交換機一會兒連通、一會兒斷開,這就需要整個接入層和Spine層,都要隨之進(jìn)行策略調(diào)整。

試想一下,智算場景下的大模型訓(xùn)練大多采用并行訓(xùn)練,業(yè)務(wù)流隨時變化,如果數(shù)據(jù)中心網(wǎng)絡(luò)隨時隨地在進(jìn)行秒級調(diào)整,那訓(xùn)練的可靠性就很難保證了。任何一個大模型研發(fā)團(tuán)隊,恐怕都無法接受訓(xùn)練的高頻中斷。

其次,OXC與AI業(yè)務(wù)的適配問題。

OXC光交換技術(shù)是不支持多對多通信的,只能進(jìn)行純物理的轉(zhuǎn)發(fā)。而在智算場景中,AI任務(wù)是有很多算法和算子的,不同算法的通信模式都不太一樣,可能需要一對多、多對一、多對多等多種轉(zhuǎn)發(fā)方式。這些算法的高效通信,OXC技術(shù)就很難滿足,導(dǎo)致相關(guān)智算業(yè)務(wù)無法開展。

第三大問題,就是OXC的耗能問題。

OXC光交換機的插損很大,也就是信號在光折射的過程中產(chǎn)生了衰減。那么為了彌補OXC的插損,就不得不采用更大功率或更長距離的光模塊,這又會導(dǎo)致能耗上升。此外,插損問題,還會導(dǎo)致光模塊速率無法演進(jìn)。

由于上述問題的存在,智算中心結(jié)合插損、功耗等多方面進(jìn)行考量,算一筆綜合賬,就會發(fā)現(xiàn)MEMS-OXC設(shè)備還不如自動配線架。

產(chǎn)業(yè)為終點,MEMS-OXC無法形成商業(yè)閉環(huán)

MEMS-OXC不如自動配線架的另一個關(guān)鍵因素,就是商用前景。

我們知道,一項新技術(shù)都必須在商業(yè)市場中完成閉環(huán),能夠通過使用來回收投資,才能吸引基礎(chǔ)設(shè)施的進(jìn)一步投入,形成良性循環(huán)。而OXC技術(shù)的產(chǎn)業(yè)化,良性商業(yè)閉環(huán)是很難的。

最首要的制約,是成本。

OXC技術(shù)的落地需要光交換機的大量使用,并且所有的相關(guān)器件如光模塊,都需要進(jìn)行升級,這會導(dǎo)致前期投資巨大,綜合成本高。

ODCC(開放數(shù)據(jù)中心委員會)在《AI 網(wǎng)絡(luò)光交換機技術(shù)報告》中提出,考慮到網(wǎng)絡(luò)系統(tǒng)和OCS(光交換機)本身的挑戰(zhàn),從端口數(shù)量需求、切換時間需求、低成本、高可靠性、拓?fù)湟子诠芾淼染S度分析,光交換機還需要優(yōu)化設(shè)計以降低插損和回波損耗,以及探索與電交換機組網(wǎng)方案來降低成本等。

而上述投資,都需要從產(chǎn)業(yè)用戶身上完成商業(yè)回報。但如前所說,受限于光交換技術(shù)本身的瓶頸,許多AI任務(wù)及場景是短期內(nèi)難以落地的,這就導(dǎo)致OXC的商業(yè)不確定性強。

這樣綜合考慮下來,就導(dǎo)致業(yè)界落地OXC的步伐明顯冷靜,基本處于觀望狀態(tài)。

盲目引入OXC,可能是中國智算產(chǎn)業(yè)一段彎路

技術(shù)不是生存在真空之中的,是寄生在人才、資金、產(chǎn)業(yè)、實體經(jīng)濟(jì)等多重因素的現(xiàn)實中。

中國智算產(chǎn)業(yè)仍處于追趕階段,資源、人才等都相對不足,既要把握發(fā)展前景與機遇,也要面對當(dāng)下生存、商業(yè)的現(xiàn)實挑戰(zhàn),甚至有的還要處理歷史遺留問題。

這種情況下,如果國內(nèi)智算產(chǎn)業(yè)將寶貴的資源,投入到并不適合用來組網(wǎng)的OXC身上,可能會導(dǎo)致一系列連鎖反應(yīng)。

比如產(chǎn)業(yè)資源的分散,智算中心建設(shè)昂貴, 而在組網(wǎng)規(guī)模、插損、功耗、成本等方面都沒有優(yōu)勢的OXC設(shè)備,意味著低效投資,降低科技企業(yè)的抗風(fēng)險能力。

MEMS-OXC設(shè)備在智算集群中的落地效果并不顯著,解決不了網(wǎng)絡(luò)可用度問題,引入OXC會影響到AI算力的傳輸與供給,進(jìn)而阻礙AI訓(xùn)練、AI推理等業(yè)務(wù)的韌性開展。

更需要警惕的是,對OXC路線的炒作,可能導(dǎo)致國內(nèi)智算錯過對其他技術(shù)路線的探索。由此帶來的機會成本,是無法估量的。

所以,只能作為自動配線架的OXC,并不適合成為智算中心組網(wǎng)的選擇,在智算場景沒有未來。眼下,中國智算產(chǎn)業(yè)真正該做的,是把自身在成熟交換技術(shù)、現(xiàn)有寶貴資源、產(chǎn)業(yè)智能化機遇等方面的核心優(yōu)勢,進(jìn)一步發(fā)揮好。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國移動王曉云:6G已經(jīng)進(jìn)入面向產(chǎn)業(yè)技術(shù)創(chuàng)新的全新階段
精彩專題
2024中國算力大會
2024年國際信息通信展
中國信科亮相2024年國際信息通信展
第25屆中國國際光電博覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像