首頁|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁 >> 人工智能 >> 正文

專注AI專用處理器,Habana欲“群戰(zhàn)”CPU與GPU

2019年6月27日 07:31  CCTIME飛象網(wǎng)  作 者:魏德齡

飛象網(wǎng)訊(魏德齡/文)Goya(戈雅)、Gaudi(高迪),Habana用兩款以西班牙藝術(shù)家名字命名的人工智能專用處理器向媒體展示了其強(qiáng)大的AI性能、優(yōu)秀的功耗,Habana表示做產(chǎn)品如同做藝術(shù),這樣的命名方式代表了藝術(shù)與科技的結(jié)合。也許就像是戈雅在繪畫藝術(shù)史中的承前啟后,高迪對(duì)于建筑的創(chuàng)造引領(lǐng),Habana也準(zhǔn)備將人工智能處理器帶入到新的階段,挑戰(zhàn)CPU與GPU在人工智能領(lǐng)域的固有地位。

發(fā)布九個(gè)月性能依舊領(lǐng)先的Goya

早在2018年9月,Habana便推出了Goya處理器,一款基于PCIE,主要用于人工智能推理和預(yù)測(cè)的傳統(tǒng)服務(wù)器產(chǎn)品。而時(shí)至今日,這款已經(jīng)發(fā)布了9個(gè)月的產(chǎn)品依舊在市場(chǎng)上具有領(lǐng)先的性能。根據(jù)當(dāng)時(shí)RokResNet-50模型上的測(cè)試顯示,Goya的圖片處理性能是普通CPU的近10倍,是英偉達(dá)Tesla T4的3倍之多,同時(shí)在能耗與延時(shí)上也都更具優(yōu)勢(shì),Goya的延時(shí)僅為1.01ms,幾乎可以實(shí)現(xiàn)實(shí)時(shí)處理圖片的效果。

同樣,在美國(guó)知名處理器評(píng)論雜志Microprocessor Report給出性能比較結(jié)果中,Goya的性能指數(shù)也同樣三倍于英偉達(dá)Tesla T4。

由于Goya展現(xiàn)出的很好的低延遲特性,也讓云計(jì)算廠商在將GPU計(jì)算資源租給其他用戶時(shí),可以做到單卡資源被多個(gè)用戶共享,在保證用戶體驗(yàn)的同時(shí),還能做到高算力、低成本與可共享。

另外,Goya解決方案涉及完整的硬件與軟件棧,通過Synapse AI可以方便客戶完成定制化的工作,其中包括高性能圖表編譯器、數(shù)百個(gè)核心圖書室和與軟件框架整合必需的工具,客戶可用來優(yōu)化人工智能推理的部署。這也使其十分適合業(yè)內(nèi)要求最苛刻的人工智能應(yīng)用,包括私有與云端數(shù)據(jù)中心、自動(dòng)駕駛汽車、工廠和倉(cāng)庫(kù)自動(dòng)化機(jī)器人和高端無人機(jī)等。

 

挑戰(zhàn)GPU AI訓(xùn)練地位的Gaudi

2019年6月19日,Habana在繼去年11月獲得英特爾領(lǐng)投的7500萬美元的B輪投資后,宣布推出主要用于人工智能訓(xùn)練的Gaudi處理器,新產(chǎn)品同樣具備了秒殺GPU的性能優(yōu)勢(shì),基于Gaudi的訓(xùn)練系統(tǒng)可以實(shí)現(xiàn)比擁有相同數(shù)量的GPU高4倍的處理能力。

Gaudi的性能依然做到了行業(yè)第一,在ResNet-50模型上可以提供每秒1650張的圖片處理能力,功耗僅為150w左右。而英偉達(dá)Tesla V100在此測(cè)試的處理能力為600張,功耗為300w。在Gaudi與Tesla V100拓展能力的ResNet-50模型測(cè)試中,同樣使用700個(gè)處理器的情況下,Gaudi的計(jì)算能力也能達(dá)到V100的3.8倍。

此前,英偉達(dá)創(chuàng)始人兼CEO黃仁勛曾經(jīng)在發(fā)布會(huì)中談到過選擇RDMA技術(shù)的緣由,隨后英偉達(dá)還以70億美元收購(gòu)了以色列芯片制造商Mellano,其中正是看中了這家公司的RDMA技術(shù),以此來為該公司的人工智能業(yè)務(wù)助力。

“我們認(rèn)為最好的方法就是在以太網(wǎng)上支持,在傳統(tǒng)以太網(wǎng)上支持RDMA,所以我們也是在這個(gè)觀點(diǎn)上我們跟英偉達(dá)是一致的!盚abana首席商務(wù)官Eitan Medina首先對(duì)于這樣的技術(shù)思路表示贊同,但隨即他又稱:“但是我們跟英偉達(dá)做得不一致的方面是直接在單一芯片當(dāng)中集成了十個(gè)支持RDMA的端口,而傳統(tǒng)的V100要支持RDMA,必須要通過一個(gè)PCIE的交換,在外面再接一個(gè)支持RDMA的網(wǎng)卡,這樣才能實(shí)現(xiàn)RDMA的功能!

Gaudi上集成了RDMA over Converged Ethernet (RoCE v2) 功能,讓人工智能系統(tǒng)能夠使用標(biāo)準(zhǔn)以太網(wǎng)擴(kuò)展至任何規(guī)模。憑借Gaudi處理器,Habana Labs的客戶亦可利用標(biāo)準(zhǔn)以太網(wǎng)交換進(jìn)行人工智能訓(xùn)練系統(tǒng)的縱向擴(kuò)展和橫向擴(kuò)展。同時(shí),以太網(wǎng)交換機(jī)已被數(shù)據(jù)中心應(yīng)用于計(jì)算系統(tǒng)和存儲(chǔ)系統(tǒng)的擴(kuò)展中,在速度和端口數(shù)方面可提供幾乎無限的可擴(kuò)展性。另外,與Habana的標(biāo)準(zhǔn)設(shè)計(jì)相比,基于GPU的系統(tǒng)依賴于專有的系統(tǒng)接口,對(duì)系統(tǒng)設(shè)計(jì)人員來說,這從本質(zhì)上限制了可擴(kuò)展性和選擇性。

Habana還通過HLS-1系統(tǒng)將靈活性交給了客戶,可以由客戶選擇自己所希望的CPU的服務(wù)器到底是什么類型的。該系統(tǒng)對(duì)外提供PCIE接口,同時(shí)還提供24個(gè)100G以太網(wǎng)接口,主處理器由客戶自行選擇,CPU服務(wù)器只要通過PCIE的線即可與HLS-1系統(tǒng)對(duì)接。該系統(tǒng)相比于英偉達(dá)DGX-1的優(yōu)勢(shì)在于解決了NVLink專有協(xié)議只能在兩個(gè)芯片間互聯(lián)的問題,避免存在的內(nèi)部互聯(lián)阻塞,不再依賴于DGX-1僅有的四個(gè)100G以太網(wǎng)端口,同時(shí)避免數(shù)據(jù)通訊在PCIE總線上復(fù)用是造成的傳輸性能損失。

 

人工智能專用處理器的優(yōu)勢(shì)

據(jù)悉,截止去年年底大概有90%以上的公司還在選擇將人工智能的推理和預(yù)測(cè)使用CPU平臺(tái),而在訓(xùn)練場(chǎng)景中,GPU則占據(jù)著一定的市場(chǎng)份額。而Habana的產(chǎn)品則主要分為推理預(yù)測(cè)和訓(xùn)練這兩個(gè)類別,當(dāng)針對(duì)推理和預(yù)測(cè)的Goya、針對(duì)訓(xùn)練的Gaudi這樣的人工智能專用處理器的出現(xiàn),更高性能、更低功耗的專用處理器產(chǎn)品將會(huì)同時(shí)挑戰(zhàn)CPU與GPU在原有人工智能領(lǐng)域的份額。

而從目前產(chǎn)品的技術(shù)參數(shù)來看,Goya、Gaudi已經(jīng)展現(xiàn)出了專屬于人工智能而進(jìn)行設(shè)計(jì)的優(yōu)勢(shì),這兩款產(chǎn)品均僅采用了16nm工藝,并未陷入到目前CPU、GPU對(duì)于10nm、7nm的工藝攀比中,而是通過專門針對(duì)人工智能而設(shè)計(jì)的架構(gòu)來獲得性能上的巨大優(yōu)勢(shì),同樣也能在功耗上獲得領(lǐng)先優(yōu)勢(shì)。

Eitan Medina表示:“Habana的主要目的就是未來在人工智能芯片領(lǐng)域做這個(gè)產(chǎn)業(yè)的領(lǐng)導(dǎo)者!睋(jù)了解,目前Habana已經(jīng)擁有150名來自于處理器、DSP、系統(tǒng)設(shè)計(jì)以及網(wǎng)絡(luò)設(shè)計(jì)等知名公司的專職員工,并且這個(gè)數(shù)字還在不斷增長(zhǎng),其中不少員工都有20年以上的DSP和處理器領(lǐng)域的經(jīng)驗(yàn)。

據(jù)悉,Habana將會(huì)把處理器能力、網(wǎng)絡(luò)計(jì)算能力、系統(tǒng)設(shè)計(jì)能力、軟件平臺(tái)能力集中整合,最終給客戶提供一個(gè)非常靈活和完整的系統(tǒng)。目前,Habana已經(jīng)擁有不少數(shù)據(jù)中心類的客戶,同時(shí)一些如自動(dòng)駕駛類的其它場(chǎng)景客戶也正在增加。

編 輯:值班記者
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張?jiān)泼鳎捍蟛糠謬?guó)家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動(dòng) 共筑信息保障堤壩
2023MWC上海世界移動(dòng)通信大會(huì)
中國(guó)5G商用四周年
2023年中國(guó)國(guó)際信息通信展覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像