而要說2023年芯片領域什么最熱,故事還要從年初的ChatGPT開始,黃仁勛當時表示:“我們正處于AI的‘ iPhone 時刻’。”成就生成式AI的背后,自然是AI算力的支持。">
首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據|物聯(lián)網|量子|元宇宙|博客|特約記者
手機|互聯(lián)網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網|會展
首頁 >> 必讀 >> 正文

盤點2023|“iPhone時刻”引爆芯片需求,3nm來了

2023年12月26日 08:28  CCTIME飛象網  作 者:源初

飛象網訊(源初/文)2023年,全球芯片行業(yè)繼續(xù)保持增長態(tài)勢,根據國際半導體產業(yè)協(xié)會預測,2023年全球半導體銷售額將達到6860億美元,同比增長10.1%,5G、云計算、人工智能等新興應用的快速發(fā)展,推動了芯片需求的增長。

而要說2023年芯片領域什么最熱,故事還要從年初的ChatGPT開始,黃仁勛當時表示:“我們正處于AI的‘ iPhone 時刻’!背删蜕墒紸I的背后,自然是AI算力的支持。

“iPhone時刻”引爆芯片需求

2023年3月,英偉達宣布推出全新的H100 NVL計算加速卡,專為大型語言模型訓練(LLM)設計,性能更強。其搭載了兩個基于Hopper架構的H100芯片,頂部配備了三個NVLink連接器,在服務器里使用了兩個相鄰的PCIe全長插槽。H100 NVL計算卡的FP64計算性能為134TFLOPS,TF32計算性能為1979 TFLOPS,F(xiàn)P8計算性能為7916 TFLOPS,INT8計算性能為7916 TFLOPS,是H100 SXM的兩倍。其具有完整的6144位顯存接口,顯存速率可達5.1Gbps,意味著最大吞吐量為7.8TB/s,是H100 SM3的兩倍多。

年底,英特爾CEO 基辛格首次公開介紹第三代英特爾AI加速器Gaudi 3,它用于深度學習和大型生成式AI模型。英特爾計劃明年發(fā)布Gaudi 3,稱Gaudi 3的性能將優(yōu)于英偉達的主打AI芯片H100。據悉,Gaudi 3將于2024年推出,采用5nm制程,相較前代提供到達4倍的BFloat16 功能、2 倍的運算能力、1.5倍的網絡頻寬和1.5倍的HBM容量。

AMD也在年底正式發(fā)布兩款AI芯片旗艦產品,Instinct MI300X與MI300A。MI300X專為生成式AI智能算力設計的數(shù)據中心GPU,正面對標英偉達H100;MI300A則是專為超級計算機設計的APU產品。APU為AMD在2011年提出的升級版CPU概念,其將CPU和GPU組合在同一個晶片上,以滿足超級計算機高性能計算的要求。

 

端側AI卷起來

端側AI的概念也開始興起。今年5月,高通在線上發(fā)布了《混合AI是AI的未來》白皮書,梳理了高通在AI領域技術發(fā)展和應用趨勢方面的洞察,旨在與更多合作伙伴共同探索AI技術普惠之路。通過終端側AI算力與云端的結合,恰恰能夠解決目前生成式AI完全依靠云端而出現(xiàn)的各種隱憂。例如在功耗方面,如果在云端運行一個超過10億參數(shù)的生成式AI模型,可能需要數(shù)百瓦功耗的話,但在終端側運行需要的功耗僅有幾毫瓦。

高通在今年巴展期間所帶來的Stable Diffusion在Android終端上的演示為例,能夠在15秒內完成20步推理,生成包含細節(jié)的圖像,整個過程全部在本地化進行,即使手機設置成飛行模式,也能完成根據文字描述所進行的繪畫創(chuàng)作任務。這種特性既為用戶帶來了更加靈活高效的使用方式,又大大提升了隱私保護性。

驍龍峰會期間發(fā)布的第三代驍龍8移動平臺,NPU提升高達98%,能效提升40%。在AI表現(xiàn)上可實現(xiàn)本地運行100億參數(shù)的模型,面向70億參數(shù)大語言模型每秒生成高達20個token,實際應用中可在本地實現(xiàn)一秒內完成Stable Diffusion的圖片生成。同期發(fā)布的面向移動PC領域的驍龍X Elite,CPU+GPU+NPU結合而成的AI算力更是高達75TOPS,其中NPU算力高達45TOPS,AI處理速度是競品的4.5倍。

年底,英特爾在以“AI Everywhere”為主題的活動中發(fā)布酷睿Ultra移動處理器,英特爾為新CPU配備NPU提供“低功耗人工智能加速和CPU/GPU卸載”,專為在低功耗下長時間運行的AI工作負載而設計,與CPU 和GPU的AI功能相輔相成,與前代相比,能夠帶來2.5倍的能效表現(xiàn),能夠執(zhí)行人工智能驅動的任務,如背景模糊、眼動追蹤和圖片框架等。

聯(lián)發(fā)科的9300同樣搭載了基于硬件的生成式 AI 引擎,生成式 AI transformer 運算速度快 8 倍,2 倍整數(shù)和浮點運算速度,功耗較前一代降低 45%,最高可支持 330 億參數(shù)的 AI 大語言模型,支持 NeuroPilot Compression 內存硬件壓縮技術,生成式 AI 端側技能擴充技術。

 

3nm終于來了

相比于去年A16處理器的小修小補,蘋果伴隨iPhone 15 Pro系列推出的A17 Pro終于迎來臺積電3nm制程,擁有高達170億個晶體管,也成為了業(yè)界首款搭載3nm制程芯片的系列手機。A17 Pro芯片硬件加速光線追蹤的運行速度提升最高可達4倍,神經網絡引擎運行機器學習模型的速度提升最快可達2倍,每秒可執(zhí)行最高達35萬億次操作。

根據臺積電給出的數(shù)據顯示,3nm制程的邏輯密度將增加約70%,相同功耗下,速度提升10~15%,或于相同速度下,功耗降低25~30%。不過,臺積電3nm制程對于iPhone所帶來的使用體驗提升并不明顯?紤]到機身設計問題,也為iPhone 15 Pro系列帶來了散熱問題。

10月底,蘋果再次伴隨新款Macbook Pro系列發(fā)布采用3nm制程的M3系列芯片。蘋果表示M3在CPU性能上比M1快了35%。M3還配備了采用下一代架構的10核GPU,圖形性能比M1快65%。M3還支持高達 24G B 的統(tǒng)一內存和一臺外接顯示器。M3 Pro在單線程任務中,CPU性能比M1 Pro快30%。M3 Pro最高支持36GB統(tǒng)一內存。M3 Max擁有920億個晶體管和16核GPU,包括12個性能核心和4個效率核心,以及40核GPU,比M1 Max快50%。M3 Max最高支持128GB統(tǒng)一內存。M3 Max的GPU性能比M1 Max快80%。

展望2024年,全球芯片行業(yè)仍將保持增長態(tài)勢。 云計算、人工智能等新興應用的快速發(fā)展,將繼續(xù)推動高性能芯片的需求。預計在2024年,云計算、人工智能芯片的市場規(guī)模將達到3000億美元,同比增長15%。

編 輯:魏德齡
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構成任何投資及應用建議。如網站內容涉及作品版權和其它問題,請在30日內與本網聯(lián)系,我們將在第一時間刪除內容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
鄔賀銓:大模型下沉到手機 將激活萬億元規(guī)模手機產業(yè)
精彩專題
CES 2024國際消費電子展
2023年信息通信產業(yè)盤點暨頒獎禮
飛象網2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像