飛象網(wǎng)訊(魏德齡/文)隨著ChatGPT的風(fēng)靡,讓很多人發(fā)現(xiàn)AI離自己如此之近,流暢的外文翻譯、包含從1-4的簡(jiǎn)單小作文,一下讓AI從只聞其聲,不見(jiàn)其影的高科技,變身為觸手可及的生活小助手。
其實(shí)AI在手機(jī)上的應(yīng)用并非什么新鮮事,很多年前當(dāng)用戶(hù)打開(kāi)攝像頭,界面中就能識(shí)別出拍攝物體的種類(lèi),其中就有AI的一份功勞。然而這種能力并未讓用戶(hù)感到不可或缺,或是能為工作與生活帶來(lái)質(zhì)的改變。
但今年以來(lái)Stable Diffusion在智能手機(jī)上的功能演示,卻無(wú)疑帶來(lái)了更多遐想。
體驗(yàn)迎來(lái)新契機(jī)
作者頭一陣恰好體驗(yàn)了運(yùn)行在A(yíng)ndroid手機(jī)上的Stable Diffusion終端側(cè)演示,僅僅通過(guò)一臺(tái)與目前市面上主流旗艦手機(jī)配置相當(dāng),搭載第二代驍龍8機(jī)型的手機(jī),通過(guò)輸入一段文本描述后,等待約10多秒鐘左右,就能眼見(jiàn)其從模糊到清晰的創(chuàng)作出一張圖畫(huà)。
整個(gè)過(guò)程完全在終端側(cè)運(yùn)行,無(wú)需借助云端的AI算力。要知道,如今以ChatGPT為代表的云端計(jì)算壓力可謂不小,登陸暫緩都是常有的事,為此不少高粘性用戶(hù)則開(kāi)始選擇購(gòu)買(mǎi)更高階的會(huì)員。但對(duì)于普通用戶(hù)來(lái)說(shuō),其對(duì)功能的要求,可能不至于非要每月花上20美元。
在Stable Diffusion終端側(cè)演示中,高通從Hugging Face的FP32 1-5版本開(kāi)源模型入手,通過(guò)量化、編譯和硬件加速進(jìn)行優(yōu)化,使其能在搭載第二代驍龍8移動(dòng)平臺(tái)的手機(jī)上運(yùn)行。通過(guò)全棧優(yōu)化最終讓Stable Diffusion能夠在智能手機(jī)上運(yùn)行,在15秒內(nèi)執(zhí)行20步推理,生成一張512x512像素的圖像。這是在智能手機(jī)上最快的推理速度,能媲美云端時(shí)延,且用戶(hù)文本輸入完全不受限制。
蘋(píng)果公司在去年年底同樣在 macOS 13.1 和 iOS 16.2 中發(fā)布了針對(duì) Stable Diffusion 的 Core ML 優(yōu)化,并通過(guò)一個(gè)代碼庫(kù)對(duì)部署過(guò)程進(jìn)行了詳細(xì)講解。在三款蘋(píng)果設(shè)備(M1 iPad Pro 8GB、M1 MacBook Pro 16GB、M2 MacBook Air 8GB)上的測(cè)試結(jié)果表明,蘋(píng)果推出的相關(guān)優(yōu)化基本可以保證最新版 Stable Diffusion(SD 2.0)在半分鐘內(nèi)生成一張同樣分辨率為512x512像素的圖。這無(wú)疑也為未來(lái)蘋(píng)果將Stable Diffusion功能在自家設(shè)備中實(shí)現(xiàn)本地化運(yùn)行奠定了基礎(chǔ)。
正在凸顯的手機(jī)AI能力
實(shí)際上,目前移動(dòng)端的AI能力已經(jīng)在一些工作上凸顯出來(lái)。例如在iPad上擁有很多摳取視頻中圖像的App,以往這項(xiàng)在電腦端需要較大精力的工作,借助搭載M1/M2芯片iPad上的神經(jīng)網(wǎng)絡(luò)引擎,能夠輕松的對(duì)目標(biāo)圖像進(jìn)行摳取,并實(shí)現(xiàn)相關(guān)特效效果。進(jìn)而致使很多人開(kāi)始使用iPad先行制作一些特效,然后再將素材傳輸至電腦端與其他素材一并進(jìn)行二次剪輯。
以M1芯片為例,相較于蘋(píng)果之前所采用的處理器,機(jī)器學(xué)習(xí)的速度提升了15倍,這源于蘋(píng)果專(zhuān)門(mén)為其加入了神經(jīng)網(wǎng)絡(luò)引擎,采用16核架構(gòu),每秒能進(jìn)行 11 萬(wàn)億次運(yùn)算。在運(yùn)行視頻分析、語(yǔ)音識(shí)別以及圖像處理等任務(wù)時(shí)的處理速度都能實(shí)現(xiàn)明顯提升。
以驍龍8系處理器為代理的Android陣營(yíng),在近年來(lái)的AI能力同樣在翻倍提升。上文中能夠流暢運(yùn)行Stable Diffusion本地演示的第二代驍龍8,其AI 引擎的主要組成部分Hexagon 處理器專(zhuān)門(mén)升級(jí)了微切片推理和更大的張量加速器,采用專(zhuān)用供電系統(tǒng),并首次在手機(jī)端實(shí)現(xiàn) INT4 精度格式的支持,因此在 AI 推理時(shí)性能最多可以提高4.35倍,能效提升60%。新增的微切片推理功能,恰恰能夠幫助Stable Diffusion等大型模型高效運(yùn)行。
愛(ài)奇藝出品的真人秀節(jié)目《元音大冒險(xiǎn)》中則展現(xiàn)出了AI說(shuō)帶來(lái)的全新體驗(yàn)提升,在節(jié)目攝制中,借助搭載驍龍旗艦手機(jī)所支持的高通AI引擎,及其專(zhuān)門(mén)面向AI神經(jīng)網(wǎng)絡(luò)的硬件加速單元等技術(shù)的支持下,僅僅通過(guò)一個(gè)頭盔及一部搭載驍龍芯片的智能手機(jī),即可將所有的細(xì)節(jié)、場(chǎng)景、表情精準(zhǔn)地映射至“元音大陸”中。據(jù)悉,驍龍8系移動(dòng)平臺(tái)搭載高通AI引擎,具備行業(yè)領(lǐng)先的終端側(cè)AI性能和能效比,可以支持基于300個(gè)人臉特征點(diǎn)的檢測(cè),在為節(jié)目制作提供強(qiáng)有力的支持和保障同時(shí),也降低了節(jié)目制作的技術(shù)門(mén)檻與成本。
在PC設(shè)備更新?lián)Q代頻率早就遠(yuǎn)遠(yuǎn)落后于智能手機(jī)的當(dāng)下,智能手機(jī)的本地AI能力將更加凸顯,實(shí)時(shí)了解到智能用戶(hù)在拍什么的AI,實(shí)現(xiàn)了比相機(jī)更加優(yōu)秀的成像效果。對(duì)圖形的理解能力,造就了比電腦更強(qiáng)的視頻創(chuàng)作能力,方便好用的邊緣側(cè)AI能力正在到來(lái)。
方便好用的邊緣側(cè)AI能力
近期,借助AI接口所開(kāi)發(fā)的小型應(yīng)用不斷涌現(xiàn),相比于登陸賬號(hào)、問(wèn)問(wèn)題的方式,將功能聚焦在了如文章翻譯這一熱門(mén)使用場(chǎng)景,用戶(hù)可以通過(guò)App像使用以往的那些翻譯應(yīng)用一樣,快速進(jìn)行使用,且在準(zhǔn)確率與流暢度上有了大幅提升。
對(duì)于云端AI計(jì)算而言,其所面向的用戶(hù)群更多為企業(yè)或研究機(jī)構(gòu),針對(duì)藥物研發(fā)、基因工程、數(shù)字孿生模擬等行業(yè)領(lǐng)域,都需要超強(qiáng)的算力作為保障,才能在更短的時(shí)間內(nèi),獲得研究人員想要的結(jié)果。而普通用戶(hù)使用頻次更高的語(yǔ)音轉(zhuǎn)文字、翻譯、文章或圖畫(huà)創(chuàng)作,通過(guò)邊緣側(cè)AI能力,能夠獲得更快的響應(yīng)速度,擺脫了部分云連接的束縛,整體體驗(yàn)也能獲得更好的提升。
有業(yè)內(nèi)人士預(yù)計(jì),今年年底或明年年初,消費(fèi)市場(chǎng)將會(huì)為了獲得更強(qiáng)的AI能力而購(gòu)買(mǎi)新的終端產(chǎn)品,AI將引爆新的終端需求。于此同時(shí),今年的芯片產(chǎn)品也將繼續(xù)在A(yíng)I性能上實(shí)現(xiàn)更大幅度的升級(jí),來(lái)滿(mǎn)足圍繞AI而產(chǎn)生的相關(guān)用例的爆發(fā)。
試想一下,未來(lái)用戶(hù)通過(guò)手機(jī)就能自動(dòng)生成一個(gè)有趣的配圖,用于社交媒體內(nèi)容、文章配圖、工作演示等不同用途。這些功能又需要以移動(dòng)設(shè)備的本地AI能力作為依托,用戶(hù)為了加速十多秒的等待,可能會(huì)購(gòu)置更強(qiáng)AI性能的手機(jī),或許目前智能手機(jī)的需求瓶頸將通過(guò)AI得以解決。