飛象網(wǎng)訊(魏德齡/文)這個冬天,無論是電腦還是手機,端側AI能力都成為電子產(chǎn)品的新促銷點,無需連接網(wǎng)絡就能讓本地產(chǎn)品獲得如同ChatGPT般的能力,并且通過對于模型與算法的優(yōu)化,還能獲得極快的響應速度。
然而,只要嘗試在本地設備中部署AI能力后,就能發(fā)現(xiàn),端側AI很好很強大,但有些對于普通消費者來說的隱憂,廠商并沒有主動提及。
吃緊的硬盤空間
如今,硬盤空間無疑成為了廠商在銷售電子產(chǎn)品時,獲得更高價格空間的重要手段。很多用戶往往無法選擇購買最低硬盤空間的起售價格產(chǎn)品。以智能手機為例,最低的起售價格,往往意味著128GB/256GB的存儲空間,對于喜歡玩游戲或拍攝視頻的用戶來說,這樣的空間往往捉襟見肘。
不少大型游戲動輒30GB左右,隨著蘋果開始在手機側布局3A大作,未來這一趨勢還將愈發(fā)明顯。而隨著手機攝像頭像素的提升,支持的視頻格式愈發(fā)高階,在給用戶帶來更高畫質(zhì)、更多后期可調(diào)空間的情況下,也讓存儲空間更加吃緊,甚至在iPhone 15 Pro系列中,如果想拍攝4K的ProRes視頻就必須外接固態(tài)硬盤。
端側AI的實現(xiàn)除了需要在本地設備中安裝可執(zhí)行的應用程序與環(huán)境,更重要的是需要配置好對應相關任務的模型,以目前無論是PC還是手機廠商都喜歡進行演示的Stable Diffusion為例,內(nèi)置的模型就至少需要7GB的空間,完整版為15GB,而如果用戶對于相關畫風、細節(jié)有要求,甚至是希望生成出Gif動畫效果,同樣需要再下載其它模型。一套讓端側設備實現(xiàn)文字生圖能力的應用,在安裝完成后所占據(jù)的空間,很可能與一款大型游戲不相上下。
同理,若想實現(xiàn)類似于ChatGPT般的對話式助理功能,一個容量為20GB以上的模型同樣少不了。才能有望讓PC或手機成為用戶的本地工作生活助理,在無需網(wǎng)絡依賴的情況下,具備撰寫簡單的文檔、回答相關問題,或是規(guī)劃旅行日程等能力。
系統(tǒng)臃腫的隱憂
對于玩過大型游戲的用戶來說,每次版本迭代時的更新無疑都會經(jīng)歷一個漫長的過程,而如果手機或PC廠商將本地AI能力與自身操作系統(tǒng)相結合,由于其所占據(jù)的較大硬盤空間,無疑將會讓操作系統(tǒng)本身的容量變得較為臃腫。
小米14系列發(fā)布會上曾經(jīng)公布了這樣一張標注有手機固件大小的PPT,友商A、B、C、D的固件大小容量分別為11.36GB、12.64GB、20.61GB、21.20GB。顯然,如果不對模型進行進一步精簡,手機操作系統(tǒng)只是簡單通過1+1的方式來融入端側AI能力的話,固件容量很可能將會翻升2-3倍。
這也就引出了另一個問題,本地AI模型同樣有著定期版本升級的特性,而一旦面臨升級,用戶將會面臨一個相對較長的下載與替換安裝過程。這一問題目前在工業(yè)互聯(lián)網(wǎng)領域已經(jīng)被業(yè)界所關注,隨著AI模型開始在智能制造領域的嘗試性部署,升級過程中的高數(shù)據(jù)量同樣會產(chǎn)生較長的設備更新時間。
質(zhì)量與能耗的取舍
盡管“1秒鐘”已經(jīng)成為了PC與手機廠商強調(diào)端側AI能力時的標配指標,然而廠商很少主動表示,1秒鐘所生成的圖片大小,PC一般為512*512,手機一般為256*256,這一分辨率對于如今的高分屏時代來說,其實有些過于小兒科。
但若想讓圖片的分辨率達到當下普遍接受的水平,則往往需要大量的GPU資源,對于筆記本或手機這類設備而言,一方面會產(chǎn)生不小的發(fā)熱量,另一方面等待時間也變得較為漫長,進而讓使用體驗大打折扣。
此外,“1秒鐘”本身也是模型與算法的雙重優(yōu)化結果,對于目前很多人所使用的模型而言,還無法實現(xiàn)“一秒鐘”的能力,20多秒的等待時間一般來說是常見的情況,而如果在此過程中,運算較為復雜,等待時間則會十分漫長,部分設備的發(fā)熱量同樣可以與運行大型游戲相媲美。
寫在最后
端側AI被業(yè)界視作是2024年挖掘電子產(chǎn)品消費新需求的突破口,不過這項技術才剛剛開始,離“成熟”二字無疑還有很長的道路,后續(xù)的快速迭代升級不可避免。