飛象網(wǎng)訊(高靖宇/文)近年來手機產(chǎn)業(yè)發(fā)展進入創(chuàng)新期,手機廠商正試圖尋找新的差異化出路。特別今年以來,隨著ChatGPT的橫空出世和全民級應用發(fā)展趨勢,眾多手機廠商紛紛入局AI大模型賽道,成為當下最火熱的技術賽道。
而在這場大模型競賽中,vivo顯然走在了前列。11月1日,在2023 vivo開發(fā)者大會上,vivo正式發(fā)布自研藍心大模型BlueLM、OriginOS 4、自研藍河操作系統(tǒng)BlueOS。其中,藍心大模型是vivo自研通用大模型矩陣,從開源到完全自研歷時6年,包括十億、百億、千億三個不同參數(shù)量級的5款自研大模型,全面覆蓋核心應用場景,并將大模型矩陣能力全面融入到OriginOS 4。這意味著,vivo端側大模型已從前沿技術探索進入到應用和產(chǎn)業(yè)級落地新階段。
大模型與手機結合之后,智能手機又有了新敘事,為未來智能手機發(fā)展探索出新方向。vivo副總裁、OS產(chǎn)品副總裁周圍預判,未來手機的發(fā)展趨勢或將進化為“智能體”。
如何將大模型裝入手機?答案是:端云協(xié)同
通過類似ChatGPT、文心一言的APP就能使用大模型,為什么還要把大模型裝入到手機端側呢?這是因為,與單純在云端部署生成式 AI 應用和服務相比,手機終端側部署生成式 AI 可以實現(xiàn)在設備端運行復雜的AI算法,從而減少對云端服務的依賴,個人私密信息也不用上傳的云端,保障數(shù)據(jù)安全。此外,手機可以更好地理解和響應用戶的需求,從而滿足用戶對更加智能化手機的期待。
那么,大模型千億級的參數(shù)量如何在手機上流程運行,此時端云協(xié)同的混合架構就成為關鍵。vivo的藍心大模型包含有10億、70億、700億、1300億、1750億五種參數(shù)規(guī)模,其中10億量級模型是主要面向端側場景打造的專業(yè)文本大模型,具備本地化的文本總結、摘要等能力。70億模型是面向手機打造的端云兩用模型,具有優(yōu)秀的語言理解、文本創(chuàng)作能力,同時,上述兩個量級的模型支持高通和MTK最新旗艦雙平臺端側化部署,在保證數(shù)據(jù)安全的同時,在出詞速度、響應時間、內存占用等方面也非常優(yōu)秀,實現(xiàn)了安全與性能的雙重并舉。
vivo同時在做的有10億、70億、700億、1300億、1750億五種參數(shù)規(guī)模的藍心大模型,其中10億和70億已經(jīng)可以由本地算力支撐,而更大的數(shù)據(jù)仍然需要運行在云端。為此,vivo并不會強制用戶必須使用端側或者云端,而是交給用戶自己去選擇,比如隱私保密性不需要那么高的輸入法等功能,可以選擇在云端運行,而公司文件、相冊等,就可以利用手機本身的算力來完成。
700億模型是面向云端服務的主力模型,其綜合能力,在C-Eval、CMMLU、SuperCLUE(10月)等榜單中均處于中文大模型的第一梯隊。另外1300億、1750億模型也將在更復雜的場景中以更豐富的知識和推理能力為用戶帶來更專業(yè)的智能體驗。
除了與云端協(xié)作,手機大模型還面臨算法和算力的挑戰(zhàn)。vivo整個團隊花了六年多時間不斷解決問題,在算法方面,在預訓練階段,vivo利用最前沿的Transformer架構,改良了注意力機制、位置編碼等關鍵模塊,并在包含了3.3萬億詞的大規(guī)模多語言數(shù)據(jù)集上進行訓練,最終使得藍心大模型具備了超強的基礎能力。算力上,vivo也在積極通過信息技術應用創(chuàng)新去解決算力問題,組建了一只150人的工程團隊,持續(xù)地提升集群的效率,目前vivo千億模型訓練周期低于2個月,百億模型不到2周。
目前,vivo構建了超過100萬條高質量的多語言多任務指令數(shù)據(jù)進行學習和訓練,從而讓藍心大模型更好地理解用戶的意圖,適應各種目標任務。并在安全部署中通過了中國信通院內容審核服務系統(tǒng)評測,在文本、語音和視頻內容識別需要檢測的15個大類中,14個大類獲得最高的5星等級,1個獲得4星等級。
全新OriginOS 4,讓手機越用越好用
在本次發(fā)布會上,vivo帶來了全新升級的OriginOS4,它將大模型能力與系統(tǒng)結合,打造“1+2+N”智能系統(tǒng)體驗,藍心小V則是具體的應用呈現(xiàn)。
與傳統(tǒng)AI應用相比,藍心小V擁有更為自然的人機交互方式,強大的自然對話能力、信息處理能力以及洞察能力,不僅支持通過語音、文字、拖拽等方式接受并處理信息數(shù)據(jù),還可以針對不同問題以合適的形式進行信息呈現(xiàn),這些讓它能夠像一位專屬私人助理一般,在自然交流中幫助用戶完成找文件、搜照片、總結歸納信息、快捷創(chuàng)建日程等操作,帶來更加智慧便捷的AI體驗。
為了讓大模型在用戶端得到廣泛應用,vivo還推出了可在任意手機安裝的藍心千詢APP,具備同樣強大的自然對話能力和信息處理能力,而與藍心小V不同的是,藍心千詢完全基于云端大模型處理任務,不會涉及用戶隱私數(shù)據(jù)。
此外,針對硬件配置較低的終端設備,vivo推出了一個全新的操作系統(tǒng)——藍河BlueOS,它從全棧視角進行了高性能架構設計,例如,在編程語言、運行時Runtime、系統(tǒng)調度、框架、顯示和內存等技術方向取得了技術突破,能支持藍河操作系統(tǒng)流暢地運行在各種配置的設備上。而在智慧層面,它結合了先進的AI大模型,接入藍心大模型的多模態(tài)能力。
據(jù)vivo介紹,藍河操作系統(tǒng)首發(fā)將落地vivo Watch3搭載。用戶可以通過語音的方式,基于AI能力,個性化地創(chuàng)作手表表盤。
目前AI大模型在手機端側的應用還在起步階段,但卻是未來必爭的技術高地。根據(jù)IDC預測,到2026年,中國市場中近50%的終端設備的處理器將帶有AI引擎技術。這意味著,手機廠商擁有AI大模型的能力將變得越來越重要。而vivo布局大模型絕非“蹭熱點”,歷經(jīng)六年的蓄勢,vivo通過“1+2+N”的智能系統(tǒng)將大模型能力在終端側全面釋放,讓AI有機會走入千家萬戶,為每一位用戶帶來更加智慧且貼心的體驗。