11月30日,中國互聯網絡信息中心(CNNIC)在第五屆中國互聯網基礎資源大會上發(fā)布了《生成式人工智能應用發(fā)展報告(2024)》。
生成式人工智能(Generative Artificial Intelligence,簡稱GAI)是基于算法、模型、規(guī)則生成文本、圖片、聲音、視頻、代碼等內容的人工智能技術分支。
報告中提到,我國對人工智能技術發(fā)展一直予以高度關注,尤其自2023年生成式人工智能概念興起至今,國產生成式人工智能大模型如雨后春筍般涌現。截至目前,我國已初步構建了較為全面的人工智能產業(yè)體系,相關企業(yè)超過4500家,核心產業(yè)規(guī)模已接近6000億元人民幣,產業(yè)鏈覆蓋芯片、算法、數據、平臺、應用等上下游關鍵環(huán)節(jié)。
截至2024年7月,我國完成備案并上線、能為公眾提供服務的生成式人工智能服務大模型已達190多個,我國以大模型為代表的人工智能普及率達16.4%。百度的文心大模型、阿里的通義大模型、騰訊的混元大模型、字節(jié)跳動的豆包大模型、華為的盤古大模型、月之暗面的“Kimi智能助手”等生成式人工智能產品紛紛上線,為用戶提供了豐富的選擇空間和差異化的用戶體驗。
截至2024年6月,我國有3.5億人表示自己聽說過生成式人工智能產品,占整體人口的24.8%;有2.3億人表示自己使用過生成式人工智能產品,占整體人口的16.4%。針對網民具體使用的生成式人工智能產品進行調查發(fā)現,截至2024年6月,國產生成式人工智能產品在網民中更加廣泛;而海外產品,比如OpenAI、谷歌等大型科技企業(yè)的生成式人工智能產品在國內也擁有一定規(guī)模的用戶。
通過整理國家互聯網信息辦公室發(fā)布的《生成式人工智能服務已備案信息》中的產品備案屬地可以發(fā)現,截至2024年11月,我國共有309個生成式人工智能產品完成備案,北京、上海、廣東三省的生成式人工智能備案產品數量占比分別達到31.1%、27.2%和11.7%。
數據顯示,2024年前三個季度,我國共發(fā)生504起與人工智能相關的投融資事件,合計金額約812億元。在民間資本的推動下,人工智能初創(chuàng)企業(yè)如雨后春筍般涌現。據全國組織機構統(tǒng)一社會信用代碼數據服務中心統(tǒng)計,2024年上半年我國人工智能企業(yè)數量同比增長35.65%。
通過對2024年1-9月人工智能投融資事件的細分領域進行整理可以發(fā)現,從投融資事件的數量來看,投資于人工智能自身應用、投資于其他傳統(tǒng)行業(yè)應用的投融資事件數量相同,均為138筆,占比均為27.4%;投資于機器人相關領域的投融資事件數為119筆,占比為23.6%;投資于人工智能硬件與技術的投融資事件數為79筆,占比為15.7%。
智能體是指能夠感知環(huán)境并采取行動以實現特定目標的實體,其運作機制包括理解、規(guī)劃、反思和進化,能讓機器像人一樣思考和行動,自主調用工具完成復雜任務。智能體的最大特點是自主性,即在無需人類干預的情況下,根據外部傳感器或數據輸入自主做出決策并執(zhí)行相應動作。這一特點使得智能體能夠適應多變的環(huán)境,更高效、更智能地執(zhí)行任務。
在企業(yè)端,各行各業(yè)都在積極擁抱生成式人工智能帶來的智能化升級浪潮。在交通、能源、制造、化工等多個領域,高科技企業(yè)與傳統(tǒng)行業(yè)積極進行合作,投入大量資源,共同研發(fā)各行業(yè)專用的生成式人工智能大模型,探索如何利用這項新興技術賦能實體經濟創(chuàng)新發(fā)展。在2023年底開展的一項針對全球16個國家的企業(yè)管理人員調查中,79%的受訪者預計生成式人工智能將在三年內為組織和行業(yè)帶來實質性變革,其中近三分之一的受訪者預計實質性變革將在當下(14%)或不到一年內(17%)發(fā)生。
多模態(tài)能力是顯著拓寬生成式人工智能應用領域的重要因素。通過整合文本、圖像、語音和視頻等不同數據類型,生成式人工智能大模型可以實現對各類信息的深層理解和聯動。多模態(tài)能力賦予大模型更高的靈活性和適應性,使其能夠在復雜的現實場景中提供更精準的解決方案,從而推動行業(yè)的深刻變革。多模態(tài)大模型能夠更好地處理噪聲和數據缺失。如果一種模態(tài)不可靠或不可用,系統(tǒng)可以依靠其他模態(tài)來維持性能。
報告中認為,數據資源是訓練生成式人工智能產品的“養(yǎng)料”,因此加快國內數據生態(tài)建設、產出高質量的數據資源,是推動生成式人工智能發(fā)展的另一項重要工作。
一是建立公共數據利用制度。要統(tǒng)籌發(fā)展和安全,兼顧效率與公平,提高我國公共數據資源的開發(fā)利用水平。通過建立國家級大數據平臺,促進數據的合法合規(guī)共享,打破行業(yè)壁壘,實現公共數據資源的整合與開放。
二是激發(fā)產業(yè)活力。鼓勵產學研合作,共同構建標注詳盡的專用數據集,特別是在醫(yī)療、金融、教育等專業(yè)領域,通過政府引導資金支持數據集建設項目,同時考慮利用眾包和技術社區(qū)力量,發(fā)動技術社區(qū)用戶參與數據標注,擴大數據覆蓋范圍。
三是保障數據安全。完善數據隱私相關的法規(guī)制度,探索隱私計算等新興技術的應用前景,確保數據資源在訓練人工智能產品的過程中能夠保護國家安全和個人隱私,增強數據收集和使用的合法性和可靠性。