6月14日,2024北京智源大會(huì)在京舉行。全球領(lǐng)先真機(jī)實(shí)驗(yàn)成功率突破95%的泛化抓取技術(shù)、全球首個(gè)端到端基于視頻的多模態(tài)具身導(dǎo)航大模型NaVid、全球首個(gè)智能心臟超聲機(jī)器人等多項(xiàng)人工智能領(lǐng)域的創(chuàng)新成果集結(jié)亮相,引發(fā)業(yè)內(nèi)關(guān)注。
開幕式上,北京智源人工智能研究院院長王仲遠(yuǎn)作2024智源進(jìn)展報(bào)告,介紹了智源研究院在語言、多模態(tài)、具身、生物計(jì)算大模型領(lǐng)域的前沿探索和研究進(jìn)展,以及大模型全棧開源技術(shù)基座的迭代升級(jí)與版圖布局。
王仲遠(yuǎn)介紹,現(xiàn)階段語言大模型已具備一定的理解和推理能力,但這并不是讓人工智能感知、理解物理世界的終極技術(shù)路線。未來大模型將以數(shù)字智能體的形態(tài)與智能硬件融合,以具身智能的形態(tài)從數(shù)字世界進(jìn)入物理世界。
中關(guān)村科學(xué)城管委會(huì)副主任、海淀區(qū)副區(qū)長唐超表示,海淀區(qū)擁有一大批頂尖科學(xué)家和產(chǎn)業(yè)領(lǐng)軍人才,在產(chǎn)業(yè)發(fā)展方面,已基本形成芯片、框架、大模型、數(shù)據(jù)技術(shù)與處理服務(wù)等全產(chǎn)業(yè)鏈部署,集聚企業(yè)超千家,占全市的2/3、全國的1/6。海淀區(qū)將規(guī)劃全球首個(gè)人工智能街區(qū),以五道口和大鐘寺為先導(dǎo)區(qū),規(guī)劃53平方公里建設(shè)人工智能創(chuàng)新策源地和產(chǎn)業(yè)高地,強(qiáng)化產(chǎn)學(xué)研用一體化的協(xié)同創(chuàng)新。
在零一萬物、創(chuàng)新工場(chǎng)董事長李開復(fù)與清華大學(xué)智能產(chǎn)業(yè)研究院院長、智源學(xué)術(shù)顧問委員張亞勤的對(duì)話中,張亞勤歸納了大模型的“三個(gè)做對(duì)了”和“三個(gè)需改進(jìn)”。他說,規(guī)模定律、“Token-Based”(“基于詞元的機(jī)制”)、通用性是現(xiàn)階段大模型的正確選擇。與此同時(shí),當(dāng)前大模型也面臨效率低下、未能真正理解物理世界、邊界問題的挑戰(zhàn),有待進(jìn)一步解決。
人工智能技術(shù)正在加速進(jìn)步,產(chǎn)業(yè)進(jìn)入爆發(fā)期。百度首席技術(shù)官王海峰認(rèn)為,大模型為通用人工智能帶來曙光,可以從兩個(gè)角度解讀,一是人工智能技術(shù)的通用性,二是能力的全面性。從人工智能技術(shù)發(fā)展趨勢(shì)來看,未來幾年,規(guī)模定律依然有效,大語言模型仍有很大提升空間,多模態(tài)大模型會(huì)越來越好用,智能體技術(shù)逐漸成熟從而加速應(yīng)用爆發(fā)。
北京智源大會(huì)由北京智源人工智能研究院主辦,以“全球視野、思想碰撞、前沿引領(lǐng)”為特色,匯聚海內(nèi)外研究者分享研究成果、探尋前沿知識(shí)、交流實(shí)踐經(jīng)驗(yàn)。自2019年10月首度亮相至今,大會(huì)已成功舉辦5屆,成為國際人工智能交流的一張名片。