為期五天的“2024世界機(jī)器人大會(huì)”(WRC)剛剛落下帷幕。《中國(guó)經(jīng)營(yíng)報(bào)》記者從大會(huì)主辦方獲悉,近170家企業(yè)的600多款產(chǎn)品在大會(huì)上展示,首發(fā)新品超過(guò)60款,其中有27款人形機(jī)器人集中亮相,成為風(fēng)頭最盛的“主角”。大會(huì)參觀人數(shù)近25萬(wàn)人次。與此同時(shí),來(lái)自全球10余個(gè)國(guó)家的1.3萬(wàn)名選手參加了同期舉辦的“2024世界機(jī)器人大賽”。
與這些數(shù)據(jù)可以相互印證的是,記者連日在世界機(jī)器人大會(huì)現(xiàn)場(chǎng)采訪了多位來(lái)自高校、科研機(jī)構(gòu)、產(chǎn)業(yè)界的人士,同時(shí)在博覽會(huì)上隨機(jī)采訪了多名觀眾,大多數(shù)受訪者被問(wèn)及感受時(shí)使用了“熱”一詞:產(chǎn)業(yè)“火熱”,參與企業(yè)的產(chǎn)品數(shù)量創(chuàng)歷年紀(jì)錄;產(chǎn)品“熱鬧”,不僅形態(tài)各式各樣,而且技能從做咖啡、冰淇淋、煎餅果子,到疊衣服和收納物品,再到爬樓梯、做俯臥撐、打乒乓球等,以及參與汽車制造;觀眾“熱情”,表明機(jī)器人“出圈”獲得社會(huì)大眾的高度關(guān)注。
熱鬧與喧囂過(guò)后,擺在機(jī)器人尤其是人形機(jī)器人面前的依然是技術(shù)創(chuàng)新難題與商業(yè)化考驗(yàn):人形機(jī)器人現(xiàn)在究竟發(fā)展到何種程度了?它距離真正的爆發(fā)還有多遠(yuǎn)?
現(xiàn)階段只是“具身技能”
在世界機(jī)器人大會(huì)現(xiàn)場(chǎng),記者觀察了二十幾款公開展示的人形機(jī)器人產(chǎn)品。根據(jù)它們的現(xiàn)場(chǎng)演示及介紹,其“技能”大致都可以劃歸為兩類:一類是娛樂互動(dòng),比如EX機(jī)器人打造的“諾貝爾”“蘇軾”、星塵智能展示書法、智元機(jī)器人打招呼、帕西尼感知科技“比心”等;另一類是運(yùn)動(dòng)控制,比如科大訊飛(34.390, 0.80, 2.38%)機(jī)器人拿取可樂、優(yōu)必選Walker搬運(yùn)物品箱、逐際動(dòng)力爬坡行走、銀河通用收納物品等。
盡管具身智能已成為業(yè)內(nèi)耳熟能詳?shù)臒衢T詞,中關(guān)村(3.960, 0.04, 1.02%)智友研究院院長(zhǎng)、北京航空航天大學(xué)機(jī)器人研究所所長(zhǎng)王田苗教授指出,此次大會(huì)上展示的大部分機(jī)器人是垂直領(lǐng)域的“具身技能”,F(xiàn)階段,對(duì)于具身智能機(jī)器人或人形機(jī)器人,業(yè)界基本停留在通用領(lǐng)域的探索上。
在王田苗看來(lái),人形機(jī)器人還處在攻關(guān)階段,目前有兩個(gè)問(wèn)題值得特別關(guān)注:一是機(jī)器人的軟件,新一波具身智能的浪潮是由AI大模型、生成式AI來(lái)驅(qū)動(dòng)的,大模型如何賦能機(jī)器人,實(shí)現(xiàn)人機(jī)交互,將復(fù)雜任務(wù)拆解為子任務(wù);二是各種子任務(wù)和現(xiàn)實(shí)中的物理空間的結(jié)合,需要視覺模型、觸覺模型,沒有視覺就沒有空間的認(rèn)知與推理,沒有觸覺,則很難完成精細(xì)的操作。
以靈巧手為例,王田苗告訴本報(bào)記者,具身智能的下肢是輪式還是雙足式,目前還有爭(zhēng)論。但從上肢來(lái)看,無(wú)論是在家庭場(chǎng)景中疊衣服、裝電池、陪護(hù)老人,還是在工業(yè)制造中搬運(yùn)貨物、組裝汽車等,靈巧手都起著重要作用。靈巧手上有各種各樣的傳感器,由此生成各種各樣的數(shù)據(jù),這些數(shù)據(jù)又要與控制結(jié)合形成閉環(huán),因此在結(jié)構(gòu)、感知以及成本方面都有諸多有待解決的挑戰(zhàn)。
藍(lán)馳創(chuàng)投合伙人曹巍指出,現(xiàn)在的機(jī)器人本體,無(wú)論是外觀形態(tài)、感知能力、運(yùn)動(dòng)能力等,都是五花八門,并沒有一個(gè)行業(yè)性的指引規(guī)范或統(tǒng)一標(biāo)準(zhǔn)!斑@可以類比移動(dòng)互聯(lián)網(wǎng)早期涌現(xiàn)的各種應(yīng)用,其競(jìng)爭(zhēng)點(diǎn)在于適配能力——適配上百款手機(jī)。當(dāng)下機(jī)器人賽道類似,還沒有一個(gè)真正的爆款產(chǎn)品去引領(lǐng)行業(yè)標(biāo)準(zhǔn),未來(lái)三五年或?qū)⒊霈F(xiàn)爆款產(chǎn)品,屆時(shí)會(huì)引領(lǐng)或推動(dòng)行業(yè)性的標(biāo)準(zhǔn)建立,將硬件的水平拉動(dòng)起來(lái),在硬件層面達(dá)成共識(shí)!
全國(guó)政協(xié)常委、致公黨中央副主席、全國(guó)婦聯(lián)副主席、中國(guó)電子學(xué)會(huì)理事長(zhǎng)徐曉蘭表示,人形機(jī)器人是AI+機(jī)器人的產(chǎn)物,是多學(xué)科交叉融合的集大成者。其“根技術(shù)”領(lǐng)域涵蓋通用人形機(jī)器人、大模型、動(dòng)力學(xué)模型以及控制、多模態(tài)感知與環(huán)境建模智能的人機(jī)交互、多智能體的協(xié)作等,同時(shí)還涉及類腦感知與認(rèn)知的基礎(chǔ)理論,以及新材料、新工藝、新結(jié)構(gòu)、電子皮膚等領(lǐng)域。
北京具身智能機(jī)器人創(chuàng)新中心總經(jīng)理熊友軍認(rèn)為,具身智能其實(shí)剛剛開始,它面臨四個(gè)方面的挑戰(zhàn):首先,缺少高性能的具身智能本體,無(wú)論是各種具身智能的傳感器、執(zhí)行器還是整個(gè)身體,都有很多需要完善的地方;其次,具身智能的運(yùn)動(dòng)能力是不足的,尤其體現(xiàn)在對(duì)環(huán)境的適應(yīng)性、操作能力方面,還有很大改進(jìn)的空間;再次,具身智能大模型和多模態(tài)大模型算法的能力是不足的;最后,缺乏具有智能領(lǐng)域統(tǒng)一的通用數(shù)據(jù)集。就像傳統(tǒng)人工智能一樣,現(xiàn)在傳統(tǒng)人工智能大量的語(yǔ)音智能或者是視覺智能這方面,得益于互聯(lián)網(wǎng)上大量語(yǔ)音的數(shù)據(jù)和文字的數(shù)據(jù)。同樣在具身智能領(lǐng)域也需要大量操作的數(shù)據(jù),需要大量行為的數(shù)據(jù)來(lái)豐富具身智能的算法,甚至是具身智能數(shù)據(jù)集的標(biāo)準(zhǔn),實(shí)際上都是缺少的。
何時(shí)真正“爆發(fā)”
不難看出,作為多學(xué)科技術(shù)交叉與集成的人形機(jī)器人,從頭到腳、由里到外,各項(xiàng)技術(shù)都還在迭代升級(jí)中,關(guān)鍵技術(shù)的突破并非一蹴而就。那么,人形機(jī)器人真正走出實(shí)驗(yàn)室,實(shí)現(xiàn)規(guī);瘧(yīng)用,迎來(lái)產(chǎn)業(yè)大爆發(fā),究竟還需要多久?
“今年大家都把機(jī)器人拿出來(lái)展示,在商業(yè)和技術(shù)上進(jìn)行大面積的嘗試,到明后年應(yīng)該會(huì)出現(xiàn)很多嘗試過(guò)的結(jié)果,有的東西會(huì)留下,有的東西會(huì)迭代發(fā)展,這樣會(huì)產(chǎn)生很多新的應(yīng)用。人形機(jī)器人作為創(chuàng)新產(chǎn)品,不僅僅是替代現(xiàn)有的人,而且能夠在很多新的領(lǐng)域創(chuàng)造新的就業(yè)機(jī)會(huì),產(chǎn)生新的應(yīng)用!鼻迦A大學(xué)自動(dòng)化系研究員、機(jī)器人控制實(shí)驗(yàn)室主任趙明國(guó)在接受記者采訪時(shí)如是指出。
從2023年年初涉足人形機(jī)器人賽道的宇樹科技創(chuàng)始人兼CEO王興興透露,該公司的第二款人形機(jī)器人G1近期已經(jīng)快完成量產(chǎn)化的設(shè)計(jì)改造,到今年年底可以大規(guī)模量產(chǎn)。今年5月,宇樹科技旗下G1在國(guó)內(nèi)及海外的電商平臺(tái)上線,憑借9.9萬(wàn)元的零售價(jià)格引發(fā)了國(guó)內(nèi)外的高度關(guān)注。在王興興看來(lái),距離業(yè)界討論較多的人形機(jī)器人“iPhone時(shí)刻”,人形機(jī)器人還有一段時(shí)間,但不會(huì)超過(guò)五年。
由清華大學(xué)交叉信息研究院孵化的通用人形機(jī)器人企業(yè)星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇則認(rèn)為,在接下來(lái)的五年里,深度學(xué)習(xí)、大模型等人工智能技術(shù)會(huì)取得非常大的進(jìn)展,同時(shí)會(huì)非常深入地與人形機(jī)器人、具身智能融合起來(lái),“可能會(huì)在五年內(nèi)迎來(lái)機(jī)器人的‘ChatGPT時(shí)刻’”。
不同于宇樹科技、星動(dòng)紀(jì)元等人形機(jī)器人賽道的“新秀”,較早布局人形機(jī)器人賽道的優(yōu)必選被業(yè)內(nèi)視為已經(jīng)“熬”過(guò)了上一個(gè)周期。優(yōu)必選在本次世界機(jī)器人大會(huì)上展示了“人形機(jī)器人工業(yè)場(chǎng)景解決方案”,現(xiàn)場(chǎng)執(zhí)行了質(zhì)檢、搬運(yùn)、分揀等任務(wù)。優(yōu)必選方面透露,該公司已經(jīng)與汽車企業(yè)東風(fēng)柳汽、吉利汽車等,3C企業(yè)富士康、物流企業(yè)順豐達(dá)成合作,構(gòu)建人形機(jī)器人應(yīng)用生態(tài)。目前,其工業(yè)版人形機(jī)器人Walker S系列已經(jīng)進(jìn)入國(guó)內(nèi)多家新能源汽車整車組裝產(chǎn)線實(shí)訓(xùn)。需要指出的是,優(yōu)必選人形機(jī)器人在工業(yè)場(chǎng)景的商業(yè)化成果方面還有待時(shí)間的檢驗(yàn)。
備受關(guān)注的特斯拉旗下人形機(jī)器人Optimus雖然亮相了本屆世界機(jī)器人大會(huì),但現(xiàn)場(chǎng)并沒有展示真實(shí)“技能”。按照特斯拉CEO埃隆·馬斯克此前的說(shuō)法,特斯拉計(jì)劃從2025年開始小批量生產(chǎn)人形機(jī)器人,其長(zhǎng)遠(yuǎn)目標(biāo)是每年生產(chǎn)1億臺(tái)機(jī)器人,占據(jù)市場(chǎng)份額的10%以上,預(yù)計(jì)未來(lái)人形機(jī)器人與人類的比例可能是2∶1。
在浙江人形機(jī)器人創(chuàng)新中心首席科學(xué)家熊蓉看來(lái),未來(lái)十年甚至更長(zhǎng)時(shí)間里,如果把機(jī)器人的總量看作100%,那么隨著相關(guān)技術(shù)問(wèn)題的解決,是能夠使人形機(jī)器人的占比超過(guò)50%的。當(dāng)人形機(jī)器人成為一個(gè)通用泛化的本體時(shí),不同企業(yè)的差別可能表現(xiàn)在人形機(jī)器人的設(shè)計(jì)方面,會(huì)構(gòu)建起繁榮的生態(tài)。這類似于現(xiàn)在智能手機(jī)會(huì)有不同的品牌廠商,但手機(jī)里還有更多的App應(yīng)用。
本報(bào)記者 曲忠芳 北京報(bào)道