李飛飛團(tuán)隊(duì)新作登《自然》子刊:如果AI有身體會(huì)更智能嗎?
如果AI有身體,它會(huì)變得更智能嗎?
答案是,會(huì)的。
近日,斯坦福大學(xué)教授李飛飛帶領(lǐng)的團(tuán)隊(duì)研究發(fā)現(xiàn),身體形態(tài)會(huì)影響虛擬生物Unimal在復(fù)雜環(huán)境的適應(yīng)和學(xué)習(xí)能力,復(fù)雜環(huán)境也會(huì)促進(jìn)形態(tài)智能的進(jìn)化。
此項(xiàng)題為《通過學(xué)習(xí)和進(jìn)化實(shí)現(xiàn)具身智能》(Embodied intelligence via learning and evolution)的研究登上了《自然·通訊》(Nature Communications)雜志。
“我們通常專注于AI是如何實(shí)現(xiàn)人類大腦中神經(jīng)元的功能,然而將AI看作是具有物理實(shí)體的東西會(huì)是完全不同的范式,”李飛飛表示。
對(duì)于此項(xiàng)研究,論文第一作者Agrim Gupta告訴澎湃新聞(www.thepaper.cn),“最終的目標(biāo)將是擁有生活在一個(gè)‘由人類創(chuàng)造并且為了人類而創(chuàng)造’的世界的實(shí)體智能體!
“現(xiàn)在,我們已經(jīng)看到人工智能在視覺和語言方面的研究取得了巨大進(jìn)展,并將降低在‘虛擬/網(wǎng)絡(luò)’世界中做事的成本。但像幫助老年群體或幫人類做危險(xiǎn)的工作這樣真正以一種好的方式影響人類生活的技術(shù),目前還是遙不可及的。所以當(dāng)我們有了擁有物理實(shí)體的智能體,這個(gè)影響將是巨大的,并且很有希望讓人類更好!
研究團(tuán)隊(duì)創(chuàng)建了一個(gè)計(jì)算機(jī)模擬的“游樂場(chǎng)”,在那里,被稱為“unimals”(通用動(dòng)物的縮寫,發(fā)音為“yoo-nimals”)的類節(jié)肢動(dòng)物智能體學(xué)習(xí)并受到突變和自然選擇的影響。
每個(gè)環(huán)境的模擬都從576個(gè)獨(dú)特的unimals開始,它們由一個(gè)“球體”(頭部)和一個(gè)“身體”組成,該“身體”由不同數(shù)量以各種方式排列的圓柱形肢體組成。每個(gè)unimal都以相同的方式感知世界,并以相同的神經(jīng)架構(gòu)和學(xué)習(xí)算法開始。換句話說,所有unimals都以相同的智能水平開始了他們的虛擬生活——只是他們的身體形狀不同。
在學(xué)習(xí)階段中,Unimal必須在多變的地形上將一個(gè)塊狀物移動(dòng)到目標(biāo)位置,地形有不同難度——平坦的地形、塊狀山脊、階梯或光滑的山丘。
該團(tuán)隊(duì)采用一種錦標(biāo)賽式的達(dá)爾文進(jìn)化方案,在相同的環(huán)境/任務(wù)組合中接受過訓(xùn)練的每個(gè)unimal都與其他三個(gè)unimal一起參加比賽,獲勝者被選中產(chǎn)生一個(gè)單一的后代。該后代在面臨與其父母相同的任務(wù)之前,都要經(jīng)歷涉及肢體或關(guān)節(jié)變化的單一突變。所有的unimals(包括獲勝者)都參加了多次比賽,只有隨著新后代的出現(xiàn)才會(huì)老化。
在訓(xùn)練了4000種不同的形態(tài)后,研究人員結(jié)束了模擬。那時(shí),每個(gè)環(huán)境幸存下來的unimal平均經(jīng)歷了10代進(jìn)化,成功的形態(tài)多種多樣,包括兩足動(dòng)物、三足動(dòng)物和四足動(dòng)物,有或沒有手臂。
在每個(gè)環(huán)境中完成3次這樣的進(jìn)化(訓(xùn)練4000種不同的形態(tài))后,研究團(tuán)隊(duì)再從每個(gè)環(huán)境中選擇前10名表現(xiàn)最佳的動(dòng)物,并從頭開始訓(xùn)練它們執(zhí)行八項(xiàng)全新任務(wù),例如繞過障礙物、操縱球或推動(dòng)一個(gè)盒子向上傾斜。
最后發(fā)現(xiàn),在變化地形中的unimal進(jìn)化地比平坦地形中的更好,在變化地形中操縱盒子的unimal表現(xiàn)最好。進(jìn)化10代以后,最成功的unimal在形態(tài)上已經(jīng)適應(yīng)得非常好,他們學(xué)習(xí)同樣任務(wù)的時(shí)間是最早一代的一半。
這也與美國心理學(xué)家詹姆斯·馬克·鮑德溫 (James Mark Ba ldwin) 在19世紀(jì)后期提出的假設(shè)一致,他推測(cè)學(xué)習(xí)具有適應(yīng)性優(yōu)勢(shì)(adaptive advantage)事物的能力可以通過達(dá)爾文的自然選擇傳遞下去。Gupta解釋,“自然會(huì)選擇能更快地獲得優(yōu)勢(shì)行為的身體變化”。
由于在更復(fù)雜環(huán)境中進(jìn)化的智能體可以更快更好地學(xué)習(xí)新任務(wù),Gupta和他的同事認(rèn)為,允許模擬實(shí)體智能體(embodied agent)在日益復(fù)雜的環(huán)境中進(jìn)化將為開發(fā)在現(xiàn)實(shí)世界中執(zhí)行多項(xiàng)任務(wù)的機(jī)器人提供啟示。
Gupta說,“人類不一定知道如何為奇怪的任務(wù)設(shè)計(jì)機(jī)器人身體,例如爬過核反應(yīng)堆提取廢物,地震后提供救災(zāi),引導(dǎo)納米機(jī)器人在人體內(nèi)運(yùn)動(dòng),包括做洗碗或折疊衣物等家務(wù)。 也許唯一的出路是讓進(jìn)化來設(shè)計(jì)這些機(jī)器人!
在面對(duì)這項(xiàng)研究將會(huì)如何具體幫助這些任務(wù)的實(shí)現(xiàn)的疑問,Gupta向澎湃新聞表示,“另一個(gè)看待此項(xiàng)研究的方式不再是創(chuàng)造了智能算法(intelligent algorithms),而是你可以有正確的物理形式,從而輕松完成手頭的任務(wù)。從這個(gè)意義上說,理論上你可以優(yōu)化折疊衣服的機(jī)器人的形式。”
對(duì)于下一步的研究計(jì)劃,Gupta透露,當(dāng)前的工作幾乎只涉及了表面,現(xiàn)在的模擬環(huán)境和學(xué)習(xí)行為都還非常簡單,“我們希望能擴(kuò)大范圍,同時(shí),將現(xiàn)在的一個(gè)智能體擴(kuò)展成多個(gè)智能體也是一個(gè)有趣的方向!