美國《大西洋月刊》4月5日文章,原題:幼兒和人工智能可以互相學(xué)習(xí)什么 露娜7個(gè)月大時(shí),在科學(xué)家父親的要求下,她開始佩戴一頂亮粉色的頭盔,頭盔上有一個(gè)攝像頭,每次大約用一個(gè)小時(shí)時(shí)間捕捉她所看到、聽到和說的一切。她的父親布倫登·萊克是紐約大學(xué)的認(rèn)知科學(xué)家,研究訓(xùn)練人工智能的更好方法。
一個(gè)周日的早上,萊克舉起一個(gè)機(jī)器人玩偶,模仿機(jī)器人的聲音逗正在玩木頭玩具的露娜:“你手里的玩具是給機(jī)器人用的嗎?”露娜似乎不太感興趣這個(gè)對話,小孩子總是活在自己的世界里,但幾分鐘后,她回來撿起了機(jī)器人玩偶!皺C(jī)器人,”她說!皺C(jī)器人,”她重復(fù)了一遍。她的爸爸驚訝極了,因?yàn)樗郧皬臎]聽她說過“機(jī)器人”這個(gè)詞。她是剛才從偶然的對話中學(xué)會(huì)了這個(gè)詞嗎?
一歲半的露娜已經(jīng)掌握了一項(xiàng)目前人工智能模型仍難以掌握的技術(shù),即人類能夠從很少的例子中進(jìn)行學(xué)習(xí)。這意味著,即使是一次偶然的接觸也可以鞏固機(jī)器人玩偶和組成機(jī)器人的音素之間的聯(lián)系。相比之下,人工智能可能需要幾十個(gè)或幾百個(gè)例子。像ChatGPT這樣的大型語言模型是在數(shù)千億甚至數(shù)萬億的單詞上訓(xùn)練的,這是一個(gè)超出人類負(fù)荷能力的數(shù)據(jù)量。萊克表示,“要聽到這么大規(guī)模的數(shù)據(jù)量,(對人類來說)需要1000年的時(shí)間!蹦敲,考慮到人類只需更少的時(shí)間和更少的單詞來掌握語言,人工智能能否被更有效地訓(xùn)練?它能像一個(gè)蹣跚學(xué)步的孩子那樣學(xué)習(xí)嗎?
這些問題是萊克最初記錄女兒幼年生活的動(dòng)機(jī)。當(dāng)然,他用一種更感性的方式說服了他的妻子:記錄可以捕捉和回放露娜在幼兒時(shí)期的里程碑。和其他25個(gè)幼兒一起,露娜是斯坦福大學(xué)開展的BabyView項(xiàng)目的一部分,該項(xiàng)目旨在準(zhǔn)確捕捉幼兒在以驚人的速度學(xué)習(xí)語言的關(guān)鍵時(shí)期所看到和聽到的東西。萊克希望有一天能將來自露娜和其他人的數(shù)據(jù)輸入到他自己的模型中,以找到訓(xùn)練人工智能的更好方法,并找到更好的方法理解孩子們是如何完成司空見慣但又非凡的語言學(xué)習(xí)壯舉的。頭戴相機(jī)和麥克風(fēng)現(xiàn)在足夠小,足夠輕,幼兒可以長時(shí)間佩戴。
人工智能模型也可以激發(fā)關(guān)于兒童是如何學(xué)習(xí)的新研究。得克薩斯大學(xué)奧斯汀分校發(fā)展心理學(xué)家陳宇(音)講述了他與合作者正在進(jìn)行的一項(xiàng)研究。在這項(xiàng)研究中,父母和孩子在實(shí)驗(yàn)室里玩玩具時(shí)都戴著頭戴式攝像頭。奇怪的是,在孩子的視角上訓(xùn)練的計(jì)算機(jī)視覺模型比在父母的視角上訓(xùn)練的模型表現(xiàn)得更好。所以,孩子的視角對學(xué)習(xí)更有幫助嗎?他們想知道這是否與孩子們會(huì)更徹底地操控玩具有關(guān),比如孩子會(huì)前后轉(zhuǎn)動(dòng)玩具以從不同的角度看物體。
萊克一直在尋找創(chuàng)造一個(gè)更像人類學(xué)習(xí)的人工智能的方法,這自然使他想到了兒童的學(xué)習(xí)方式。他認(rèn)為,“在已知的宇宙中,孩子是最令人矚目的學(xué)習(xí)者!庇辛俗约旱暮⒆又,他認(rèn)為養(yǎng)育孩子可能會(huì)給他的研究帶來新的見解。看著孩子們的學(xué)習(xí)過程是如此迷人,如此令人驚訝,也如此有趣。但這個(gè)過程更是直覺性的——如果任何家長真能這么容易地理解他們的孩子是如何學(xué)習(xí)的,我們豈不是早就明白學(xué)習(xí)的真諦了嗎?(作者薩拉·張,陳欣譯)