原標題:通向下一代人工智能之路
作者: 蔡恒進
[ AI未來的發(fā)展路徑并不算明晰,但我們一定要融合應用區(qū)塊鏈技術(shù),區(qū)塊鏈的分布式架構(gòu)與意識的多節(jié)點結(jié)構(gòu)可以相通。如果說AI給人類帶來的是生產(chǎn)力的改變,那么區(qū)塊鏈技術(shù)則能夠改變生產(chǎn)關(guān)系,兩者在未來社會構(gòu)建中都有著不可取代的價值,而從目前來看,已經(jīng)具備較為完整體系的區(qū)塊鏈技術(shù)能夠應用于解決AI的發(fā)展問題。區(qū)塊鏈技術(shù)需要用來平衡AI技術(shù)的發(fā)展,以及維護數(shù)據(jù)的不可篡改,助力數(shù)據(jù)的真實性。 ]
人工智能(AI)從1956年提出至今,已經(jīng)出現(xiàn)了AlphaZero等專業(yè)領(lǐng)域的超強AI,但通用的超級AI何時到來還不可預知,有學者(John McCarthy,1977) 提出如果我們要在概念上突破,可能需要5~500年的時間,也就是說既有可能很快就實現(xiàn),也有可能要很久才會發(fā)生。
AI的發(fā)展逐漸多元化,我們可以逐步從不同角度切入到這個主題,比如相關(guān)因果、感知認知、符號主義、腦科學以及發(fā)展基礎(chǔ)數(shù)學等。
從因果角度切入,機器學習需要從感知過渡到認知,關(guān)鍵在于如何使機器形成因果推理的能力。模型如果要包含因果,就要能夠模擬由行為產(chǎn)生的結(jié)果的不同,為了建立這樣的模型,一些必要的數(shù)學工具是必不可少的,比如概率圖模型、獨立因果分析框架、有關(guān)反事實的數(shù)學模型等。從認知和腦網(wǎng)絡進行切入,可以將大腦視作動力學系統(tǒng),很多動力學的基本原理對AI目前的致命缺陷有重大補充,因果或邏輯可能蘊含在動力學里,而且臨界很重要;人腦的稀疏表示與符號注意AI和因果有重要聯(lián)系;可以充分利用平行回路設(shè)計AI系統(tǒng)。
從認知科學的角度切入,就可能觸及懸而未決的意識問題,這一直是認知科學和AI交叉領(lǐng)域的研究熱點且進展緩慢。1988年,科學家們首次發(fā)現(xiàn)了意識的實驗證據(jù),隨后人們從不同領(lǐng)域(比如神經(jīng)科學、哲學、計算機等)進入意識的研究。
意識的功能是一個從長期記憶力提取短期記憶內(nèi)容的提取器(類似一個指針),因為人的長期記憶事實上處于無意識狀態(tài),這個內(nèi)容的數(shù)量又十分龐大,而短期工作記憶卻是大家都可以意識到的,但它通?赡苤挥袔讉字節(jié)。這個信息瓶頸可能就需要意識來實現(xiàn),它需要根據(jù)當下的任務和情景把和任務最相關(guān)的因子提取出來。全局工作空間模型就是針對這個問題,可以迅速把長期記憶的關(guān)鍵因素抽取到工作內(nèi)存里,方便執(zhí)行當前任務,加強系統(tǒng)的靈活性。
中國工程院院士、中國人工智能學會名譽理事長李德毅近期談到了AI和腦科學的交叉研究,指出腦認知的三個內(nèi)涵在于記憶力、計算認知和交互認知。他認為,腦認知的核心是記憶認知,記憶不是簡單地存儲,它伴隨有一定的取舍,取舍過程就是計算、簡約和抽象。計算認知中,計算機做算法做得很多,而人腦只有一個計算方法——相似計算。交互認知具有兩重性:既有神經(jīng)網(wǎng)絡內(nèi)部的交互,也有大腦通過感知系統(tǒng)與外部世界交互。
清華大學人工智能研究院院長、中國科學院院士張鈸最近分享了關(guān)于AI發(fā)展的思考,并指出AI經(jīng)歷了兩種發(fā)展范式,即符號主義和連接主義(或稱聯(lián)結(jié)主義),分別稱之為第一代和第二代AI,這兩種范式發(fā)展至今都遇到瓶頸:符號主義影響的第一代AI具有一定程度的可解釋性,能模仿理性智能,但不能隨機應變,無法解決不確定問題;以深度學習為代表的第二代AI,使用門檻較低能夠處理大數(shù)據(jù),極大地推動了AI應用,但具有不可解釋、易受攻擊、不易推廣和需要大量樣本的局限性;今后發(fā)展的方向是“第三代人工智能”,這是一條前人沒有走過、需要大家去探索的道路,將對科學研究、產(chǎn)業(yè)化和人才培養(yǎng)產(chǎn)生重大影響。
AI的三大流派
麻省理工的Brook教授可以看作是行為主義者,他的研究生涯幾乎都在研究AI行為主義,他做出了一個模擬螳螂的機器,簡單理解就是機器按照外界的刺激來反應。行為主義大多認為意識不僅是大腦的事,而是整個身體的事情,由約而博體現(xiàn)的是imitating(學),由博而約體現(xiàn)的是practicing(習)的過程,背后反映的是具身哲學、控制論、機器人學等思想。
數(shù)學、物理世界充滿了各種邏輯符號,圖靈機本身也可以看作是符號主義的嘗試。司馬賀(Herbert Simon)是圖靈獎和諾貝爾經(jīng)濟學獎得主,也是符號主義的代表,他提出的“物理符號系統(tǒng)”假設(shè)從信息加工的角度研究人類思維。
符號主義的由約而博可以看作是符號的演繹過程,由博而約則是歸納,背后的哲學思想與柏拉圖主義相通,都相信或立足于“本質(zhì)”的存在,如果能夠發(fā)現(xiàn)并定義本質(zhì),或者把這個本質(zhì)的公式寫清楚,那么其他所有內(nèi)容都是這個本質(zhì)公式的展開和演繹(比如公理系統(tǒng))。
研究者們很早就發(fā)現(xiàn)神經(jīng)元之間有很多連接,信息傳遞的同時還有放電現(xiàn)象,而聯(lián)結(jié)主義最初就是試圖模擬大腦而來。深度學習、強化學習都可以看作是聯(lián)結(jié)主義,聯(lián)結(jié)主義的由約而博對應的是learning(學),由博而約對應的是thinking(思),背后與心學、現(xiàn)象學等理念相關(guān)。很多研究者希望找到新的框架,甚至通用AI的框架,他們認為深度學習、強化學習不足夠模擬人腦的學習,其中也包括清華大學人工智能研究院院長張鈸。
行為主義、聯(lián)結(jié)主義和符號主義分別從不同角度切入AI,相互補充并各有局限,F(xiàn)在的AI算法中有一類強調(diào)注意力機制,但注意力是較為上層的概念,根本原因依然在于認知坎陷(cognitive attractor)的作用。認知坎陷是一個更基礎(chǔ)的概念,人的所有思維產(chǎn)物或意識片段都可以被理解為認知坎陷:它們都是對真實物理世界的擾亂,但也是人類自由意志的體現(xiàn)?蚕,給人一種陷入其中無法抽離的既視感,值得強調(diào)的是,這些具有傳播性、生命力的意識片段一旦產(chǎn)生就難以磨滅。機器只有注意力機制還不足以形成連續(xù)的意識或認知坎陷,我們必須從更底層切入AI,才有可能讓機器實現(xiàn)“理解”而非“存儲”。
從認知坎陷的角度可以將AI三大流派貫通。行為主義與聯(lián)結(jié)主義的關(guān)系是什么?行為主義可以通過動物行為來理解。動物、簡單生命甚至單細胞生物,都能應對外界的刺激,行為主義更多的是模擬這種動作上的反應或反射。比如羽毛球運動員,在平時需要經(jīng)過大量的訓練,讓身體形成記憶式的反應,在賽場上,運動員的主要注意力就不再是肌肉如何協(xié)調(diào),而是對球的跟蹤、與對手的博弈。行為主義與這些身體動作的相關(guān)度更大,主體需要做的是大腦如何控制協(xié)調(diào)身體的練習。這種練習需要練到位,這個練到位的過程也體現(xiàn)了“由博到約”,將大量復雜的刺激最后練成幾套代表的反應模式。兒童發(fā)展早期就是行為主義的內(nèi)容比較多。隨著個體成長,大腦不斷發(fā)育發(fā)展,聯(lián)結(jié)主義的內(nèi)容才逐漸增多。
聯(lián)結(jié)主義與符號主義也有關(guān)系,符號主義可以看作是把內(nèi)容坎陷化或煉化到了很簡潔的程度,從而形成了各種符號或模型。比如古人講的“天圓地方”就是一種極簡的世界模型,現(xiàn)代的道路大多筆直,但古人看到的未經(jīng)加工的外部環(huán)境是綿延起伏的,在這種條件下抽象出“地是方的”非常難得。有了這個模型之后,會影響我們對道路的修葺,行軍打仗也不容易迷失方向,懂和不懂這個模型就會產(chǎn)生實際的差異。邏輯學中的形式邏輯也是一個極簡的模型,或數(shù)學中的一些公理,都會讓我們覺得世界的神奇,似乎物理世界真的是按照公式發(fā)展的,但問題在于事實并非總是如此。我們面臨的外部世界比所有的公式都要更復雜,因為公式系統(tǒng)并不完整,1900年希爾伯特二十三問之一就是如何提出一套公理系統(tǒng)來統(tǒng)一數(shù)學,其沿用了萊布尼茨的思路,即如何找出一套符號系統(tǒng)來模擬整個世界。很多學者尤其是符號主義者,一直懷有這種夢想。比如愛因斯坦就想要找到一種統(tǒng)一的方程,但是這個夢想終究無法實現(xiàn)。
哥德爾不完全定理就指出,不論給出什么公理系統(tǒng),我們總是能找到一個命題,這個命題在這個公理系統(tǒng)中既不能被證實也不能被證偽,就是說永遠都會有公理以外的東西。換一種方式理解,就是不管列多少條規(guī)則出來,總有內(nèi)容被落在框框外面。有一個經(jīng)典的例子是芝諾悖論(或阿基里斯悖論),這類論證者在自己限制的范圍內(nèi)是沒錯的,但是這個描述系統(tǒng)不是一個開放的系統(tǒng),在這個封閉系統(tǒng)中時間是有上限的,所以阿基里斯永遠跨不過那個時間, 在空間上也永遠追不上烏龜。
這個悖論正好說明假設(shè)本身可能有局限性,我們假定的世界并非真實世界,這是關(guān)鍵。符號主義很可能也面臨類似的問題,不管制定多少嚴謹?shù)囊?guī)則,總有一件事是會真實發(fā)生但是卻不被規(guī)則包含的。因此符號主義會失敗就不難理解,因為它無法涵蓋所有可能。聯(lián)結(jié)主義則是不停迭代,它由博到約、由約到博不斷往復,總能“折騰”到一個比較好的狀態(tài),只是現(xiàn)在的深度學習還沒到這種狀態(tài),依然有進步空間。深度學習存在一個所謂的“極小問題”的瓶頸。人類大腦有一個信息精煉的過程,有利于跳出極小等這些機器在深度學習里遇到的問題。
引入?yún)^(qū)塊鏈技術(shù)突破AI瓶頸
在7月9日的世界人工智能大會開幕式上,百度小度、小米小愛、B站泠鳶、微軟小冰四位虛擬歌手領(lǐng)唱了大會主題曲,從音樂領(lǐng)域來看,AI很可能馬上就能達到“以假亂真”的水平,甚至創(chuàng)作出被人們欣賞的、廣泛流行的音樂作品。AI 已經(jīng)在很多專業(yè)領(lǐng)域逐項超越人類,在作詩、電子競技等開放領(lǐng)域也有出色表現(xiàn)。
一方面,我們相信機器已經(jīng)產(chǎn)生了智能并且仍在成長;另一方面我們也自信人類仍有不可取代的部分。我們在創(chuàng)造工具的過程中創(chuàng)造出了AI,但其能力超過了簡單工具的范疇。AI有改變?nèi)祟惖纳罘绞、情感方式,甚至是延續(xù)方式的可能,因此人類應該更多思考的不是我們能做到什么,而是我們應該做什么。AI能取代人類機械的工作,還能幫助能力強的人取代能力弱的人、資源占有豐富的人取代資源占有少的人。面對這種趨勢我們更應該不斷提高自己的修養(yǎng)、反思自身獨特性,找到自己不能被機器、被他人取代的地方。
在不可掙脫的物理定理束縛之外,人類仍然可以具有極大的自由度,尤其可以靠AI幫助進一步拓展能力的邊界。世界上仍然會有少數(shù)人,在涌現(xiàn)出一些前所未有的想法后,能夠真的去努力實現(xiàn),這就是創(chuàng)新,是改變世界發(fā)展方向的人類意識產(chǎn)物。我們反對決定論、不認可強計算主義,就在于我們相信世界上存在很多并不是由前置條件推斷出來的偶然性。既然這個世界是開放的、存在諸多可能性的,我們就應該朝著我們所相信的方向努力,而不是根據(jù)一種現(xiàn)狀去推斷未來定將如何,這是我們在科技發(fā)展過程中要始終相信的。
AI未來的發(fā)展路徑并不算明晰,但我們一定要融合應用區(qū)塊鏈技術(shù),區(qū)塊鏈的分布式架構(gòu)與意識的多節(jié)點結(jié)構(gòu)可以相通。如果說AI給人類帶來的是生產(chǎn)力的改變,那么區(qū)塊鏈技術(shù)則能夠改變生產(chǎn)關(guān)系,兩者在未來社會構(gòu)建中都有著不可取代的價值,而從目前來看,已經(jīng)具備較為完整體系的區(qū)塊鏈技術(shù)能夠應用于解決AI的發(fā)展問題。
AI技術(shù)發(fā)展迅速,機器的能力進化超出了大多數(shù)人的預估,其速度和力量比人類強大太多,僅憑人類自己已經(jīng)無法完全掌控AI的發(fā)展趨勢,同時技術(shù)進步使得數(shù)據(jù)種類與復雜度大大提高,個人數(shù)據(jù)的真實性越來越難以被認定與證實,也越發(fā)重要。因此區(qū)塊鏈技術(shù)需要用來平衡AI技術(shù)的發(fā)展,以及維護數(shù)據(jù)的不可篡改,助力數(shù)據(jù)的真實性。
引入?yún)^(qū)塊鏈的思想,就能讓機器和人在重大問題上、在同一時間尺度上達成共識并做決策。兩者雖然在物理上沒有連接,但能夠把機器速度跟人類速度匹配起來,避免機器在遠超過人類的地方可能做出造成危害的決策,讓未來不至于脫離人類掌控。
突破當前AI瓶頸的方案在即,區(qū)塊鏈技術(shù)可以用來協(xié)助人類治理人類與機器共存共榮的未來,其與AI技術(shù)的相互賦能并不是要將繞開人類或者全面取代人類,相反是為了能夠使得機器和人類在未來的網(wǎng)絡空間中,在同一時間尺度上進化博弈,為人機共融奠定基礎(chǔ)。