AI被認定為是人類歷史上第四次工業(yè)革命,其發(fā)展必然會伴隨著技術(shù)的不斷演進、應用的不斷祛魅。這其中必然也會出現(xiàn)所謂各種泡沫,各種事后被證實的“笑料”。但不可否認的是,初期的人工智能正為我們的生活陸續(xù)帶來驚喜。無論是小到點外賣,還是大到疾病防控、金融監(jiān)管。我們期待著,人工智能技術(shù)未來給生活帶來的更多溫暖和便利。
2018年谷歌I/O大會上,CEO Sundar Pichai展示了一項技術(shù),用Google Assistant在沒有人類干涉情況下進行預約服務。
當聽到對方回復“讓我查詢一下時間”時,Google Assistant回復了聲“嗯哼”,技驚四座。一般情況下,人們對于這部分的回應可能會認為是“好的”之類,能在當下出現(xiàn)這種極其接近人類的情感化回復,已經(jīng)是很讓人驚訝的表現(xiàn)了。
但事實似乎并非如此。近日美國媒體的報道指出,現(xiàn)實生活中谷歌智能助手絕大部分仍是由谷歌呼叫中心的員工代為處理。為此,谷歌官方回應是,為了保障餐廳在接受訂餐時的體驗,并未強力去人工化。
一石驚起千層浪。似乎這家全球領(lǐng)先的AI技術(shù)公司遭遇了一場信任危機,而關(guān)于背后的AI技術(shù)發(fā)展,也在AlphaGo后并未再有讓人驚喜甚至“驚懼”的表現(xiàn)。
近日,清華大學人工智能研究院院長張鈸接受媒體采訪也指出,AI奇跡短期難再現(xiàn),深度學習潛力已近天花板。
從技術(shù)角度來看,近些年人工智能實現(xiàn)飛躍突破的背后,是由一個叫做“深度學習”技術(shù)的加速突破帶來的。-甘俊
深度學習的瓶頸
從技術(shù)角度來看,近些年人工智能實現(xiàn)飛躍突破的背后,是由一個叫做“深度學習”技術(shù)的加速突破帶來的。
但其實早在2006年,“深度學習”這一概念便被Geoff Hinton發(fā)表論文時正式提出。他也因此被稱為“深度學習之父”、“神經(jīng)網(wǎng)絡先驅(qū)”,并獲得2019年的“圖靈獎”。
為什么到了近兩年,深度學習才終于在AI世界“有了姓名”,Hinton為什么到今年才為此獲獎?這與深度學習本質(zhì)上存在一定瓶頸有關(guān)。
Hinton教授發(fā)表論文后的2006年到2012年間,限于整體計算機算力和數(shù)據(jù)基數(shù)問題,深度學習并沒有條件發(fā)揮它的真實效力。在2012年,Hinton教授和他的兩個學生在ImageNet比賽上,使用深度學習技術(shù)將識別錯誤率從26.2%猛然降低到15.3%,這才使深度學習被廣為關(guān)注起來。
到了2016年,谷歌推出的AlphaGo系統(tǒng)陸續(xù)擊敗人類圍棋世界冠軍,甚至引發(fā)過關(guān)于“機器將取代人類”的論調(diào)(當然答案是否定的)。這背后都有賴于“深度學習”技術(shù)的推動。
以至于到今天,“深度學習”一度成為可以跟“人工智能”并肩的詞匯而普世。
“深度學習”技術(shù)逐漸成熟的背后,是與深度神經(jīng)網(wǎng)絡層數(shù)的演進有關(guān)。從20世紀80年代開始,神經(jīng)網(wǎng)絡經(jīng)歷過單層神經(jīng)網(wǎng)絡、多層神經(jīng)網(wǎng)絡和深度神經(jīng)網(wǎng)絡三次發(fā)展階段,演進帶來的是,能夠容納的數(shù)據(jù)量有了巨大擴容。
當然問題也就隨之而來,這意味著深度學習的發(fā)展,有賴于對有效數(shù)據(jù)的積累和學習,而有效數(shù)據(jù)則有賴于人類介入進行大量的數(shù)據(jù)標注。
目前專家們同樣還不能解釋AI算法背后的運算機制如何解釋。-資料
在5月25日舉行的2019未來論壇·深圳技術(shù)峰會上,美團搜索與NLP部負責人王仲遠就指出,深度學習其中一個本質(zhì),是需要大量的標注數(shù)據(jù)來尋找事物之間的靜態(tài)映射關(guān)系。
顯然目前不太適合深度學習的問題也很多,比如一些創(chuàng)造性活動中,數(shù)學家、物理學家的工作就無法被人工智能簡單取代;再比如一些無法提供大量標注數(shù)據(jù)的領(lǐng)域、一些結(jié)果需要可解釋的領(lǐng)域。這些都成為深度學習技術(shù)目前應用的一個瓶頸。
深醒科技創(chuàng)始人、首席科學家袁培江此前也向21世紀經(jīng)濟報道表示,AI技術(shù)的發(fā)展在不斷迭代。理論上機器學習掌握了所有存儲在其中的數(shù)據(jù),就可以達到100%準確度。圍棋博弈的棋盤變化情況達到10的172次方,但還可以繼續(xù)優(yōu)化,這是漫長的過程。
他認為,依靠粗暴的數(shù)據(jù)驅(qū)動會有閾限,當前深度學習的方法很快會遇到天花板。業(yè)界正在謀求算法數(shù)據(jù)可解釋性、模型合理性的進一步探索!皽蚀_率從90%到99.99%會發(fā)展很快,但到小數(shù)點精確到更后面時,技術(shù)瓶頸會越來越明顯。那么與應用落地結(jié)合,尤其和其他數(shù)據(jù)結(jié)合是必然。”
如何突破瓶頸?
深度學習的發(fā)展其實遠遠沒有達到能夠“驚人”的地步。也因此,伴隨著“AI代人”說法而生的,還有“弱人工智能”這個對當下階段的定義。
這背后涉及的,其實是關(guān)于深度學習的“黑盒子”問題。由于人腦的運作存在諸多包括感情、記憶、常識等主觀因素共同影響,這并不是現(xiàn)階段機器可以全部學習到的內(nèi)容。而學界關(guān)于人腦運作機制問題尚未有進一步的進展。
目前專家們同樣還不能解釋AI算法背后的運算機制如何解釋。一個表現(xiàn)是,當需要辨別上圖中哪個動物是“kiki”,哪個是“bouba”時,人類多數(shù)會認為前者是kiki。按照心理學家的解釋,這是因為“kiki”發(fā)音顯得更加尖銳,這與前者圖片相符。但實際上,這兩者并不存在于世上。但對于機器而言,這恐怕難以得出答案了。
因此關(guān)于深度學習,業(yè)界開始出現(xiàn)兩種探索思路。一種是換一種技術(shù)架構(gòu),另一種是針對深度學習目前的瓶頸,研發(fā)新的改善方向,
中國自動化學會副理事長陳俊龍研究“寬度學習”架構(gòu)。他曾向21世紀經(jīng)濟報道介紹,寬度學習和深度學習網(wǎng)絡架構(gòu),本質(zhì)上是結(jié)構(gòu)和算法的差別。深度神經(jīng)網(wǎng)絡學習架構(gòu),是在結(jié)構(gòu)固定以后才開始學習。那么此后學習期間如果出現(xiàn)不準確,就要重新設計網(wǎng)絡、再學習一次。寬度則是設計好網(wǎng)絡后,當面臨學習不準確的情況,可以隨時以橫向的方式進行增量擴充,即通過增加神經(jīng)元,以提高準確度。
“所以寬度學習是增量學習的做法,時時可以增量學習!标惪↓埍硎,以往深度神經(jīng)網(wǎng)絡由于數(shù)據(jù)量過大、建設程序復雜,需要將數(shù)據(jù)上傳到云端運算,但寬度學習的橫向擴充模式,就可以直接用于“端”(邊緣)側(cè),這也成為寬度學習架構(gòu)最大的優(yōu)點。
據(jù)介紹,寬度學習系統(tǒng)的網(wǎng)絡架構(gòu),按照目前的測試,其應用時耗費的神經(jīng)元和所需速度是深度學習的“至少一半”。
在2019未來論壇現(xiàn)場,上海交通大學教授張婭介紹了她的研究方向。由于深度學習需要標注大量數(shù)據(jù)集,她的出發(fā)點在于,希望標注更少數(shù)據(jù)進行計算,減少單位標注數(shù)據(jù)的成本,以及減少采集數(shù)據(jù)的噪聲,針對這三點進行研發(fā)。
“AI是一個大潮流,但每一個AI產(chǎn)品的落地都需要重新采集數(shù)據(jù)集,需要從零開始訓練模型,這其實對AI的落地應用有很大限制。我們希望通過這種資源受限的機器學習研究,得以使這方面得到一定突破,當然其實現(xiàn)在從學術(shù)角度的研究,我們還有更多方向在做,比如自監(jiān)督學習等等,我認為這些都是未來AI能夠真正從一個行業(yè)或者說領(lǐng)域人工智能走向真正通用人工智能的必經(jīng)之路!睆垕I這樣總結(jié)道。
能怎么應用?
智能語音助手的開發(fā)者,并不完全讓助手“放飛自我”當助理。不論是否真的出于對餐廳尊重,還是對機主尊重才介入人類幫助,無疑都顯示出當前AI技術(shù)應用能力還相對弱。
但也并不意味著,目前的AI應用就是一種空談。實際上人工智能已在一些領(lǐng)域悄然發(fā)揮作用。
一位AI從業(yè)者就向21Tech表示,代人預約(如帶點外賣等)就是他認定的一種應用方向,為此他在不斷努力。更有手機業(yè)人士推測,未來內(nèi)置在手機中的智能語音助手,會根據(jù)手機主人平常的生活行為,提前自主通過手機軟件,在沒有機主操作情況下,進行代點外賣行為。
前述論壇上,王仲遠介紹道,其所在團隊開發(fā)出的美團大腦,就是通過不斷優(yōu)化其中模型的精細度,更好對平臺中的商家進行精確定義,從而讓用戶有更合適的選擇!俺怂阉饕酝,實際上美團大腦還有非常多的應用場景,比如說商戶的運營、金融的反欺詐、旅游的規(guī)劃以及未來開發(fā)中的智能助理。”
更遠大的在于醫(yī)學和金融層面。普林斯頓大學運籌金融系終身教授王夢迪研究的主題是強化學習。本質(zhì)上這屬于深度學習和增強學習反饋,是基于非同步大規(guī)模并行計算的快速算法。其需要實時數(shù)據(jù)收集,并進行在線大規(guī)模實驗。
她所在團隊的這些研究也有了突破性應用進展。據(jù)她在論壇上介紹,美國每年會發(fā)生70萬例膝關(guān)節(jié)置換手術(shù),其康復時長在100多天,整個成本達到16500-33000美元。
這類手術(shù)本身極其復雜,根據(jù)個體特異性,往往伴隨適應癥、并發(fā)癥等情形。因此這會是一個動態(tài)決策的過程,大概每個療程需要有30-60個決策。
問題的關(guān)鍵在于,膝關(guān)節(jié)置換手術(shù)成本過高,而政府、醫(yī)院和醫(yī)生之間還存在復雜的博弈,因此整個流程存在很多可以優(yōu)化的地方。
王夢迪所在團隊提出的思路是,將膝關(guān)節(jié)置換療程分解成大規(guī)模狀態(tài)轉(zhuǎn)移模型進行策略求解。基于診斷和醫(yī)療保險記錄,總結(jié)歸納,策略模仿,并且強化優(yōu)化策略,計算出最優(yōu)治療計劃。根據(jù)預計,療程費用平均下降6%,溢出費用下降33%。
“我一個朋友跟我說,‘這個手術(shù)之后,我又可以去滑雪了’!”在結(jié)尾處,她這樣說到,團隊希望通過強化學習將療程費用平均降低1100美元,降低長尾風險33%!拔覀兿M麕椭t(yī)生和醫(yī)院,更好優(yōu)化醫(yī)療流程,更好優(yōu)化效率;幫助患者更好地康復!