2018年4月10日至4月13日,由O'Reilly和Intel共同舉辦的AI Conference 2018北京站大會在北京國際飯店會議中心隆重舉行。
大會的主題是“探索在業(yè)務(wù)中應(yīng)用人工智能的機會”,來自Google、Intel、Uber、Amazon、百度、微軟、阿里巴巴、螞蟻金服、SAS、IBM、Unity、SalesForce、eBay、Bonsai、伯克利、斯坦福及牛津大學等在內(nèi)的中美知名企業(yè)和高等學府的85位業(yè)界專家、學者以及研發(fā)人員,在4天的時間里,通過近百場的主題演講、分會場議題以及相關(guān)培訓活動,為來自全球的千余名與會者分享了中美在人工智能應(yīng)用方面的最新成果,引起了業(yè)界的廣泛關(guān)注。
在大會的主題演講中,多位業(yè)界大咖向與會者介紹了各自領(lǐng)域里人工智能應(yīng)用的最新進展情況。
來自Intel人工智能事業(yè)部副總裁兼人工智能實驗室和軟件總經(jīng)理Arjun Bansal博士分享了Intel人工智能助推醫(yī)療行業(yè)現(xiàn)代化的進展。包括如何利用深度神經(jīng)網(wǎng)絡(luò)幫助解決醫(yī)療數(shù)據(jù)集龐大的問題,優(yōu)化流程,提高醫(yī)生的效率;利用深度學習和機器學習大幅提升腫瘤檢測的效果;通過有效優(yōu)化算法而大幅降低新藥研發(fā)的成本等。
同樣來自Intel的劉茵茵博士是Intel 人工智能事業(yè)部數(shù)據(jù)科學部的數(shù)據(jù)科學主任,她和團隊成員一起推動Intel Nervana平臺的開發(fā)和設(shè)計,并將深度學習和Intel Nervana技術(shù)應(yīng)用于不同行業(yè)領(lǐng)域的業(yè)務(wù)應(yīng)用。
劉博士在發(fā)言中首先談及了Intel應(yīng)用方案的整體思路:組建一個NLP平臺,建立一個開放靈活的堆棧,利用平臺和堆棧創(chuàng)建一些商業(yè)應(yīng)用解決方案。接下來劉博士給大家分享了NLP利用深度學習網(wǎng)絡(luò)處理自然語言的最新算法發(fā)展,如:文檔理解之類的應(yīng)用,實現(xiàn)快速篩查海量文本,分類標注并找到相關(guān)信息。之后,劉博士還通過幾個使用Intel 人工智能技術(shù)的NLP企業(yè)案例展示了在深度學習領(lǐng)域里面出現(xiàn)的一些創(chuàng)新:如何影響處理文本,語言及基于對話應(yīng)用,以及啟動利用數(shù)據(jù)的新方向等。
作為Google TensorFlow團隊的科學家,Sherry Moore向與會者分享了Google人工智能平臺TensorFlow的最新研發(fā)和應(yīng)用情況,Google如何讓每個人都能夠從人工智能中受益以及Google致力于讓人工智能惠及每個人的理念。
在演講中,Sherry提到了人工智能在Google Assistant、Google Home、Google+等產(chǎn)品中的應(yīng)用,其中特別提到Google Translate通過使用神經(jīng)網(wǎng)絡(luò)翻譯進行整句翻譯,大大提高了翻譯的準確性。
同時,Sherry也介紹了Google人工智能在醫(yī)學、農(nóng)業(yè)、航空運輸、環(huán)境保護等領(lǐng)域的應(yīng)用。此外,TensorFlow的開源對于行業(yè)和產(chǎn)業(yè)界皆帶來很大的變化,Sherry也就此專門進行了40分鐘的分會場的議題分享。
來自Uber的Erran Li博士是Uber高級技術(shù)團隊的資深研究科學家,ACM和IEEE計算機學會的成員,康奈爾大學計算機科學博士。Erran Li博士向與會者分享了深度增強學習如何顯著地推進自動駕駛的潛力,如:領(lǐng)域適應(yīng)和用于感知和行動的遷移學習,無監(jiān)督學習;模型預測控制(例如iLQR)領(lǐng)域的研發(fā)近況,如:模仿學習(例如DAGGER、infoGAIL),策略梯度法以及層次增強學習(例如A3C和變化降低)等,以及它們在自動駕駛方面的應(yīng)用表現(xiàn),同時也介紹了在自動駕駛領(lǐng)域所剩“最后10%”的問題所帶來的巨大挑戰(zhàn)。
來自Matroid公司的創(chuàng)始人兼CEO Reza Zadeh博士概述了Matroid的Kubernetes部署,它為大量用戶提供了定制的計算機視覺和流監(jiān)控,并演示了如何在瀏覽器中定制計算機視覺神經(jīng)網(wǎng)絡(luò)模型。同時解釋了Matroid如何按比例構(gòu)建、訓練和可視化用以監(jiān)視視頻流的TensorFlow模型。
Danny Lange博士是ACM和IEEE計算機學會的成員,在世界頂尖游戲公司Unity Technologies擔任人工智能和機器學習的副總裁,而曾經(jīng)擔任Uber機器學習負責人,亞馬遜機器學習公司總經(jīng)理,微軟的首席開發(fā)經(jīng)理,參與通用汽車OnStar Virtual Advisor項目等工作經(jīng)歷讓他成為公認的業(yè)界翹楚。
Danny Lange博士向與會者介紹了使用ML-Agents工具包的Unity Engine作為動態(tài)3D游戲環(huán)境用于機器學習研究的例子;并且演示了游戲在推動強化學習算法發(fā)展過程中所扮演的角色;Danny還概述了用于訓練機器學習代理的各種算法,包括各種強化學習和監(jiān)督式學習方法。并對如何在定制的3D游戲環(huán)境中進行機器學習研究,以及如何使用深度強化學習方法去完成這些環(huán)境中的各種任務(wù)給出了很好的建議。
來自百度首席科學家熊輝博士以“數(shù)據(jù)驅(qū)動的人工智能時代已經(jīng)到來”開場,指出數(shù)據(jù)驅(qū)動的主要特征是精細化的數(shù)據(jù)搜集導致一切事物會更加清晰化,但同時大量數(shù)據(jù)積累的過程也會造成信息的冗余,并使得獲取高附加值信息的成本大幅提升。
在接下來的發(fā)言中,熊輝博士談到了兩類行業(yè)最適合應(yīng)用人工智能:沒有被充分數(shù)字化的行業(yè),以及沒有被充分用更小的顆粒度去數(shù)字化的行業(yè)。他指出在數(shù)據(jù)、計算能力、算法和應(yīng)用場景等人工智能的四大必備要素中,算法優(yōu)化是學術(shù)界的強項,而數(shù)據(jù)、算力和應(yīng)用場景則普遍存在于企業(yè)界。
百度正作為一個數(shù)據(jù)驅(qū)動的公司,意在通過四大要素的整合打造全生態(tài)數(shù)字化AI平臺,而Apollo自動駕駛開放平臺,精細化、個性化的百度搜索和推送平臺,以及基于百度語音技術(shù)、視頻處理技術(shù)的開放平臺DuerOS等都是這種理念的具體體現(xiàn)。
“我今天給大家講的是增強學習如何能夠在真正的實際應(yīng)用當中解決問題,它是怎么樣解決的?解決了什么問題?”Bonsai公司的創(chuàng)始人兼CEO,認知企業(yè)家Mark Hammond開門見山地提出了主題演講的核心內(nèi)容。
增強學習結(jié)合了模擬或是數(shù)字的組合,是解決動態(tài)變化和需要自適應(yīng)的環(huán)境問題的一個強有力的機器學習工具。增強學習能訓練模型,讓它們優(yōu)化多種行業(yè)(例如機器人,制造業(yè),能源,供應(yīng)鏈等)的系統(tǒng)和流程的效率。Mark Hammond在演講中通過兩個真實的案例展示了增強學習是如何成功地優(yōu)化了西門子公司的機器調(diào)優(yōu),以及如何優(yōu)化了一個大型空調(diào)企業(yè)的系統(tǒng)的能效。并且詳細介紹了從構(gòu)建,訓練,部署模型到分析應(yīng)用的業(yè)務(wù)全過程。
Hassan Sawaf是AWS應(yīng)用科學和人工智能主管,負責推動Amazon Lex,Amazon Comprehend,亞馬遜翻譯,亞馬遜轉(zhuǎn)錄和其他機器學習服務(wù)等產(chǎn)品的科學和技術(shù),他在自動語音識別,計算機視覺,自然語言理解和機器翻譯領(lǐng)域有二十多年的工作經(jīng)驗。
Hassan Sawaf在主題演講中首先和與會者分享了人與計算機交互的歷史進程,并結(jié)合機器學習的使用場景,介紹了亞馬遜人工智能在語音識別,機器翻譯等應(yīng)用領(lǐng)域的最新成果,以及全新上線的Amazon Go帶來的全新購物體驗。
“到目前為止,所有的東西都是AI+HI,即人工智能+人類智能!眮碜晕④浫蛸Y深副總裁、微軟亞太研發(fā)集團主席兼微軟亞洲研究院院長洪小文博士在他的主題演講“智能簡史”中明確提出了人工智能的發(fā)展理念,并以此為依據(jù)介紹了微軟在CNN、語音識別、機器翻譯等方面的進展。
來自京東人工智能平臺和研究部門的副總裁Bowen Zhou博士是人類語言技術(shù),機器學習和人工智能多領(lǐng)域的專家。之前在IBM十五年的工作經(jīng)歷中,是IBM技術(shù)戰(zhàn)略與研究,以及AI認知研究方面的領(lǐng)導者,IBM Watson Group首席科學家。
Bowen Zhou博士在會上與大家分享的是他對人工智能的獨特認識:從目前的ANI(窄義人工智能)發(fā)展到未來的ABI(廣義人工智能)。這種發(fā)展意味著有更好的需求和標識數(shù)據(jù),對專家人工系統(tǒng),算法專家的依賴性會減少,會出現(xiàn)更多可解釋的人工智能解決方案。更重要的在于,新開發(fā)的AI系統(tǒng)可以來做更多不同的Task,所有這一切合在一起,就會形成ABI。但是如果ABI能夠達到,對任何AI的應(yīng)用企業(yè),對AI的使用者來說,意味著會形成一個比今天大100倍的人工智能市場。同時,Zhou博士還分享了從ANI到ABI,研發(fā)人員需要努力實現(xiàn)的七個主要的技術(shù)方向。
除了精彩的主題演講,與會嘉賓的議題還從“企業(yè)中人工智能應(yīng)用”、“人工智能對商業(yè)社會的影響”、“人工智能的實施與交互”、“人工智能的模型與方法”等多個方面,展示了在自然語言處理和理解、語音識別、計算機視覺識別、增強學習和機器學習、深度學習、CNN與GAN、AI平臺設(shè)計等領(lǐng)域最新的研發(fā)成果和前沿技術(shù),以及這些成果和技術(shù)在包括醫(yī)療、金融、教育、傳媒、新聞、娛樂、零售與電子商務(wù)、運輸與物流等多個行業(yè)業(yè)務(wù)里的最新應(yīng)用情況。
縱觀本次AI Conference2018北京站會議,給人以下幾點突出的印象:
一、大數(shù)據(jù)時代的來臨加快了人工智能應(yīng)用的發(fā)展。
參加本次大會的Intel、Google、Amazon、百度、京東、阿里巴巴、Uber、微軟等國內(nèi)外企業(yè)無一不是擁有獨立大數(shù)據(jù)流量入口的企業(yè),他們也無一例外的成為人工智能領(lǐng)域的“超級玩家”。海量的數(shù)據(jù)資源支持,不僅讓他們在這場“未來的游戲”中成為領(lǐng)先者,也給他們帶來了現(xiàn)實巨大的經(jīng)濟效益和對AI領(lǐng)域的影響力。正像百度首席科學家熊輝博士在會上所說的那樣“與前幾次人工智能發(fā)展的道路不同,這是一次由數(shù)據(jù)驅(qū)動的人工智能!蔽磥黼S著智能家居、IoT的普及和發(fā)展,大數(shù)據(jù)對人工智能應(yīng)用快速發(fā)展的推動作用將越來越明顯。
二、人工智能從“云端”走來。
和數(shù)據(jù)爭奪一樣,“AI云服務(wù)平臺”也同樣成為激烈競爭的戰(zhàn)場。與會的許多企業(yè)基于各個領(lǐng)域,推出了各自基于云服務(wù)的人工智能平臺,像著名的Google的 TensorFlow;AWS推出構(gòu)建和部署ML 模型的Sagemaker;IBM有Watson;百度自動駕駛領(lǐng)域有Apollo平臺,語音技術(shù)、視頻處理技術(shù)領(lǐng)域有DuerOS平臺等。既然“AI云服務(wù)”成為發(fā)展的趨勢,那么這些AI的大佬們自然不會錯過這個機會,因為平臺的競爭就意味著用戶的競爭,說到底是意味著數(shù)據(jù)入口和流量的競爭。
三、深度學習繼續(xù)“加深”,何時由“黑”轉(zhuǎn)“白”?
在這次AI Conference北京站大會上,與會嘉賓口中提到的,現(xiàn)場觀眾耳中聽到的最多的一個詞(詞組),恐怕非“深度學習”莫屬了。無論是Uber的無人駕駛,還是Google的機器翻譯;不管是微軟的“小冰”,還是Intel精準醫(yī)療,到處可見“深度學習”的“身影”。隨著大數(shù)據(jù)的應(yīng)用,以及計算機算力的大幅提升,滿足了深度學習進一步提升和完善的需要。從本次大會眾多應(yīng)用的發(fā)展中可以清楚地看出,深度學習的發(fā)展成果已經(jīng)越來越強烈地影響到人工智能在感知、預測、決策等應(yīng)用中的效果,并且這種影響正向著人們所希望的方向不斷前進。深度學習幫助我們解決了what的問題,但無法回答我們how,因此業(yè)界習慣把這種模式稱為“黑盒子”。人們一直試圖打開這個“黑盒子”,但迄今為止還沒有成功。什么時候這個“盒子”能由“黑”轉(zhuǎn)“白”,人工智能就將在那個時刻實現(xiàn)質(zhì)的飛躍。
4天的大會雖然時間短暫,但是滿滿的干貨讓與會者獲益匪淺。人工智能,未來已來,等到明年AI Conference大會再次開啟的時候,又會有什么樣的驚喜在等著我們呢?!