4月29日上午,在GMIC2016(全球移動互聯(lián)網(wǎng)大會)上,百度開放云事業(yè)部總經(jīng)理劉煬發(fā)表主題演講“云上的大數(shù)據(jù)與人工智能”,介紹了百度大數(shù)據(jù)和人工智能方面的研究成果,指出大數(shù)據(jù)、人工智能的發(fā)展應(yīng)用離不開云計算強(qiáng)有力的支持,而大數(shù)據(jù)和人工智能的進(jìn)步也將拓展云計算應(yīng)用的深度和廣度, 同時劉煬表示未來將通過百度開放云把大數(shù)據(jù)和人工智能技術(shù)能力開放給行業(yè)和用戶使用,推動相關(guān)技術(shù)的普及和應(yīng)用,推動行業(yè)發(fā)展。
(百度云計算事業(yè)部總經(jīng)理劉煬)
云計算、大數(shù)據(jù)、人工智能已成為科技和互聯(lián)網(wǎng)行業(yè)發(fā)展的重點(diǎn)領(lǐng)域,作為技術(shù)驅(qū)動型的百度在這些領(lǐng)域的表現(xiàn)也是亮點(diǎn)頻現(xiàn)。在美國麻省理工科技評論的2016年十大突破技術(shù)中,百度的語音接口技術(shù)上榜,成為唯一上榜的中國企業(yè)。劉煬介紹,借助百度的大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)打造的深度語音識別系統(tǒng),改變了傳統(tǒng)的語音識別模式,使語音接口變得更為實(shí)用和有效,人們可以更方便的與身邊的設(shè)備進(jìn)行互動。而這只是百度在大數(shù)據(jù)、人工智能領(lǐng)域研究成果的一部分。
百度大數(shù)據(jù)廣泛應(yīng)用 人工智能成為技術(shù)核心
在大數(shù)據(jù)方面,劉煬表示百度大數(shù)據(jù)已突破技術(shù)積累期,廣泛應(yīng)用于百度外賣、百度地圖、百度金融等復(fù)雜業(yè)務(wù)場景中。在百度外賣業(yè)務(wù)中,大數(shù)據(jù)的應(yīng)用使百度外賣擁有業(yè)內(nèi)效率最高的騎士調(diào)度;诖髷(shù)據(jù),百度地圖可以實(shí)現(xiàn)更準(zhǔn)確的實(shí)時路況、擁堵預(yù)測、路徑規(guī)劃等功能,改善用戶出行體驗。在互聯(lián)網(wǎng)金融領(lǐng)域,百度與國金證券聯(lián)合推出國內(nèi)首只大數(shù)據(jù)量化基金,通過大數(shù)據(jù)挖掘和智能化處理,實(shí)現(xiàn)描摹用戶畫像、精準(zhǔn)識別網(wǎng)民金融意圖、洞察股民情緒、預(yù)測行業(yè)市場走向等。
今年在世界互聯(lián)網(wǎng)大會上受到習(xí)主席關(guān)注的百度無人駕駛汽車,本質(zhì)上也是人工智能技術(shù)綜合應(yīng)用。無人駕駛汽車包含高精地圖、語音識別、圖像識別、規(guī)劃行動、分析決策、智能推薦等技術(shù)。這些都需要人工智能的應(yīng)用和支持。百度為研發(fā)無人車構(gòu)建了世界上最大規(guī)模的深度學(xué)習(xí)網(wǎng)絡(luò),擁有萬億級的參數(shù)、千億級的樣本,目前規(guī)模仍在不斷擴(kuò)大。劉煬認(rèn)為深度學(xué)習(xí)的突破將會引領(lǐng)人工智能下一個大的浪潮。
而這些大數(shù)據(jù)和人工智能發(fā)展應(yīng)用的背后,是百度強(qiáng)大云計算能力的支撐。百度的深度語音識別系統(tǒng)每天語音識別和合成請求高達(dá)2.4億次,需要上千臺服務(wù)器,上千塊 GPU+FPGA;在精準(zhǔn)營銷方面,基于百度大數(shù)據(jù)的全網(wǎng)精準(zhǔn)用戶畫像,需要上萬臺服務(wù)器集群,每天需要處理數(shù)十PB數(shù)據(jù)量,具有上千萬標(biāo)簽,并可以達(dá)到 85%以上的準(zhǔn)確率。
所以劉煬在演講中談到,大數(shù)據(jù)和人工智能對于計算的需求遠(yuǎn)超想象。百度的首席科學(xué)家吳恩達(dá)也說過“深度學(xué)習(xí)這臺火箭,燃料為大數(shù)據(jù),而云計算則是引擎”。隨著百度將人工智能提升到公司級戰(zhàn)略定位,對于云計算的依賴和需求也將越來越多,百度也在不斷加大對于底層云技術(shù)的建設(shè)和支持。從底層的數(shù)據(jù)中心到計算、存儲、網(wǎng)絡(luò)和分布式系統(tǒng),百度均位于行業(yè)前列。
開放云夯實(shí)底層黑科技 大數(shù)據(jù)、人工智能對外開放
在數(shù)據(jù)中心領(lǐng)域,百度自建數(shù)據(jù)中心并支持模塊化建設(shè),大大提高了設(shè)計、實(shí)施速度。同時重視綠色節(jié)能,數(shù)據(jù)中心使用離線高壓直流電,做到99.5%的利用率,冷卻也實(shí)現(xiàn)自然冷鏈的工作。電源使用效率(PUE)達(dá)到1.22,位居國內(nèi)第一,并連續(xù)兩年獲得中國數(shù)據(jù)中心協(xié)會的最佳能源節(jié)能獎。
在計算領(lǐng)域,百度擁有國內(nèi)規(guī)模最大深度學(xué)習(xí)異構(gòu)計算集群,同時也是整機(jī)柜方案的領(lǐng)導(dǎo)者,并聯(lián)合騰訊、阿里以及電信運(yùn)營商等一起推動整機(jī)柜的解決方案。在存儲領(lǐng)域使用高密度的存儲,對于98%的磁盤故障可以事先報警,50%以上的磁盤故障可以自動修復(fù),保障存儲安全。在網(wǎng)絡(luò)領(lǐng)域百度自研交換機(jī),全部支持萬兆的網(wǎng)絡(luò)接入,數(shù)據(jù)中心內(nèi)網(wǎng)支持TB級的跨IDC的數(shù)據(jù)。
硬件層的規(guī)模和技術(shù)基礎(chǔ)之外,百度在分布式系統(tǒng)等軟件層的調(diào)度也處于業(yè)內(nèi)領(lǐng)先水平。劉煬指出,百度以網(wǎng)絡(luò)搜索業(yè)務(wù)起家,天生是一個大數(shù)據(jù)公司,承載數(shù)十款用戶量過億的產(chǎn)品和超百萬企業(yè)客戶,具有豐厚的技術(shù)積累和經(jīng)驗。百度擁有Hadoop單集群1.5萬臺,并通過在/離線業(yè)務(wù)混合部署,全部數(shù)據(jù)中心的CPU利用率可以做到50%以上,遠(yuǎn)超業(yè)界同類水平。為了支持百度開放云、百度網(wǎng)盤和網(wǎng)頁搜索等產(chǎn)品,百度支持EB級別的對象存儲和EB級別的結(jié)構(gòu)化存儲。
最后,劉煬表示只有做好云計算基礎(chǔ)領(lǐng)域環(huán)節(jié)的工作,才能更好的支持人工智能、大數(shù)據(jù)等上層應(yīng)用的發(fā)展需求。同時百度也將通過百度開放云釋放技術(shù)的力量,將人工智能、大數(shù)據(jù)以及其他優(yōu)秀的解決方案開放給用戶和整個行業(yè),開拓大家的想象力并幫助大家實(shí)現(xiàn)夢想,推動行業(yè)和社會的發(fā)展進(jìn)步。