科技日報北京10月8日電,英國《自然》雜志封面以“矩陣游戲”為題,發(fā)表了人工智能(AI)公司“深度思維”團(tuán)隊的最新發(fā)現(xiàn):AI可解決矩陣乘法問題。這是第一個可為矩陣乘法等基本任務(wù)發(fā)現(xiàn)新穎、高效且正確算法的AI系統(tǒng)。換句話說,這個名為“AlphaTensor”的AI能自行發(fā)現(xiàn)新算法,從而解決了50年來數(shù)學(xué)領(lǐng)域一個懸而未決的問題——找到兩個矩陣相乘最快的方法。
數(shù)學(xué)在計算機(jī)編程中經(jīng)常出現(xiàn),通常作為描述和操縱現(xiàn)實(shí)世界現(xiàn)象表示的一種手段。例如,它用于表示計算機(jī)屏幕上的像素、天氣狀況或人工網(wǎng)絡(luò)中的節(jié)點(diǎn)。在這種情況下,使用數(shù)學(xué)的主要方式之一,就是對矩陣進(jìn)行計算。
在對游戲進(jìn)行編程時,矩陣描述了可能的運(yùn)動選項。為了實(shí)現(xiàn)這樣的運(yùn)動,矩陣經(jīng)常被相乘和/或相加。這需要海量的工作,隨著矩陣變得越來越大尤其如此,這就是為什么計算機(jī)科學(xué)家花費(fèi)大量時間和精力來開發(fā)越來越有效算法來完成工作的原因。1969年,數(shù)學(xué)家沃爾克·斯特拉森想出了一種方法,只使用7個乘法運(yùn)算而不是標(biāo)準(zhǔn)的8個乘法運(yùn)算將兩個2×2矩陣相乘。
但在新成果中,“深度思維”研究人員從游戲系統(tǒng)中尋找靈感,這些游戲大多數(shù)都是基于強(qiáng)化學(xué)習(xí)的。在構(gòu)建了一些初步系統(tǒng)之后,研究小組將重點(diǎn)轉(zhuǎn)向了樹搜索,這也用于游戲編程,是系統(tǒng)在特定情況下查看各種方案的一種手段。當(dāng)應(yīng)用于乘法矩陣時,研究人員發(fā)現(xiàn),將AI系統(tǒng)轉(zhuǎn)換為游戲可搜索最有效的方法來獲得所需的結(jié)果——數(shù)學(xué)結(jié)果。
研究人員通過允許它搜索、評估來測試他們的系統(tǒng),然后使用現(xiàn)有算法,并以獎勵來激勵選出最有效的算法。系統(tǒng)學(xué)會了影響矩陣乘法效率的因素。接下來,研究人員將允許系統(tǒng)創(chuàng)建自己的算法,尋求進(jìn)一步提高效率。他們發(fā)現(xiàn),在許多情況下,系統(tǒng)選擇的算法比人類前輩創(chuàng)建的算法更好。
“深度思維”團(tuán)隊希望,未來AI能更多地用來幫助攻克數(shù)學(xué)和科學(xué)領(lǐng)域的一些最重要的難題。
【總編輯圈點(diǎn)】
“AlphaTensor”的前身,其實(shí)就是在國際象棋、圍棋和將棋等游戲中打敗人類高手的“阿爾法零”,可以說,這項工作展示了智能體從游戲到解決數(shù)學(xué)問題的一次重要轉(zhuǎn)變。從數(shù)學(xué)角度看,新AI可比以往更高效地探索算法空間,加深人們對矩陣豐富性的理解。而從更深遠(yuǎn)的角度講,矩陣乘法正是計算機(jī)圖形、數(shù)字通信、神經(jīng)網(wǎng)絡(luò)訓(xùn)練和科學(xué)計算等諸多領(lǐng)域的核心,這一AI帶來的不僅僅是“矩陣游戲”,還將是以上這些領(lǐng)域計算效率的大幅提升。