[ 我們對20位科學家和工程師的深度調研進行了比較分析,總結出了中國可以通過算法和軟件的應用創(chuàng)新在四個方面持續(xù)強化中國現(xiàn)有價值鏈。這四個方面分別是:智能化產品服務設計、智能化生產制造、智能化供應鏈管理以及智能化運營管理。 ]
[ 我們認為,核心算法和軟件的持續(xù)創(chuàng)新根本上還是取決于基礎科學的發(fā)展和投入。無論是關鍵的軟件還是硬件技術,每一種產品都是基礎科學幾十年來理論積累的產物。因此,我們強調基礎科學投入的長期性與穩(wěn)定性是提高核心算法與軟件原創(chuàng)性的關鍵所在。 ]
在上一篇文章《中國突圍中高端價值鏈,應發(fā)力硬科技》中,我們采用機器學習聚合分類研究,在全球5228種產品類別中系統(tǒng)性地識別了當前中國高度進口依賴的88種“卡脖子”關鍵產品。而為了突破西方對中國在關鍵技術上的制裁,本文基于美國麻省理工學院經濟學家阿西莫格魯(Acemoglu)提出的偏向性技術進步理論,結合近期我們對全球及國內頂級學術機構及科技互聯(lián)網公司共計20位人工智能科學家、算法工程師和數據分析師的調研分析,發(fā)現(xiàn)了當前發(fā)達國家對中國在中高端價值鏈上的制裁主要集中在以芯片、光刻機和半導體為代表的硬件技術上。
而相比硬件,近年來中國在軟件方面的自主研發(fā)和迭代速度進步明顯。因此,我們建議中國可通過自身市場、資本與數據要素優(yōu)勢,集中突破部分“卡脖子”的關鍵軟件和算法技術。具體來說,中國可利用對軟件與算法的創(chuàng)新應用,持續(xù)強化現(xiàn)有的七大優(yōu)勢產業(yè)鏈。在穩(wěn)固現(xiàn)有價值鏈競爭優(yōu)勢的基礎上,圍繞一些數據敏感度較低且可貿易度較高的行業(yè)(如光學器件、化學、機電控制等),不斷提升中國軟件技術與西方高端硬件技術相互間的依賴性,最終幫助中國順利邁入全球中高端價值鏈。
破局之機:數據密集型產業(yè)的崛起
回顧人類歷史上的經濟增長變化,東西方世界真正出現(xiàn)巨大經濟增長差距就是從19世紀工業(yè)革命初開始。圍繞這種差異,一大批經濟學家試圖解釋經濟增長的源泉到底是什么。古典增長理論認為勞動和資本要素是經濟增長的核心動力。而新古典經濟學家在此基礎上進一步納入了全要素概念將技術視為外生變量解釋經濟增長。而從20世紀80年代開始, 盧卡斯(Lucas)和羅默(Romer)等人試圖把技術進步內生化,并解釋了經濟增長的源泉是知識的分享和積累。
近10年來,隨著以大數據、云計算和人工智能為代表的新一代信息技術的發(fā)展,瓊斯(Jones)和托內特(Tonetti)研究了數據在生產過程中的基本模式,并定義了數據作為生產要素對經濟增長的作用。盡管數據作為信息,其本身無法被直接應用于生產,但通過分析和預測數據(信息)指導經濟物品的生產與應用,將顯著降低經濟物品的交易成本,從而提高勞動生產率。
偏向性技術進步理論指出了當技術創(chuàng)新使某生產要素邊際產出相對其他生產要素顯著增長時,技術就會“青睞”(偏向)該要素。同時,該要素的邊際產出和規(guī)模報酬將呈現(xiàn)遞增特征。結合中國經濟增長的實際情況,依靠傳統(tǒng)生產要素投入拉動中國經濟增長的潛力越來越小,無論是勞動還是資本要素的邊際產出近年來均呈現(xiàn)顯著遞減特征。相反,以數據為代表的新生產要素近年來呈現(xiàn)出邊際產出遞增的特征。這是因為信息時代下新一代技術創(chuàng)新(比如云計算、大數據、人工智能、區(qū)塊鏈等)幾乎都是圍繞數據要素生產和發(fā)展的。正如偏向性技術進步理論的核心觀點,技術創(chuàng)新偏向數據要素從而帶動市場資源集中流入數字產業(yè),最終導致數字密集型產業(yè)規(guī)模報酬顯著遞增。
根據我們的預測,2025年中國所擁有的數據規(guī)模將占世界數據圈的30%,這意味著中國將成為擁有數據規(guī)模全球第一的經濟體。龐大的數據規(guī)模將進一步支持中國發(fā)展數據密集型產業(yè)以支持中國經濟增長。
數據產業(yè)的核心競爭力:軟件和算法
盡管中國數據規(guī)模正以驚人的速度持續(xù)擴張,但如何高效地使用數據來指導經濟產品服務創(chuàng)新,是數據密集型產業(yè)向高質量方向發(fā)展的關鍵,也是中國經濟持續(xù)增長的源泉。我們認為,真正對數據密集型產業(yè)擁有絕對控制權,不僅僅取決于數據規(guī)模,更取決于核心算法和軟件系統(tǒng)。
基于我們的研究,長期以來,中國在軟件與核心算法上依舊整體處于被西方國家“卡脖子”的狀態(tài)。比如,在核心工業(yè)軟件領域,國產EDA(電子設計自動化)與發(fā)達國家EDA工具相比,在性能上(如工具完整性、穩(wěn)定性、工藝設計等)仍存在代際差距。在操作系統(tǒng)上,絕大部分手機和個人電腦依舊被三家美國公司(谷歌、蘋果、微軟)所壟斷。在核心算法方面,中國國產的高端機器人在穩(wěn)定性和易用性上仍與日本、美國、德國和瑞士等國家存在差距,反映了中國在中高端制造業(yè)上仍未能掌握相匹配的核心算法。
然而,基于我們對全球和中國頂級高校及科技互聯(lián)網公司20位人工智能科學家和工程師的最新調研情況來看,相比當前“卡脖子”的硬件技術,中國在關鍵軟件領域率先突破的可能性更高。這是基于目前中國在算法和軟件領域具備的三大優(yōu)勢:
一是在經濟層面。中國擁有數據、人力資本與市場要素優(yōu)勢。正如我們提到的,中國擁有全世界最大的數據圈。同時,龐大的消費市場能夠為數據密集產業(yè)提供豐富的應用場景。另外,根據2020年中國專業(yè)IT社區(qū)CSDN(Chinese Software Developer Network)的統(tǒng)計,在中國從事軟件開發(fā)與算法設計相關的學生或工程師已經超過800萬人(根據CSDN活躍用戶計算),其中一線開發(fā)人員已經超過60%。強大的人力資本優(yōu)勢使得軟件和算法開發(fā)可以快速在豐富的場景中進行迭代應用。
二是在制度層面。政府將大力支持數據要素市場的培育。2020年4月中共中央、國務院公布了《關于構建更加完善的要素市場化配置體制機制的意見》,明確了將數據作為新型生產要素。意見同時指出了未來中國將圍繞數據要素在數據共享、數據融合、數據確權、數據定價以及數據安全等一系列方面推行改革。毫無疑問,國家“數據紅利”的釋放將推動數據密集型產業(yè)的發(fā)展應用,這將有利于軟件和算法的迭代創(chuàng)新。
三是在技術層面。受益于開源軟件運動,高級算法與軟件的可得性不再困難。開源軟件被描述為其源碼可以被公眾使用的軟件,并且此軟件的使用、完善和分享方面不受許可證的限制。根據全球最大開源項目托管平臺GitHub統(tǒng)計,到2025年全球參與開源軟件的平臺用戶數量將達到1億用戶。其中,中國開源軟件參與者的數量及開源貢獻度增長已成為全球最快。
破局之道:加快軟件與算法在中國價值鏈上的應用與創(chuàng)新
正如上述分析,我們認為中國有能力通過自身市場、人力資本與數據要素優(yōu)勢,集中突破部分“卡脖子”的關鍵軟件和算法技術。進一步,利用軟件與算法的快速迭代和持續(xù)創(chuàng)新強化中國現(xiàn)有的七大優(yōu)勢產業(yè)鏈。在穩(wěn)固現(xiàn)有價值鏈的競爭優(yōu)勢基礎上,圍繞一些數據敏感度較低且可貿易度較高的行業(yè),不斷提升中國軟件技術與西方高端硬件技術間的依賴性,最終幫助中國順利邁入全球中高端價值鏈。
首先,基于我們對全球及國內20位AI科學家和工程師的調研發(fā)現(xiàn),中國在軟件和算法優(yōu)化與應用層面與西方國家的距離越來越小。比如激光雷達技術從2019年到現(xiàn)在,短短兩年間進步巨大。2019年的時候,激光器、接收器、主控FPGA和采樣用的ADC,這四個最核心軟硬件都是被國外壟斷的,F(xiàn)在國內已經有頂級的激光器生產商,主控和采樣都ASIC(特殊應用集成電路)化了,只剩接收器還沒有完全解決。再如,在語音識別領域,目前全球最先進的新一代語音識別系統(tǒng)“Wenet”也是由中科院和西工大AI科學家自主創(chuàng)新完成的,且整套算法框架完全不同于英國AI科學家Danial Povey所創(chuàng)造的“Kaldi”語音識別系統(tǒng) (上一代國際最先進的語音識別系統(tǒng))。
進一步,我們對20位科學家和工程師的深度調研進行了比較分析,總結出了中國可以通過算法和軟件的應用創(chuàng)新在四個方面持續(xù)強化中國現(xiàn)有價值鏈。這四個方面分別是:智能化產品服務設計、智能化生產制造、智能化供應鏈管理以及智能化運營管理。
1。智能產品與服務設計。利用增強學習(Reinforcement Learning)、神經網絡模型(Neutral Network)以及自然語言處理(Natural Language Processing)對客戶的消費行為和模型進行預測,從而設計新的產品。
在我們的調研中,很多公司早已開始利用大數據對客戶體驗和購買模式進行預測,從而進一步基于預測結果對產品服務進行設計和創(chuàng)新。此外,工程師和設計師可以采用創(chuàng)成式設計(Generative Design)實現(xiàn)產品創(chuàng)新。即通過設定對產品的約束條件(比如顏色、形狀、材料、體積),結合創(chuàng)成式算法(如參數化系統(tǒng)、進化系統(tǒng)、形狀語法及拓撲優(yōu)化算法等)可自動生成上萬種產品設計方案。
2。智能化生產制造。通過監(jiān)督式和無監(jiān)督式機器學習(Supervised Learning & Unsupervised learning)算法,提高產品生產制造的效率和品質。比如,中間品制造生產過程中有諸多分揀作業(yè),如果采用智能化機器分揀,則可大大提高產品生產效率。此外,通過對質量差異化的產品進行深度學習(Deep Learning),再基于對產品各個生產環(huán)節(jié)上所獲得的監(jiān)控數據,可使機器視覺更快、更精確地識別出產品表面的不同生產缺陷。
3。智能化供應鏈管理。利用深度學習算法可優(yōu)化供應鏈運輸路線和倉位管理。比如通過將歷史運輸路線和實際交付成果進行神經網絡訓練,從而分析運輸方案對供應鏈上交易成本的影響,以幫助管理者確定最優(yōu)運輸路線。此外,基于神經網絡算法,可幫助制造商實時檢測庫存變化、及時調整庫存規(guī)模,從而有效控制庫存短缺或過剩的狀況。
4。智能化運營管理。監(jiān)督式學習可有效幫助企業(yè)優(yōu)化運營決策并降低運營成本。利用回歸模型(Regression)、決策樹(Decision Tree)及隨機森林模型(Random Forest)對生產管理系統(tǒng)或機器設備進行故障預測,從而有效降低運營成本。另外,制造商通過傳感器監(jiān)控可收集設備所處環(huán)境的溫度、照明及濕度變化,從而預測故障事件發(fā)生的概率以降低故障產生帶來的不確定性。針對一些生產任務,機器學習可以對生產復雜程度與生產規(guī)模進行匹配分析,從而計算具體生產任務所需的員工數量。
最后,在我們的調研分析中,絕大多數人工智能科學家表示中國在軟件和算法的應用層面與美國等發(fā)達國家?guī)缀跏驱R頭并進。在中國的優(yōu)勢產業(yè)鏈上,我們看到已經有越來越多的企業(yè)開始涌入人工智能浪潮,通過對圖像處理、語音處理、自然語言理解等應用性算法將人工智能應用在各個產業(yè)鏈的不同場景中。在國家政策和代碼開源的支持下,價值鏈上更多的中小企業(yè)可積極通過算法和軟件應用,來強化或提高自身在制造生產環(huán)節(jié)上的競爭力。而在穩(wěn)固現(xiàn)有價值鏈競爭優(yōu)勢的基礎上,在部分細分行業(yè)中,提升西方高端硬件技術在中國軟件系統(tǒng)上的使用依賴性是中國邁入中高端價值鏈的關鍵突破口。
比如,中國在無人機、自動駕駛和區(qū)塊鏈等細分領域上的軟件和算法創(chuàng)新,很可能未來會讓部分國外制造商逐步適應和接受中國的軟件系統(tǒng)。在EDA領域,盡管在先進制程IC(集成電路)設計方面,EDA工具幾乎被國際三大巨頭所壟斷,但國產EDA在40納米及28納米制程工藝上近年來進步非常明顯,結合5G、汽車電子、區(qū)塊鏈等新興領域對IC設計的新需求,這可能為EDA與國外中高端制造商提供相互合作與學習的方向。
破局之障:軟件與算法創(chuàng)新的瓶頸——基礎科學
企業(yè)的數字化和智能化不可能一蹴而就,目前全球也沒有一個通用的模板可以套用。在中國價值鏈上,對于大部分提供中間品、資本品和消費品的泛制造業(yè)公司來說,如何對算法和軟件進行創(chuàng)新,并根據不同的細分場景提供相應的解決方案,依舊是當前主要面臨的挑戰(zhàn)。在我們所調研的20位AI科學家和工程師中,幾乎所有人都提到了中國在核心算法與軟件原創(chuàng)性上仍與發(fā)達國家有不小的差距。此前西方國家可能將關閉對中國GitHub開源代碼分享的消息讓國內很多算法工程師和科學家都感到了緊張。
我們認為,核心算法和軟件的持續(xù)創(chuàng)新根本上還是取決于基礎科學的發(fā)展和投入。無論是關鍵的軟件還是硬件技術,每一種產品都是基礎科學幾十年來理論積累的產物。因此,我們強調基礎科學投入的長期性與穩(wěn)定性是提高核心算法與軟件原創(chuàng)性的關鍵所在。其次,要尋求在重點基礎科學領域實現(xiàn)引領和突破。軟件和核心算法的原創(chuàng)性本質上就是數學信息科學與技術理論的原創(chuàng)。因此,立足當前實際情況,集中要素資源支持數學信息科學領域的基礎理論發(fā)展與創(chuàng)新是必要的。另外,盡管西方部分學術機構對中國存在諸多戒備,但我們還是需要鼓勵中國科研機構更加廣泛、積極地與國際頂級學術機構進行合作。多元化和國際化的科學研究團隊有利于持續(xù)推進基礎科學領域的創(chuàng)新。
(程實系工銀國際首席經濟學家,張弘頊系工銀國際資深經濟學家)