面臨一場(chǎng)快速到來的技術(shù)變革,比較有效的方法是去剖析:事物的內(nèi)在結(jié)構(gòu),它的發(fā)展體系;什么是穩(wěn)定不變的,什么是變化的,新現(xiàn)象是如何形成的。
最近奇績(jī)舉辦了以《新范式 新時(shí)代 新機(jī)會(huì)》為主題的分享活動(dòng),陸奇博士以“新范式”為核心,分享了他對(duì)當(dāng)前技術(shù)變革的觀點(diǎn),我們基于他的演講整理了文字稿,也同步分享完整的PPT和視頻,歡迎大家一起交流。
本文基于視頻整理的文字和 ChatGPT 的調(diào)整,因此在表達(dá)準(zhǔn)確性上相對(duì)有限,為了更好地理解,我們強(qiáng)烈推薦大家掃描 PPT 右上角二維碼觀看完整視頻,或者點(diǎn)擊文章底部“閱讀原文”獲取完整 PPT 鏈接和不斷校正更新的文字稿。
(分享人:陸奇,奇績(jī)創(chuàng)壇創(chuàng)始人兼 CEO,曾任百度集團(tuán)總裁兼 COO、微軟全球執(zhí)行副總裁、雅虎執(zhí)行副總裁等,畢業(yè)于卡耐基梅隆大學(xué),獲計(jì)算機(jī)科學(xué)博士。)
目錄
一、新范式
(一)新范式的內(nèi)在結(jié)構(gòu)、發(fā)展體系
(二)從數(shù)字化產(chǎn)業(yè)發(fā)展維度看新范式
(三)從技術(shù)驅(qū)動(dòng)人類發(fā)展的維度,看新范式
(四)新范式的社會(huì)影響
(五)新范式的締造者
(六)新范式的動(dòng)力引擎
(七)新范式的演化路徑:進(jìn)化體系新物種
二、新時(shí)代
(一)產(chǎn)業(yè)發(fā)展的擴(kuò)散結(jié)構(gòu)與體系
(二)Open AI生態(tài)快速形成
(三)開發(fā)堆棧雛形高速發(fā)展
(四)經(jīng)濟(jì)發(fā)展格局
(五)新產(chǎn)業(yè)(51.650, 0.30, 0.58%)發(fā)展不斷加速(海外)
(六)新產(chǎn)業(yè)發(fā)展不斷加速(中國(guó))
三、新機(jī)會(huì)
(一)全方位探索把控:“人+事”的機(jī)會(huì)空間
1. “人+事”的探索框架
2. 機(jī)會(huì)在哪里
(二)“事”的機(jī)會(huì)空間
1. 事的三個(gè)機(jī)會(huì)版塊
2. 完整系統(tǒng)的機(jī)會(huì)探索體系
(三)數(shù)字化基礎(chǔ)的機(jī)會(huì)
(四)數(shù)字化應(yīng)用的機(jī)會(huì)
1. 信息知識(shí)
2. 內(nèi)容
3. 游戲
4. 消費(fèi)|電商
5. 社交|社區(qū)
6. 通訊
7. 醫(yī)療
8. 教育
9. 開發(fā)者
10. 設(shè)計(jì)師
11. 研究員(科研)
12. OA/辦公
13. 營(yíng)銷與客戶
14. ERP
15. 生產(chǎn)制造
16. 政府城市
(五)改造世界
1. 新能源科技
2. 新生命科技(生命科學(xué))
3. 新材料科技(材料科學(xué))
4. 新空間科技
(六)新執(zhí)行環(huán)境
(七) “人”的機(jī)會(huì)空間
(八)基礎(chǔ)范式的演變
四、奇績(jī)創(chuàng)壇介紹
正文
一、新范式
(一)新范式的內(nèi)在結(jié)構(gòu)、發(fā)展體系和所需的核心思考維度
范式通常指的是一種發(fā)展模式,它包括觀念性的思考框架、以及實(shí)踐體系和方法論。
當(dāng)前,我們正面臨一場(chǎng)非常大的技術(shù)變革,這是一場(chǎng)范式的變革,它展現(xiàn)出了一個(gè)全新的范式。
每次范式變革都帶來更多的機(jī)遇和挑戰(zhàn),因?yàn)樗纫淖內(nèi)藗冏鍪碌姆绞,也要改變(nèi)藗兊乃伎挤绞。有些變革不一定是范式的改變,而僅僅是發(fā)生了新技術(shù)的變化,在這種情況下,我們?nèi)匀贿可以用原有的思路做新的事情。
然而這一次,范式的變革影響更廣、更深、更全面,我們必須在改變思考方式的同時(shí),以此改變做事的方法。面對(duì)這一新范式,我們主要從以下三個(gè)重要的維度來進(jìn)行分析:
1. 數(shù)字化“三位一體”的結(jié)構(gòu)、“三位一體”的終局。
2. 技術(shù)如何驅(qū)動(dòng)人類發(fā)展的全過程。
3. 它對(duì)人、社會(huì)和人際關(guān)系的影響。
(二)從數(shù)字化產(chǎn)業(yè)發(fā)展維度看新范式
首先,從產(chǎn)業(yè)發(fā)展的維度來分析,這一次范式的變更帶來了哪些影響。
“三位一體”是我們分析這次范式變革所用的穩(wěn)定的內(nèi)在結(jié)構(gòu)體系,這一概念基于復(fù)雜學(xué)理論提出。
在復(fù)雜學(xué)理論中,我們每個(gè)人都是一個(gè)復(fù)雜體系,一個(gè)組織是一個(gè)復(fù)雜體系,人類社會(huì)是復(fù)雜體系,數(shù)字化系統(tǒng)也是個(gè)復(fù)雜體系,任何復(fù)雜體系都有三個(gè)子系統(tǒng),它包括:
1. 信息子系統(tǒng)(subsystem of information),體系必須從環(huán)境中獲得信息。
2. 模型子系統(tǒng)(subsystem of model),用模型對(duì)信息進(jìn)行表達(dá)。它必須充分有效地表達(dá)信息,這種表達(dá)方式讓它可以做推理、做分析、做規(guī)劃。
3. 行動(dòng)子系統(tǒng)(subsystem of action) ,根據(jù)推理和規(guī)劃與環(huán)境互動(dòng),來達(dá)到這個(gè)復(fù)雜體系的目的。
采用這個(gè)三位一體的結(jié)構(gòu),我們可以非常清晰地分析今天我們所看到的數(shù)字化產(chǎn)業(yè)發(fā)展的拐點(diǎn),今天新的范式在本質(zhì)上是怎樣一回事。
首先,我們用三種不同的顏色代表數(shù)字化的三位一體的三個(gè)子系統(tǒng):綠色代表信息子系統(tǒng),藍(lán)色代表模型子系統(tǒng),紅色代表行動(dòng)子系統(tǒng)。
第一個(gè)拐點(diǎn):信息變得無處不在
綠色這條線上有大量的公司,包括 IBM、微軟,這里可以看到的是,1995 年至 1996 年間出現(xiàn)了一個(gè)大的拐點(diǎn)。這個(gè)拐點(diǎn)之后,信息系統(tǒng)呈爆發(fā)式增長(zhǎng),誕生了許多偉大的企業(yè),如谷歌、蘋果、亞馬遜等,世界因此而改變。
為什么會(huì)有這個(gè)拐點(diǎn)?它背后的機(jī)制是什么?
要使產(chǎn)業(yè)發(fā)生根本性的變革,背后的驅(qū)動(dòng)因素通常是它的成本結(jié)構(gòu)變了,這類成本通常是某一類生產(chǎn)資源的成本,是一種觸達(dá)我們生活方方面面并且我們都需要用的生產(chǎn)資本。
信息系統(tǒng)的拐點(diǎn),是信息的生產(chǎn)和獲取成本從邊際成本轉(zhuǎn)向固定成本。每次使用時(shí)的邊際成本越來越低,但是一次性投入越來越高,這是一個(gè)結(jié)構(gòu)性的變化。
我在卡內(nèi)基梅隆剛剛畢業(yè)時(shí)(1995、1996年左右),那個(gè)時(shí)候買一張地圖需要3美元,信息獲取成本曾經(jīng)相當(dāng)高。在今天,我要找一張地圖,網(wǎng)上搜索谷歌地圖不到300毫秒,谷歌花費(fèi)的成本不到1美分,我可以免費(fèi)獲得。而谷歌一年大約花了10億美元的固定成本才做到此。地圖是需要成本的,這個(gè)成本沒有消失,只不過有一系列的技術(shù)降低了獲取和分發(fā)地圖信息的成本,從每次都要付很多,變成(google地圖)一次性付很多。
谷歌使得地圖可以無處不在,其他大量的信息也無處不在,商業(yè)模式簡(jiǎn)單,偉大的公司卻就此誕生了,以谷歌和蘋果為代表的移動(dòng)互聯(lián)網(wǎng)時(shí)代和以亞馬遜為代表的云時(shí)代,都是一系列可以高度濃縮信息并分發(fā)信息的核心技術(shù)驅(qū)動(dòng)的。
所以拐點(diǎn)出現(xiàn)的核心原因,是信息的獲取成本從邊際移向固定成本,使得信息變得無處不在。世界因此而變得扁平。
現(xiàn)在的拐點(diǎn):模型將無處不在
現(xiàn)在我們看到2022年和2023年這個(gè)在藍(lán)色曲線上,由 Open AI 和微軟引領(lǐng),以及其他創(chuàng)業(yè)公司共同參與創(chuàng)造的拐點(diǎn)。
這個(gè)拐點(diǎn)的背后是“模型“的成本發(fā)生了類似的結(jié)構(gòu)性變化,即模型成本從邊際成本發(fā)展為固定成本。這背后的原因是我們有一項(xiàng)新的基礎(chǔ)技術(shù)出現(xiàn)了,它叫大模型。
為什么模型的結(jié)構(gòu)性成本這么重要?
因?yàn)槟P途褪侵R(shí)。我們做任何一件事情都需要知識(shí),知識(shí)的力量是無窮的,相比于信息時(shí)代,模型的產(chǎn)能更強(qiáng)大,發(fā)展的速度一定會(huì)比過去更快。
另一方面,模型與每個(gè)人都有關(guān)。從我們的社會(huì)互動(dòng)和社會(huì)產(chǎn)業(yè)價(jià)值角度來講,我們每個(gè)人都由以下三組模型組合而成:
1. 認(rèn)知模型,我們能聽、能看、能說、能思考。
2. 任務(wù)模型,我們每個(gè)人都能爬樓梯、剝番茄,做各種各樣的動(dòng)作來完成任務(wù)。
3. 領(lǐng)域模型,有些人是律師,有些人是醫(yī)生,有些人是科學(xué)家等等,我們?nèi)说纳鐣?huì)價(jià)值都是這些模型體現(xiàn)出來的。
另外,人類社會(huì)中每一件事情都由模型來表達(dá)和驅(qū)動(dòng)。例如,要運(yùn)營(yíng)一家公司需要一組模型,包括戰(zhàn)略、營(yíng)銷、研發(fā)等等;城市管理,需要一組模型;國(guó)家治理,也需要一組模型;每個(gè)社會(huì)層面需要解決的問題,都是由相應(yīng)的領(lǐng)域模型、任務(wù)模型和人組合完成的。
在大模型技術(shù)高速發(fā)展的時(shí)代,一個(gè)重要的趨勢(shì)是:我們每一個(gè)人,除非你有獨(dú)特的見解、獨(dú)特的認(rèn)知、獨(dú)特的問題解決能力,否則你能做的,大模型都可以做到。
這一次的拐點(diǎn),它攀升的速度一定會(huì)比1995年、1996年還要快。模型將無處不在,知識(shí)將無處不在。今天我們打開手機(jī)、打開任何一個(gè)設(shè)備,信息過來了;以后打開任何一個(gè)設(shè)備,是模型過來了。醫(yī)生診斷是模型,律師服務(wù)是模型,設(shè)計(jì)師是模型,藝術(shù)家是模型,方方面面它都無處不在。
同時(shí),一系列偉大的公司會(huì)因此誕生,他們將付出固定成本,他們將發(fā)明新的商業(yè)模式,最后我們整個(gè)產(chǎn)業(yè)+變革,產(chǎn)生新的世界。這是這個(gè)藍(lán)色拐點(diǎn)所代表的。
這個(gè)拐點(diǎn)的發(fā)展只是時(shí)間問題,而且這個(gè)發(fā)展的時(shí)間會(huì)非常非常快,比我們的想象還快。
下一個(gè)拐點(diǎn):行動(dòng)將無處不在
基于三位一體的結(jié)構(gòu),我們可以自然地回答下一個(gè)拐點(diǎn)是什么,毫無疑問,下個(gè)拐點(diǎn)是行動(dòng)系統(tǒng)。
今天的大模型時(shí)代是個(gè)生成模型,它能有效地控制操作各種設(shè)備;下一個(gè)拐點(diǎn)將是機(jī)器人(13.500, -0.61, -4.32%)、自動(dòng)駕駛和空間計(jì)算的組合為基礎(chǔ)。今天采取行動(dòng)的成本很高,但借助大模型的互動(dòng),未來采取行動(dòng)與環(huán)境互動(dòng)以滿足人的需求的成本將會(huì)越來越低,行動(dòng)將無處不在。
要引領(lǐng)下一個(gè)拐點(diǎn),特斯拉目前處在非常優(yōu)勢(shì)的地位,因?yàn)樗跈C(jī)器人技術(shù)、自動(dòng)駕駛技術(shù)、人工智能技術(shù)方面的整體布局相當(dāng)完整。其他公司會(huì)不會(huì)參與下一波,搶占下一個(gè)拐點(diǎn)?我們拭目以待。
未來的可能:數(shù)字化技術(shù)和人類社會(huì)一起共同進(jìn)化
通過數(shù)字化三位一體的結(jié)構(gòu)性分析判斷,我們可以看清今天的新范式,它的終局是數(shù)字化技術(shù)將達(dá)到三位一體,與人類社會(huì)共同進(jìn)化,這一共同進(jìn)化從長(zhǎng)期看,將帶來真正的智能系統(tǒng)。
真正意義上的智能系統(tǒng),必須具備四個(gè)核心環(huán)節(jié):
第一,它能夠涌現(xiàn)(應(yīng)當(dāng)具備自我組織和自我優(yōu)化的能力,能夠在特定環(huán)境中自發(fā)地形成和調(diào)整結(jié)構(gòu),而非由某個(gè)中心控制器編程或設(shè)計(jì))
第二,它有代理能力,能夠自主決策(它可以代表用戶或?qū)嶓w獨(dú)立地進(jìn)行決策和執(zhí)行任務(wù),而不僅僅是簡(jiǎn)單地響應(yīng)外部指令)
第三,它功能可見,有 affordence(Affordence 是一種設(shè)計(jì)原則,強(qiáng)調(diào)讓用戶直觀地理解如何與產(chǎn)品或系統(tǒng)進(jìn)行交互)
第四,它是具象的(既有形象、直觀的表現(xiàn)形式,便于用戶理解、感知和操作)
(三)從技術(shù)驅(qū)動(dòng)人類發(fā)展的維度,看新范式
接著,我們看這次范式變更的第二個(gè)維度:它在人類以技術(shù)驅(qū)動(dòng)社會(huì)發(fā)展的進(jìn)程中扮演的多維度的重要角色。
科學(xué)范式進(jìn)入第四(第五)范式
上圖左下角(①科學(xué)的范式)表達(dá)的是人類無盡地追求知識(shí)、能力和財(cái)富的過程。這一過程有三大要素:
第一是科學(xué)?茖W(xué)是解釋和預(yù)測(cè)現(xiàn)象?茖W(xué)發(fā)展從第一范式經(jīng)驗(yàn)主義,到第二范式系統(tǒng)性地做實(shí)踐,再到第三范式大理論做模擬,第四范式數(shù)據(jù)驅(qū)動(dòng),第五范式數(shù)據(jù)加技術(shù)驅(qū)動(dòng)。人類社會(huì)進(jìn)步最根本的生產(chǎn)力是科學(xué)的進(jìn)步,這次的技術(shù)變革直接驅(qū)動(dòng)了新一代的科學(xué)發(fā)展范式?茖W(xué)高速進(jìn)入第四的數(shù)據(jù)驅(qū)動(dòng)、第五的計(jì)算驅(qū)動(dòng)即大模型驅(qū)動(dòng)階段,這是這個(gè)新范式對(duì)人類發(fā)展結(jié)構(gòu)里的第一個(gè)根本影響。
第二是技術(shù)。技術(shù)的本質(zhì)是人基于科學(xué)開發(fā)的能力去改變自然現(xiàn)象,用信息轉(zhuǎn)化能源去滿足人的需求。
第三是經(jīng)濟(jì)。人類的經(jīng)濟(jì)發(fā)展體系是技術(shù)驅(qū)動(dòng)的。技術(shù)驅(qū)動(dòng)的社會(huì)經(jīng)濟(jì)發(fā)展到目前為止,只有三種大的模式,這三種模式都是信息和能源的組合決定的,(1)農(nóng)業(yè)社會(huì)主要靠光合作用;(2)工業(yè)社會(huì)靠化石能源加上機(jī)械設(shè)備、電氣設(shè)備,電子設(shè)備;(3)數(shù)字化,用信息越來越有效地轉(zhuǎn)化能源。
數(shù)字化范式變更:加速數(shù)字化的能源轉(zhuǎn)化
圖中右下角,指的是當(dāng)代技術(shù)驅(qū)動(dòng)人類發(fā)展的體系。我們現(xiàn)在所處的是第三代,是數(shù)字化時(shí)代這條藍(lán)色的曲線。
這張圖表達(dá)了兩層含義:
一方面,數(shù)字化時(shí)代根本意義上是用數(shù)字化、可編程的能力更有效地轉(zhuǎn)化能源;
另一方面,數(shù)字化是人的延伸,數(shù)字化是人自我的認(rèn)知和能力的延伸。
在這個(gè)時(shí)代,數(shù)字化是核心驅(qū)動(dòng)力(3.120, 0.04, 1.30%)。
這次數(shù)字化范式的變更,將直接驅(qū)動(dòng)模型和行動(dòng)體系,加速數(shù)字化轉(zhuǎn)化能源的能力。進(jìn)而,我們可以更有效地去改造世界,滿足人的需求。
人類改造世界范式變更:探索進(jìn)入更遠(yuǎn)更深更廣闊
要改造世界,滿足人的需求,有以下幾個(gè)組成部分:
1. 我們需要能源,要轉(zhuǎn)化能源,要新的可持續(xù)的能源,用技術(shù)來驅(qū)動(dòng);
2. 轉(zhuǎn)化能源只有兩條通路:一種是用生命體系來轉(zhuǎn)化,另一種是用物理體系轉(zhuǎn)化;相應(yīng)的,我們?cè)诟咚侔l(fā)展新生命科學(xué)和新材料科學(xué);
3. 能源轉(zhuǎn)化必須要有物理空間,我們?cè)诟咚侔l(fā)展新空間技術(shù)去去創(chuàng)造價(jià)值。
整合在一起,我們可以看到的人類在認(rèn)識(shí)世界,改造世界,為我所用的路程,將直接和間接地被今天的新范式進(jìn)一步驅(qū)動(dòng)。
經(jīng)濟(jì)發(fā)展范式變更:更多的企業(yè)成為科技公司
今天的經(jīng)濟(jì)核心生產(chǎn)力,基本還是以設(shè)備、勞工、資本、大眾商品、原材料、能源等。未來技術(shù)將越來越多的成為直接生成力,越來越多的企業(yè)將成為科技企業(yè)。什么是科技企業(yè)?
舉一個(gè)例子,為什么特斯拉是大家公認(rèn)的一家科技公司?科技公司與非科技公司的根本區(qū)別在于什么?
因?yàn)樘厮估眯畔、用軟件、用人工智能,能源轉(zhuǎn)化效率越來越高,它每設(shè)計(jì)一個(gè)新的車子、每研發(fā)一個(gè)新的設(shè)置、每制造一個(gè)新的設(shè)備,效益都在越來越高。而老一代汽車企業(yè)它的核心生產(chǎn)力,還是以前的流水線、工人、設(shè)備等。
本質(zhì)上,它讓“信息更有效地轉(zhuǎn)化能源”,讓技術(shù)驅(qū)動(dòng)創(chuàng)新成為直接的生產(chǎn)力。
(四)新范式的社會(huì)影響
很多人說這一次的變革堪比工業(yè)革命,本質(zhì)上是有道理的。我們不妨回顧下人類歷史的發(fā)展:
農(nóng)業(yè)社會(huì):讓人可以定居,從此有了“家”的存在
農(nóng)業(yè)社會(huì)之前是游牧?xí)r代,是人找吃的東西,但我們從農(nóng)業(yè)社會(huì)開始,發(fā)明了技術(shù):耕種、家畜等。這些技術(shù)給人帶來了一個(gè)重要價(jià)值,人可以定居,有家,有固定的發(fā)展環(huán)境。
工業(yè)社會(huì):解放土地對(duì)人的束縛,減少大量體力勞動(dòng)
工業(yè)社會(huì)對(duì)人帶來的影響是根本性解放,
第一,它把農(nóng)業(yè)社會(huì)中將人綁定在土地上、沒有移動(dòng)自由的情況,轉(zhuǎn)變到人基本上有大量移動(dòng)自由、可以到別的地方去工作生活的情況。
第二,它也逐步把人從強(qiáng)體力勞動(dòng)當(dāng)中解放出來,人基本上不需要走很多的路,不需要扛很重的東西,不需要做大量的重復(fù)性勞力工作。機(jī)械設(shè)備、電器設(shè)備、電子設(shè)備這些工業(yè)時(shí)代的早期產(chǎn)品基本上把這些勞力都替代掉了。
工業(yè)革命對(duì)人的影響是巨大的,一方面解放了土地,另一方面釋放出了人的大量體力勞動(dòng)。
信息時(shí)代:隨時(shí)隨地獲取信息,減少大量腦力勞動(dòng)
信息時(shí)代讓人可以無處不在地獲得信息,進(jìn)一步減少人類的腦力和體力勞動(dòng)。
經(jīng)濟(jì)發(fā)展也從產(chǎn)品經(jīng)濟(jì)變成服務(wù)經(jīng)濟(jì),這個(gè)時(shí)代的典型職業(yè)是碼農(nóng)、設(shè)計(jì)師、分析師等。
大模型時(shí)代:腦力勞動(dòng)有了替代,人類有了智能伙伴
這一次大模型時(shí)代的變革,也將形成新的社會(huì)關(guān)系。
與工業(yè)時(shí)代進(jìn)行類比,工業(yè)時(shí)代給了我們很多能力,封裝成鋼材、汽車、火車、設(shè)備,我們要用體力做的東西基本上都被替代了。
而這次,我們有一系列的模型,它們也可以封裝成各種形式,各種各樣的設(shè)備,我們腦力要做的事情都都可以讓它們來輔助,替代和提高。人的腦力勞動(dòng)將以形成非常獨(dú)到的見解和發(fā)展獨(dú)特的認(rèn)知能力為主。
這個(gè)時(shí)代的典型職業(yè)將是創(chuàng)業(yè)者、科學(xué)家和藝術(shù)家。藝術(shù)家和科學(xué)家的本質(zhì)是形成獨(dú)到的見解,而創(chuàng)業(yè)者是把想法變成現(xiàn)實(shí)的人
人工智能時(shí)代:建立全新價(jià)值體系,探索更多未來
我在 YC 研究院和 Open AI 下面做了一個(gè)項(xiàng) UBI(通用基本收入:Universal Basic Income) ,它研究的問題就是:當(dāng)人們不需要為了謀生工作的時(shí)候,人們的驅(qū)動(dòng)力和行為將會(huì)發(fā)生怎樣的變化。
我們可以想象的是,全新的價(jià)值體系將被建立。由于數(shù)字化的能力以及 Web3 的存在,在未來的時(shí)代里,信息觸手可及、人們自由移動(dòng)、經(jīng)濟(jì)基礎(chǔ)改變,由此產(chǎn)生一個(gè)問題:人類會(huì)不會(huì)回到新一代的游牧?xí)r代?
(五)新范式的締造者
范式帶來的挑戰(zhàn)和機(jī)會(huì),就是適應(yīng)新的思考方法和新的實(shí)踐體系。
我們?nèi)绾稳ジ玫匕芽剡@個(gè)機(jī)會(huì)?
有一個(gè)關(guān)鍵方法,是認(rèn)真分析研究這個(gè)范式的締造者:看看他們是怎么思考的、怎么實(shí)踐的。
這一次新范式的到來,不是水到渠成的,它是一個(gè)突變。
Open AI 為什么能夠破局,因?yàn)樗吡艘粭l反共識(shí)的道路。
要了解 Open AI 的歷史,必須要了解 Sam。我跟 Sam 是在2005年在哈佛大學(xué)舉辦的 YC 成立儀式上認(rèn)識(shí)的,他是 YC 體系思路的繼承者和傳播者。2014年他接管了 YC,成為 YC 的掌門人。
2016年他聯(lián)合創(chuàng)建 Open AI,他和他的團(tuán)隊(duì)核心人員代表了新一代特殊的組合能力,代表著可以推動(dòng)這個(gè)范式進(jìn)一步往前發(fā)展的思考體系和執(zhí)行體系。
Open AI 的思考體系
他們的思考體系,有幾個(gè)重要的特征:
第一,堅(jiān)信未來,堅(jiān)信通用智能一定會(huì)到來,任何人都擋不住 Sam,他建立打造 Open AI 的一切都不會(huì)讓任何人干預(yù)控制;Open 用最快速度實(shí)現(xiàn) AGI。
第二,在技術(shù)上,他們相信兩個(gè)重要的點(diǎn):一是模型只要足夠深,用無監(jiān)督學(xué)習(xí),用數(shù)據(jù)加上算力,用一個(gè)高效的訓(xùn)練體系,就能無止境地探索通用智能;二是強(qiáng)化學(xué)習(xí)或者增強(qiáng)學(xué)習(xí),這跟進(jìn)化在本質(zhì)上相關(guān),是模型能為人所用的核心。
他們堅(jiān)信這兩點(diǎn)。早期做了大量強(qiáng)化學(xué)習(xí)方面的探索,等到他們強(qiáng)化學(xué)習(xí)已經(jīng)有一定基礎(chǔ)之后,就立馬把所有精力和資源聚焦在無監(jiān)督學(xué)習(xí)上。
Open AI 的執(zhí)行體系
新的能力:在團(tuán)隊(duì)能力上,他們堅(jiān)信新一代的組織既要做前沿科研,又要做基礎(chǔ)工程研發(fā),還要開發(fā)平臺(tái)和產(chǎn)品及商業(yè)化。Open AI 所代表的是全新的組織、全新新的能力,他們所做的一切是要既能做科研、又能寫代碼、又能做產(chǎn)品,這些能力是分不開的。
新的組織:有一個(gè)重要關(guān)鍵要素是它需要融到大量的資本,長(zhǎng)期要回歸社會(huì),而且在實(shí)體結(jié)構(gòu)上實(shí)現(xiàn)任何投資者都不能影響你追求的目標(biāo)。
Open AI 不是一家公司,也不是合伙制,它是一種嶄新的新型組織。從長(zhǎng)期來看,Open AI 的盈利結(jié)束之后,它所產(chǎn)生的一切都是社會(huì)公有的,它的頂層階段是一個(gè) Nonprofit 。這是經(jīng)過深思熟慮之后,非常有勇氣堅(jiān)持著一步步追求他們走的路徑,才能造成迄今7年后的突破。
Open AI 的技術(shù)發(fā)展路徑
GPT1 是重要的第一步,預(yù)訓(xùn)練大模型,核心是通過自然語言處理和解決問題。
自然語言處理通常包含多個(gè)任務(wù),傳統(tǒng)做法是每個(gè)任務(wù)去訓(xùn)練一個(gè)模型。Open AI 不這樣做,他們預(yù)訓(xùn)練一個(gè)大的模型,但是預(yù)訓(xùn)練的結(jié)果要和單獨(dú)做模型一樣好,甚至更好。GPT1 就做這個(gè),做一次預(yù)訓(xùn)練,就能達(dá)到在多個(gè)自然語言任務(wù)上使用的目標(biāo),GPT1 的效果比單獨(dú)針對(duì)具體任務(wù)訓(xùn)練的模型還要好。
GPT2 是遷移,在預(yù)訓(xùn)練之后做微調(diào), 可以把預(yù)訓(xùn)練中學(xué)到的東西,通過微調(diào)遷移到新的下游任務(wù)模型中。
GPT3 是非常核心的一步,實(shí)現(xiàn)很強(qiáng)的泛化能力。
在少樣本和0樣本情況下,GPT3 展現(xiàn)出強(qiáng)大的泛化能力,尤其是通過場(chǎng)景下學(xué)習(xí)(In-context-learning)和給定提示解決問題,無需微調(diào)。
Dalle-E,啟動(dòng)圖像模態(tài)。
Codex:為編程語言微調(diào),引入模型重要的邏輯能力和長(zhǎng)期用AI來開發(fā)AI的路徑。
GPT3.5 實(shí)現(xiàn)了根本性突破,引入了指令微調(diào)。
人可以去寫指令,開啟了能讓模型全方位對(duì)齊的開發(fā)能力;它先用了代碼的指令Codex,而真正在產(chǎn)品上突破的是對(duì)話指令,就是讓它去學(xué)會(huì)人是怎么對(duì)話的,進(jìn)而誕生了 ChatGPT。這是人類歷史上從來沒有發(fā)生過的成就:短短兩個(gè)月內(nèi),內(nèi)達(dá)到一億活躍用戶,用的人還越來越多,有很多愿意付費(fèi),這在歷史上前所未有。
GPT4 實(shí)現(xiàn)了了完整的工程研發(fā)體系。
GPT4 之后,如 ChatGPT、plugin 等將全面建立產(chǎn)業(yè)生態(tài)。
從 Open AI 的發(fā)展中我們可以看到:一個(gè)團(tuán)隊(duì)如果是在運(yùn)用新的范式下的核心思考和實(shí)現(xiàn)體系,他們創(chuàng)新的能力將有多大?
因此,在這個(gè)時(shí)代,深度解讀 Open AI 的成長(zhǎng)歷史,了解他們的思考實(shí)踐體系,對(duì)我們來說是有很大的意義的。
(六)新范式的動(dòng)力引擎
GPT模型體系,驅(qū)動(dòng)新范式的動(dòng)力引擎
在這個(gè)范式的背后,有組核心技術(shù),一個(gè)動(dòng)力引擎在驅(qū)動(dòng)著這個(gè)范式的進(jìn)展。
引擎的內(nèi)核是驅(qū)動(dòng)的源泉,它在本質(zhì)上就是 GPT 模型體系。
GPT 是個(gè)模型系統(tǒng),這個(gè)大模型像一個(gè)黑洞一樣,把所有的模型都吸進(jìn)這個(gè)引擎里面去了。
1. 它能夠高效地壓縮表達(dá)所有的人類關(guān)于世界的知識(shí),尤其是文字或者其他模態(tài),比如圖片、視頻。
GPT 為什么能夠進(jìn)行高效壓縮?這里面有兩個(gè)點(diǎn):
要壓縮信息,尤其是高效壓縮信息,你必須要有知識(shí),必須要理解世界,否則無法壓縮信息,只能存儲(chǔ)信息。
一個(gè)高度壓縮的信息集,能同時(shí)用來解決多種任務(wù),在根本意義上它就是知識(shí),知識(shí)沒有其他更好的定義。知識(shí)就是高度壓縮的信息,一種信息的表達(dá),可以用來解決多種問題,它的信息表達(dá)是非常緊湊的。
2. 能持續(xù)提高泛化能力(涌現(xiàn),子概念空間等)
它能涌現(xiàn)。涌現(xiàn)是什么?
在相同的模型架構(gòu)下,通過增加參數(shù)、Token或者延長(zhǎng)訓(xùn)練時(shí)間,模型解決任務(wù)的能力會(huì)不斷演進(jìn)。例如,常識(shí)推理能力、算術(shù)能力以及針對(duì)特定任務(wù)的解決能力都會(huì)逐漸顯現(xiàn)。在GPT模型不斷提升規(guī)模的過程中,涌現(xiàn)現(xiàn)象持續(xù)發(fā)生,關(guān)于涌現(xiàn)的科研論文目前也非常活躍。
模型的泛化能力至關(guān)重要;少樣本泛化和零樣本泛化(如從一個(gè)例子中推斷其他情況,甚至在沒有看過的情況下也能明白其中原理)。僅僅在概念層面進(jìn)行泛化是不夠的。GPT 的泛化能力主要體現(xiàn)在潛在概念(latent concept)和子概念(subconcept)這個(gè)層面,并且其泛化能力在不斷增強(qiáng)。
3. 推理能力不斷的增強(qiáng)和被探索出來
人類基本上擁有六、七種主要的推理能力,包括演繹、知識(shí)歸納、常識(shí)等。在GPT大模型中,這些推理能力會(huì)不斷地通過諸如思維鏈(Chain of Thought)這樣的提示展現(xiàn)出來。
4. 更有效更可延伸的對(duì)齊(自然語言,價(jià)值等)
GPT 模型已經(jīng)幫助我們將世界上的大量信息(知識(shí))進(jìn)行了壓縮,而我們使用它的過程就是實(shí)現(xiàn)對(duì)齊。
Open AI 的 GPT 模型在對(duì)齊任務(wù)方面取得了顯著的成果。其突破性表現(xiàn)和增強(qiáng)學(xué)習(xí)方法在對(duì)齊方面表現(xiàn)突出,如自然語言理解和價(jià)值觀的對(duì)齊。
潛空間對(duì)齊:首先,對(duì)齊任務(wù)需要與人類潛空間保持一致。通過圖表、編程語言或自然語言使用大模型,都是實(shí)現(xiàn)對(duì)齊的手段。潛空間對(duì)齊本質(zhì)上涉及到大量的權(quán)重調(diào)整。
價(jià)值觀對(duì)齊:此外,為了善用大模型,還需要在價(jià)值觀方面達(dá)到對(duì)齊,確保使用它不會(huì)對(duì)社會(huì)造成負(fù)面影響。目前,GPT 尚未達(dá)到主流社會(huì)可接受的價(jià)值觀水平,因此 Open AI 需要進(jìn)行大量的價(jià)值觀對(duì)齊工作。
5. 能足夠并持續(xù)地充分利用更多有效算力
尤其是 Transformer,實(shí)際上它的模型架構(gòu)并不是最理想的。雖然能利用算力,但效率并不是特別高。模型過于密集,對(duì)算力和通信帶寬的要求很高。盡管如此,至少今天主流的算力還是可以被充分利用起來,從而帶來更大規(guī)模的模型和更多的涌現(xiàn)。
6. 能用好充足的 token/模態(tài)和有效的 token 化
目前我們的模型基本上能夠充分且有效地利用人類知識(shí)所能觸及的主要模態(tài),如語言、圖像、視頻等。這些模態(tài)都可以很好地被轉(zhuǎn)化為 token,而經(jīng)過 token 化后,它們可以高效地融入到大型模型中。
7. 能有效地參數(shù)擴(kuò)展:小型化,本地化
模型在不斷地高效擴(kuò)展,包括參數(shù)增加、(模型)層次加深以及在進(jìn)行推理時(shí)實(shí)現(xiàn)更好的平衡。模型可以實(shí)現(xiàn)小型化和本地化,通過各種架構(gòu)優(yōu)化,在數(shù)字設(shè)備端(如物聯(lián)網(wǎng)設(shè)備)上進(jìn)行使用。
8. 能有效地?cái)U(kuò)展任務(wù)領(lǐng)域和專業(yè)知識(shí)
模型具備系統(tǒng)性的擴(kuò)展能力,可以與符號(hào)求解器、工具接口和專業(yè)知識(shí)相結(jié)合。這些集成在一起,使得模型具備足夠的驅(qū)動(dòng)力。
將這些能力相互疊加,我們看到了一個(gè)具備堅(jiān)實(shí)基礎(chǔ)、高操作性和強(qiáng)大擴(kuò)展性的模型體系。它是這個(gè)時(shí)代背后的強(qiáng)大推動(dòng)力,引領(lǐng)模型從邊際成本走向固定成本。
引擎發(fā)展當(dāng)下的四個(gè)要點(diǎn):
1. 核心維度過了拐點(diǎn),全方位攀升
第一,它幾乎封裝了全世界所有的知識(shí)。
第二,它內(nèi)嵌了足夠的學(xué)習(xí)能力和推理能力。本質(zhì)上所代表的是一個(gè)今天的斯坦福高材生,幾乎什么學(xué)科都懂,什么考試都可以考到前5% 。而且它學(xué)習(xí)速度非?欤粫(huì)累,可以永遠(yuǎn)不斷地思考,有大量的算力可以用。它還自然語言界面,每個(gè)人都能用,每個(gè)人都能夠得到價(jià)值。它的能力越來越強(qiáng),能解決的任務(wù)越來越多。并且,它的成本在變得越來越低。
顯然,這個(gè)引擎在核心維度,已經(jīng)過了拐點(diǎn),并且在全方位地加速攀升。
2. 自然語言(NL)是突破的關(guān)鍵
通向通用智能,Open AI 走了一條反共識(shí)的道路。
在 Open AI 之外,特別是四、五年前,幾乎所有人都認(rèn)為通用智能的發(fā)展路徑與動(dòng)物智能相一致。動(dòng)物智能向通用智能演變的過程是先從視覺開始,通過視覺識(shí)別目標(biāo)、學(xué)會(huì)推理,然后逐步形成符號(hào),再發(fā)展為語言(先有口語,后有書面語言),最終形成像人類一樣的完整知識(shí)體系。
然而,Open AI 采用了相反的做法,它不是從視覺開始,而是從語言出發(fā),去構(gòu)建通用模型能力。
在我看來,語言是一個(gè)特殊的潛在認(rèn)知空間,是人類與物理世界之間最寬泛、最重要的橋梁。從根本上講,它更多是一種泛化和思考工具,而溝通只是副產(chǎn)品。沒有語言,我們無法實(shí)現(xiàn)零樣本泛化,而這種泛化能力正是最關(guān)鍵的。
在自然語言處理領(lǐng)域,我參與搜索引擎相關(guān)工作已有20多年,我認(rèn)為歷史上一直存在一個(gè)誤區(qū)。傳統(tǒng)自然語言處理方法的缺乏可行性,因?yàn)橄到y(tǒng)需要首先分析句子的各個(gè)成分,分析它是一個(gè)動(dòng)詞、名詞或形容詞等,但問題關(guān)鍵在于,這個(gè)詞代表什么,是一部電影還是一個(gè)游樂場(chǎng),這是需要以知識(shí)的理解和獲取為基礎(chǔ)的。因此,如果沒有全球范圍內(nèi)的知識(shí),從根本上無法處理語言。
Open AI 采用了一種新方法。它利用 GPT 封裝了世界上絕大多數(shù)知識(shí),以此為基礎(chǔ),先構(gòu)建一個(gè)知識(shí)引擎,再通過對(duì)話進(jìn)行調(diào)試,從而實(shí)現(xiàn)自然語言處理。
這與過去十幾年采用的方法截然相反。有了知識(shí),它不僅能處理語言,還可以利用知識(shí)約束語言解釋的空間。這種變化在某種意義上是從知識(shí)開始理解語言,而非在理解語言后獲取知識(shí)。
自然語言處理現(xiàn)已突破了門檻,開辟了一種全新的人與數(shù)字世界的交互方式,為我們帶來了一種有效且適用于任何場(chǎng)景的交互工具。
3. 可見和可持續(xù)的技術(shù)發(fā)展(右上角)
右上角是關(guān)于這個(gè)引擎如何持續(xù)地將范式向前推進(jìn)。
在向前推進(jìn)的過程中,需要新技術(shù)、新科研成果、新的工程實(shí)踐和新資源。我們能看到很多工作都在進(jìn)行。
首先,在模型方面,需要解決模型的魯棒性、模型稀疏化、擴(kuò)展注意力寬度,甚至形成注意力循環(huán)等。
同時(shí),需要更強(qiáng)的推理能力、更多的涌現(xiàn)、更強(qiáng)的潛在概念和子概念泛化,融合和統(tǒng)一符號(hào)運(yùn)算與重疊向量堆疊體系,以及因果關(guān)系推理等。
其次,需進(jìn)一步對(duì)齊,包括價(jià)值觀對(duì)齊和拓展更多潛在空間。
同時(shí),還需要研究更多模態(tài),特別是跨模態(tài)的圖像和視頻。跨模態(tài)推理(從視覺模態(tài)學(xué)習(xí)推理,將其擴(kuò)展到語言模態(tài)),語言模態(tài)中學(xué)到的泛化能力,無論是零樣本、多樣本還是少樣本,都可以擴(kuò)展到圖像模態(tài)。
最后,覆蓋更多領(lǐng)域和應(yīng)用,提高模型的擴(kuò)展性和適應(yīng)性,加強(qiáng)工程實(shí)踐。基礎(chǔ)算力、通信系統(tǒng)、設(shè)施工具等方面的研究也在快速推進(jìn)。
綜合起來,這個(gè)引擎的能力將越來越強(qiáng)大。
4. 發(fā)展飛輪雛形啟動(dòng)
這個(gè)動(dòng)力引擎,它的增長(zhǎng)飛輪已經(jīng)形成雛形。
資本已經(jīng)開始大量投入,商業(yè)模式盈利也已經(jīng)具備初步的可行性,政府和產(chǎn)業(yè)界已經(jīng)投入大量的算力,新的平臺(tái)、新的應(yīng)用、新的商業(yè)模式開始大量出現(xiàn),越來越多初創(chuàng)公司和大廠參與的生態(tài)開始形成。每個(gè)人的生產(chǎn)力都在提高,它的安全問題、社會(huì)認(rèn)可度也都在被積極的解決。
(七)新范式的演化路徑:進(jìn)化體系新物種
范式的變化,意味著思考與實(shí)踐體系的變化。
大模型為人類技術(shù)發(fā)展開辟了新篇章,是技術(shù)世界中的全新物種。
技術(shù)的本質(zhì)和內(nèi)在規(guī)律:進(jìn)化
著名作者,復(fù)雜學(xué)體系大師 W.Brian Arthur 寫過一本書叫《技術(shù)的本質(zhì)》。
書中主要的觀點(diǎn),是技術(shù)發(fā)展具有進(jìn)化性,它的進(jìn)化與達(dá)爾文進(jìn)化理論非常類似,同樣涉及結(jié)構(gòu)、功能組合和選擇,會(huì)朝著更符合人類需求更多的方向發(fā)展。
達(dá)爾文的進(jìn)化選擇,在于生存能力更強(qiáng),對(duì)環(huán)境變化反應(yīng)能力更強(qiáng)的才能生存,即適者生存。從某種程度上來說,進(jìn)化并不意味著越來越強(qiáng),而是變得越來越適應(yīng)。而技術(shù)的進(jìn)化是向人類需求多的方向做選擇的。
大模型的進(jìn)化方向:更好地滿足人類的發(fā)展需求
大模型的發(fā)展方向,呈現(xiàn)出類似達(dá)爾文進(jìn)化論的進(jìn)化特點(diǎn),即滿足人類不斷變化的需求。
大模型有很多基礎(chǔ)模型,有不同的基礎(chǔ)模態(tài),比如蛋白、核酸、空間等不同模態(tài);在大模型的基礎(chǔ)之上,會(huì)演化出更多的模型,領(lǐng)域模型、工作模型、個(gè)人模型,它們都將會(huì)具有更強(qiáng)的記憶、推理等能力。
關(guān)注大模型時(shí)代,有2種模型系統(tǒng),是我思考比較多的:
第一種是機(jī)器學(xué)習(xí)的模型(目前以系統(tǒng)1為主),今天大模型世界做推理的基礎(chǔ),基本上以系統(tǒng)1為主。相當(dāng)于人類思考方式中的快思考、直覺反應(yīng)?梢越鉀Q生活中方方面面的問題。
它是過程性的、可計(jì)算的、具有場(chǎng)景化的特點(diǎn),當(dāng)場(chǎng)景發(fā)生變化時(shí),模型也會(huì)相應(yīng)地調(diào)整,具有很強(qiáng)的可擴(kuò)展性和易用性。優(yōu)點(diǎn)是,它能夠在特定的場(chǎng)景中進(jìn)行對(duì)齊和泛化,但可能在其他領(lǐng)域并不適用。
第二種是人類建立的模型(基本以系統(tǒng)2為主),人建立的模型,它是基于人類專業(yè)知識(shí)建立的模型,相當(dāng)于思考方式中的慢思考、邏輯推理,包括了像愛因斯坦理論和牛頓理論這樣的科學(xué)理論、符號(hào)、結(jié)構(gòu)、知識(shí)圖譜和數(shù)學(xué)公式等。
這類模型的優(yōu)點(diǎn)是,在專業(yè)領(lǐng)域具有很強(qiáng)的泛化能力,因?yàn)樗鼈兪腔趯I(yè)知識(shí)和理論構(gòu)建的。
然而,它與我們生活的方方面面聯(lián)系很少,無法直接解釋一些日,F(xiàn)象,例如樹葉的形狀、貓咪的顏色等。
我們真正的需求,是這兩種模型之間的組合。當(dāng)遇到一些關(guān)鍵問題,需要通過系統(tǒng)化方法進(jìn)行邏輯分析、推理和嚴(yán)謹(jǐn)論證;同時(shí),我們也有大量需求,并不需要進(jìn)行深入分析,只需要直觀快速反應(yīng)。
當(dāng)大模型和人類建立的模型結(jié)合起來,就能更好地解決人們的需求和問題。我們看到的發(fā)展趨勢(shì)是,系統(tǒng)1和系統(tǒng)2已經(jīng)有越來越多的整合,朝著更好的滿足人類需求的方向演進(jìn)。
大模型的進(jìn)化類比:進(jìn)化樹和寒武紀(jì)(196.020, -3.06, -1.54%)
PPT 中右上角這張圖,展示了可開源的大模型的進(jìn)化樹。借助這個(gè)初步的進(jìn)化樹,可以追溯到模型的源頭、觀察模型的能力,以及預(yù)測(cè)模型的未來發(fā)展。
可以看到,進(jìn)化已經(jīng)發(fā)生,一代代的模型在演變。
模型的生態(tài),在某種程度上與我們的生物體系非常相似,如果關(guān)注學(xué)術(shù)論文和GitHub,就會(huì)發(fā)現(xiàn)這個(gè)新物種剛剛誕生,幾乎每天都有新的演化出來的模型,大量新的子物種在不斷涌現(xiàn)。
就像生物界的“寒武紀(jì)”時(shí)代:大量物種開始出現(xiàn),開啟新的紀(jì)元。
二、新時(shí)代
(一)產(chǎn)業(yè)發(fā)展的擴(kuò)散結(jié)構(gòu)與體系
技術(shù)創(chuàng)新推動(dòng)人類進(jìn)步、社會(huì)發(fā)展、產(chǎn)業(yè)發(fā)展等,通常遵循一系列穩(wěn)定的擴(kuò)散范式。
在這次變革中,由于新范式的特性,它對(duì)產(chǎn)業(yè)發(fā)展的擴(kuò)散結(jié)構(gòu)與體系,發(fā)生了深刻的、多方面的變化。
為了更深入地理解這次變革,我們將從以下三個(gè)層面,來解析產(chǎn)業(yè)發(fā)展的擴(kuò)散結(jié)構(gòu)與體系,并討論這些變化如何在地理、社會(huì)、經(jīng)濟(jì)等層面上進(jìn)行分布擴(kuò)散:目的是通過這種分析能幫助我們?nèi)轿坏靥剿骱桶芽睾脵C(jī)會(huì)。
1. 擴(kuò)散源頭:變革的驅(qū)動(dòng)力,包括組織形態(tài)、科研方式、商業(yè)應(yīng)用;
2. 擴(kuò)散過程:發(fā)展周期與階段、適用的理論模型;
3. 影響范圍:國(guó)家、個(gè)人、創(chuàng)業(yè)公司等。
擴(kuò)散源頭:從傳統(tǒng)的獨(dú)立組織形態(tài),轉(zhuǎn)變?yōu)槿诋a(chǎn)學(xué)研為一體的高效生態(tài)
本質(zhì)上,是 Open AI 這樣的團(tuán)隊(duì)在推動(dòng)本次的創(chuàng)新。要實(shí)現(xiàn)從源頭、在前沿的擴(kuò)散,需要同時(shí)具備以下三個(gè)條件:
1. 具備自主前沿原創(chuàng)性科研的能力,通過科研解決核心算法的完全原創(chuàng)性的問題;
2. 進(jìn)行大量系統(tǒng)研發(fā)和工程開發(fā),能迅速將科研成果以高質(zhì)量代碼的形式實(shí)現(xiàn);
3. 具備開發(fā)技術(shù)平臺(tái)、研發(fā)產(chǎn)品、推進(jìn)商業(yè)化的能力,以形成產(chǎn)業(yè)生態(tài)系統(tǒng),進(jìn)一步驅(qū)動(dòng)1中所描述的科研。
這三點(diǎn),正是 Open AI 為代表的新型組織所實(shí)現(xiàn)的。組織形態(tài)上,Open AI 同時(shí)涵蓋了以上三個(gè)領(lǐng)域,集產(chǎn)學(xué)研于一體。
還有一點(diǎn)不同的是,在過去的擴(kuò)散過程中,政府一般都是后來才參與進(jìn)來的,但這一次,政府很早就進(jìn)來參與了。因?yàn)檫@個(gè)范式變更的特殊性,需要政府更早更有效的參與。
擴(kuò)散范圍:北美中國(guó)為主,深入個(gè)人
從全球范圍來看,這次擴(kuò)散以北美為主,中國(guó)緊隨其后。以前的技術(shù)創(chuàng)新擴(kuò)散,都是在北美擴(kuò)散到了一定成熟度之后,再?gòu)?fù)制到其他地域,這一次,中國(guó)在快速追趕的同時(shí),也將經(jīng)歷早期適合中國(guó)國(guó)情的擴(kuò)散過程。
與此同時(shí),這次技術(shù)創(chuàng)新的影響范圍會(huì)深入到個(gè)人層面。
AI 工具幫助單個(gè)創(chuàng)業(yè)者或小型團(tuán)隊(duì)提高產(chǎn)能、創(chuàng)造價(jià)值。一些產(chǎn)品不再需要雇人,AI 可以進(jìn)行替代。像設(shè)計(jì)者、碼農(nóng)、科學(xué)家、企業(yè)家、創(chuàng)業(yè)者,有許多都在用 Copilot 等工具提升個(gè)人產(chǎn)能。
而這次創(chuàng)新,帶來的是提升人類認(rèn)知能力的工具。它會(huì)進(jìn)一步拉開人與人之間的距離:那些聰明、勤奮、努力,并且學(xué)會(huì)用這個(gè)工具的人,將快速超過原來同一水平、但不使用這類工具的人。
擴(kuò)散過程:不是創(chuàng)新技術(shù)的發(fā)展,而是技術(shù)驅(qū)動(dòng)社會(huì)經(jīng)濟(jì)的轉(zhuǎn)變
在前文中,我們提到有些變革可能并未涉及范式的改變,而只是與新技術(shù)的出現(xiàn)有關(guān)。描述新技術(shù)生命周期時(shí),人們常用的經(jīng)典理論是 The Hype Cycle。然而,在這次變革中,我們認(rèn)為它是一次徹底的范式改變,影響著整個(gè)社會(huì)和經(jīng)濟(jì)的長(zhǎng)期發(fā)展,這種情況下,Carlota Perez 的 Techno-Economic Paradigms(技術(shù)經(jīng)濟(jì)范式)理論更為適用。
根據(jù) Carlota Perez 的理論,若有一項(xiàng)技術(shù),如冶金、高速公路、汽車等,能夠影響每個(gè)人和整個(gè)社會(huì),它的發(fā)展將以80年為周期,分為四個(gè)階段:爆發(fā)階段、狂熱階段、協(xié)同階段和成熟階段。
大模型時(shí)代目前還處于早期階段,經(jīng)過高速增長(zhǎng)之后,泡沫破裂將是必然現(xiàn)象。
然而,在泡沫破裂之后,新的黎明將降臨。屆時(shí),新一代更強(qiáng)大的企業(yè)將從破碎的泡沫中崛起,占據(jù)產(chǎn)業(yè)制高點(diǎn),開創(chuàng)一個(gè)嶄新的時(shí)代。
(二)Open AI 生態(tài)快速形成
這一次的產(chǎn)業(yè)發(fā)展的格局跑在最前面的,起關(guān)鍵作用的是新一代的數(shù)字化產(chǎn)業(yè),它的生態(tài)是由 Open AI 來驅(qū)動(dòng)的。
它的生態(tài)呈現(xiàn)了以下幾個(gè)特點(diǎn):(1)生態(tài)結(jié)構(gòu)迅速形成,且高速發(fā)展;(2)生態(tài)結(jié)構(gòu)類似過去的數(shù)字化平臺(tái),它包括前臺(tái)和后臺(tái)。
Open AI 的后臺(tái)
后臺(tái)是 GPT-N 系列,目前為 GPT-4,未來將有 GPT-5、GPT-6 等。
它內(nèi)部有大模型引擎,封裝了豐富的知識(shí)推理規(guī)劃能力,具有較強(qiáng)的開發(fā)和擴(kuò)展性。Open AI 提供 Foundry 和 PlayGround 等,包含 API 和簡(jiǎn)潔的收費(fèi)模式。同時(shí),許多第三方基于 Open AI 后端開發(fā)服務(wù)和應(yīng)用。
Open AI的前臺(tái)
前臺(tái)是 ChatGPT。
ChatGPT 提供完整的用戶體驗(yàn),適用于所有人,解決各類問題。這是人類歷史上首個(gè)真正實(shí)用的自然語言處理工具,具有足夠的靈活性和內(nèi)置知識(shí)。
它的前臺(tái)具有生態(tài)擴(kuò)展性,即“ChatGPT 插件 ”,Open AI 已經(jīng)開發(fā)了多個(gè)插件,如 Code、interpret 等,具備成為未來“殺手級(jí)”應(yīng)用的潛力。大量第三方將使用插件開發(fā)前端應(yīng)用。
在 Open AI 平臺(tái)之上,已經(jīng)出現(xiàn)早期產(chǎn)業(yè)活躍發(fā)展,形成了一些初步的熱門領(lǐng)域。
(三)開發(fā)堆棧雛形高速發(fā)展
這次新范式的產(chǎn)業(yè)擴(kuò)散,開發(fā)者堆棧技術(shù)發(fā)展和開發(fā)者生態(tài)的形成,至關(guān)重要,歷史上的生態(tài)發(fā)展一直是“得開發(fā)者得天下”。開發(fā)者工具、界面、開發(fā)者生態(tài),永遠(yuǎn)是“兵家必爭(zhēng)之地”。毫無疑問,Open AI、微軟都意識(shí)到了開發(fā)堆棧的重要性。
這也是我們十分關(guān)注的關(guān)鍵點(diǎn),幾乎每天都有大量新技術(shù)新服務(wù),幾乎每周都要重要的開發(fā)框架和工具出現(xiàn)。
以下我們分幾個(gè)大板塊來描述這方面的創(chuàng)新進(jìn)展。
首先,我們把這一頁分成兩大板塊:左邊是模型開發(fā);右邊是應(yīng)用開發(fā)。
我們先講模型開發(fā),它分為幾個(gè)大模塊:
關(guān)于大模型本身的開發(fā),目前開發(fā)體系已初步成型,但通常以大模型團(tuán)隊(duì)的自主研發(fā)為主。首先,我們需要一個(gè)強(qiáng)大且全新的數(shù)據(jù)開發(fā)棧,包括語料、標(biāo)注、管道等;其次,是模型開發(fā)棧,包括參數(shù)、token 以及架構(gòu)優(yōu)化等;第三,是集群管理的基礎(chǔ)設(shè)施,如 RDMA 和 HPC 或基于以太網(wǎng)的 RoCE;第四,是訓(xùn)練系統(tǒng)及各種優(yōu)化能力;第五,是對(duì)齊體系、指令調(diào)試能力以及 RLHF 等;第六,是評(píng)估系統(tǒng);第七,是系統(tǒng)化的工程開發(fā);第八,是一個(gè)能夠根據(jù)業(yè)務(wù)發(fā)展需求和成本結(jié)構(gòu),系統(tǒng)性地開發(fā)大模型的方案。
關(guān)于垂直和領(lǐng)域模型的開發(fā)。目前能夠使用的工具包括 Hugging Face,及創(chuàng)業(yè)公司 Lamini 等,功能包括模型指令調(diào)整、微調(diào)、蒸餾、提示等。近期基于開源模型的 PEFT(參數(shù)有效的微調(diào))非;钴S。自有數(shù)據(jù)和開發(fā)工具同樣重要。雖然還沒有成熟體系支持專用模型開發(fā),但這個(gè)的需求將會(huì)越來越強(qiáng)。尤其是基于擴(kuò)散模型的,像 Stability、LoRa、 ControlNet,都是用來可以開發(fā)類似 Midjourney 這種以圖片和視頻內(nèi)容生成為主的模型。
輕量的模型,體量小、算力要求低,適用于端側(cè)設(shè)備,如手機(jī)、智能音箱和未來的 lOT 設(shè)備上。盡管已經(jīng)有許多相關(guān)的研究和工作,但距離形成成熟的開發(fā)模式,還有一定的距離。然而,輕量模型的開發(fā)對(duì)未來產(chǎn)業(yè)發(fā)展至關(guān)重要。在輕量模型的優(yōu)化方法上,有知識(shí)蒸餾、數(shù)據(jù)蒸餾、結(jié)構(gòu)優(yōu)化和量化壓縮等,還需要大量的研發(fā)工作。
開源模型開發(fā),這對(duì)降低創(chuàng)新門檻,產(chǎn)業(yè)能健康發(fā)展有很重要意義;目前許多開源體系已經(jīng)取得了良好成果,比如 LLaMa 體系、Databrick 的Dolly、MosaicAI 的。
我們接下來講“應(yīng)用開發(fā)”(上頁 PPT 的右邊), 這里也分幾個(gè)大的板塊:
關(guān)于快速形成的“開發(fā)的工具和工具鏈”(PPT 右邊上半部分):
主流開發(fā)工具和工具鏈。這里發(fā)展非常迅速,有大量的機(jī)會(huì);比如 Embedding 的外存等
擴(kuò)展開發(fā)工具和方法和工具。這里有空前的機(jī)會(huì),即讓每個(gè)人都能用自然語言開發(fā)編程,可以用自己的抽象,自己的知識(shí)結(jié)構(gòu),推理,規(guī)劃,執(zhí)行等;每天都有大量的創(chuàng)新探索。
關(guān)于開發(fā)對(duì)象(PPT 右邊下半部分),具體是開發(fā)的運(yùn)行時(shí)和其他資源:
第一,后臺(tái)服務(wù)端,目前主要都是以 Open AI 和 Azure 為先導(dǎo);Amazon 也很快進(jìn)入戰(zhàn)場(chǎng);
第二,在前臺(tái),目前是以 Web 端為主,比如 Vercel Chrome;但是移動(dòng)端目前沒有動(dòng)靜,在 iOS 上,蘋果還沒出臺(tái)他們的產(chǎn)品方案,在Anroid 上,谷歌目前忙于應(yīng)付 Bing 的挑戰(zhàn);長(zhǎng)期移動(dòng)端和 IOT 端將有很多機(jī)會(huì);
第三,開發(fā)生態(tài)的關(guān)鍵資源,如課程、書籍等。
(四)經(jīng)濟(jì)發(fā)展格局
全面強(qiáng)勁的經(jīng)濟(jì)發(fā)展驅(qū)動(dòng)力
在此次經(jīng)濟(jì)發(fā)展格局中,早期的上升速度將非常迅猛,發(fā)展動(dòng)力也將格外強(qiáng)大,這與以往的情況截然不同。
那么,為什么它的攀升速度如此之快,發(fā)展力度如此之強(qiáng)呢?
關(guān)鍵在于,這一次變革所觸及的生產(chǎn)力正是“知識(shí)”。作為生產(chǎn)要素中至關(guān)重要的部分,知識(shí)的潛能是無限的。
在大模型時(shí)代,知識(shí)這一生產(chǎn)力得到了系統(tǒng)性的改變:
首先,新范式普遍降低了各類知識(shí)的成本。
其次,新范式提升了知識(shí)的應(yīng)用能力,尤其是在知識(shí)密集型行業(yè),如醫(yī)療領(lǐng)域、科研領(lǐng)域等。醫(yī)生、護(hù)士等專業(yè)崗位都受到專業(yè)模型的幫助,不僅成本可以降低,相關(guān)產(chǎn)業(yè)的生產(chǎn)力還會(huì)極大地提升。
再者,新范式縮短了產(chǎn)生知識(shí)的迭代周期。
將以上三個(gè)要素綜合考慮,新范式驅(qū)動(dòng)的經(jīng)濟(jì)發(fā)展將呈現(xiàn)前所未有的速度和力度。
對(duì)職業(yè)的結(jié)構(gòu)性影響
它將影響人類的每一個(gè)職業(yè),因?yàn)槿祟惖拿恳粋(gè)職業(yè),本質(zhì)上都是模型的組合。
可以預(yù)測(cè)的是,每一個(gè)職業(yè)的人,都會(huì)開始用“副駕駛員(Copilot)”,當(dāng)副駕駛員能力越來越強(qiáng),它會(huì)變成“正駕駛員(Autopilot)”,再接著,我們都將會(huì)有一個(gè) “駕駛團(tuán)隊(duì) (Copilot team)”。
無論我們到哪兒,都有各類“駕駛員”跟著我們走。
人們之間的合作,變成人與人之間、人們的“駕駛員”之間的協(xié)作。新的職業(yè)會(huì)出現(xiàn),人們的工作崗位也會(huì)隨之發(fā)生變化。
更強(qiáng)大更活躍的數(shù)字化產(chǎn)業(yè)
在這次變革中,處于前沿的將是下一代數(shù)字化產(chǎn)業(yè)。
數(shù)字化作為人類活動(dòng)的延伸,新的商業(yè)價(jià)值創(chuàng)造必然從數(shù)字化產(chǎn)業(yè)開始。
我們將擁有全新的核心技術(shù)堆棧、新的平臺(tái)、新的基礎(chǔ)設(shè)施、新的算力體系、新的通訊體系以及新的產(chǎn)品開發(fā)體系。以大模型為核心,整個(gè)數(shù)字化產(chǎn)業(yè)將全面升級(jí)和刷新,迅速邁入下一個(gè)發(fā)展階段。
新的領(lǐng)軍者和落伍者將很快浮現(xiàn)出來。
各個(gè)行業(yè)系統(tǒng)性的變遷
新的數(shù)字化產(chǎn)業(yè),會(huì)讓每個(gè)行業(yè)都根據(jù)這個(gè)行業(yè)的特性做出結(jié)構(gòu)性的調(diào)整和轉(zhuǎn)型。
假如你是一個(gè)公司的 CEO,可以對(duì)比人工和模型的成本,用大模型技術(shù)做系統(tǒng)性的重構(gòu)和調(diào)優(yōu),把成本降低,把產(chǎn)能提高。
值得注意的是,現(xiàn)在 GPT 是基礎(chǔ)設(shè)施,隨著它從邊際成本轉(zhuǎn)移到固定成本,可以從成本的變化,看看這個(gè)產(chǎn)業(yè)怎么變。
同時(shí),有的行業(yè)供需在發(fā)生變化,比如軟件的需求,受到碼農(nóng)供給的影響,如果關(guān)注大模型時(shí)代對(duì)碼農(nóng)的產(chǎn)出提高多少倍,就可以借助它預(yù)測(cè)這個(gè)行業(yè)的結(jié)構(gòu)性變革將從哪個(gè)方向發(fā)展,以及以什么樣的速度來發(fā)展。
對(duì)市場(chǎng)和社會(huì)的長(zhǎng)期影響
它深刻地影響了人類社會(huì)最基本的生產(chǎn)力:人。
教育領(lǐng)域?qū)⒔?jīng)歷根本性的變革;人力資源的發(fā)展和配置也將改變并加速;作為人類首要驅(qū)動(dòng)力的科研領(lǐng)域也將受到本質(zhì)性的影響,因?yàn)樗鼘⒁l(fā)科研的新范式;社會(huì)組織和信息傳播同樣會(huì)受到影響;政府與社會(huì)監(jiān)管方式也將隨之改變。
政府的更多參與
政府的參與更早、更活躍、維度更多。從 Open AI 的發(fā)展上,能看到政府極早地從多個(gè)維度參與了其中,如監(jiān)管、安全、數(shù)據(jù)隱私、社會(huì)穩(wěn)定等。究其原因,是因?yàn)檫@次變革,從根本性上影響了生產(chǎn)力和生產(chǎn)關(guān)系。
在早期,尤其需要社會(huì)產(chǎn)業(yè)和政府做更多的互動(dòng),扶持和引導(dǎo)基礎(chǔ)設(shè)施進(jìn)入全球性的發(fā)展。
(五)新產(chǎn)業(yè)發(fā)展不斷加速(海外)
圖中展示了近5個(gè)月內(nèi)我們關(guān)注到的新代碼、新技術(shù)、新論文、新產(chǎn)品和新投資,我們做了簡(jiǎn)單的計(jì)算和統(tǒng)計(jì),并將曲線繪制出來(如圖)。
首先是論文數(shù)量,對(duì)于這次新產(chǎn)業(yè)的發(fā)展,關(guān)注論文是必要條件。同時(shí),我們還需關(guān)注產(chǎn)品、資本投入和應(yīng)用案例等方面。
我們?nèi)栽诓粩嗨伎己吞剿髂男┲笜?biāo)可以更敏銳地反映發(fā)展趨勢(shì)、發(fā)展速度和發(fā)展信號(hào)。從根本上講,這次范式擴(kuò)散的寬度、廣度和力度是我們過去從未經(jīng)歷過的。為了跟上時(shí)代步伐,我們需要不同的思維方式。
(六)新產(chǎn)業(yè)發(fā)展不斷加速(中國(guó))
圖1
圖2
關(guān)于中國(guó),我們現(xiàn)在的活躍度越來越高,我們?cè)谧汾s,但是整體數(shù)量跟國(guó)外比還是有相當(dāng)大的差距。
圖2標(biāo)了紅色框的是一個(gè)重要的點(diǎn),“奮起直追的團(tuán)隊(duì)”,有商湯、王慧文、李開復(fù)、阿里、百度等等,匯總在一起,能反映出中國(guó)產(chǎn)業(yè)發(fā)展快速攀升、不斷加速的狀態(tài)。
中國(guó)發(fā)展機(jī)會(huì)
在大模型時(shí)代,有一個(gè)特殊的現(xiàn)象:真正能做大模型的,全球范圍內(nèi),只有兩個(gè)國(guó)家和地區(qū)具備這個(gè)產(chǎn)業(yè)核心的能力,北美和中國(guó)。
要實(shí)現(xiàn)這個(gè)目標(biāo),需要足夠大的人才、資本、技術(shù)和市場(chǎng)規(guī)模及密度,中國(guó)和美國(guó)是全球唯二的有機(jī)會(huì)的地方,長(zhǎng)期機(jī)會(huì)非常大,但是今天,我們必須是奮起直追。
全球唯二,奮起直追
中國(guó)大模型追趕有三大環(huán)節(jié):
第一是打造基礎(chǔ)模型,是攀升至 GPT3.5。
這里每個(gè)團(tuán)隊(duì)需要自建一個(gè)模型開發(fā)體系,包括算力、語料、數(shù)據(jù)、評(píng)估等開源工具和系統(tǒng);同時(shí)這個(gè)團(tuán)隊(duì)還有打造基礎(chǔ)設(shè)施,尤其是將幾千張和幾萬張卡連在一起的網(wǎng)絡(luò)算力,如基于RDMA(直接訪問GPU內(nèi)存)和RoCE(基于 InfiniBand 的網(wǎng)絡(luò)無法將數(shù)萬張卡連在一起);關(guān)鍵是能持續(xù)穩(wěn)定的攀升GPT3.5,我們認(rèn)為誰先達(dá)到 GPT3.5,誰將能進(jìn)入第一梯隊(duì)。
第二是要打造模型產(chǎn)業(yè)化的能力。
攀升至 GPT 3.5 水平后,要開發(fā)產(chǎn)業(yè)化能力,這里主要是具備足夠的指令調(diào)優(yōu)和對(duì)齊研發(fā)的能力。需要對(duì)代碼做指令調(diào)試,它是提高模型邏輯能力和團(tuán)隊(duì)用 AI 來開發(fā)的關(guān)鍵;在對(duì)齊上,要基于 RLHF (Reinforcement Learning from Human Feedback)正向?qū)W習(xí),結(jié)合人類反饋與自然語言對(duì)話對(duì)齊,與人的價(jià)值觀對(duì)齊。有了這些,就具備了中國(guó)的 ChatGPT 的能力
第三是平臺(tái)開發(fā)和生態(tài)建立。
后臺(tái)打造 API 等相對(duì)來說比較直接;前臺(tái)需要開發(fā)推廣 ChatGPT 和 plugin 等;早期可以用簡(jiǎn)單的商業(yè)模型搭建起來,這就足以成為未來的平臺(tái)和生態(tài)的制高點(diǎn)。
總結(jié)一下,打造基礎(chǔ)模型、模型產(chǎn)業(yè)化能力和平臺(tái)及生態(tài)開發(fā)推廣能力,是早期中國(guó)攀升 GPT 3.5核心要素。
算力資源競(jìng)賽
中國(guó)目前在追趕 GPT3.5的團(tuán)隊(duì)約有10個(gè)左右,算力將在未來贏家和產(chǎn)業(yè)發(fā)展格局的形成中起到關(guān)鍵作用。年底前看誰能到達(dá)3.5,能擁有或持續(xù)獲取算力是非常重要的。
我們所了解到的預(yù)估,是中國(guó)約有20萬張 A100卡。今天國(guó)際(18.100, -0.29, -1.58%)頭部大模型團(tuán)隊(duì)可能需要用1萬張 H100(約10萬A100)。而目前的算力情況來看,國(guó)內(nèi)未來能有這樣資源體量的團(tuán)隊(duì)可能不超過2個(gè)。
產(chǎn)業(yè)發(fā)展,齊頭并進(jìn)
第一,在追趕的過程當(dāng)中,資本投入和創(chuàng)業(yè)公司將扮演一個(gè)重要的角色,目前已經(jīng)有多個(gè)擁有足夠?qū)嵙唾Y金儲(chǔ)備的團(tuán)隊(duì)。早期挑戰(zhàn)很大,長(zhǎng)期發(fā)展機(jī)會(huì)非常強(qiáng)。
第二,中國(guó)的大廠百度、阿里、騰訊等都投入了足夠的研發(fā)能力和開發(fā)資源,一起參與打造 GPT,大廠在追趕期是有一定優(yōu)勢(shì)的,比如資源等。
第三,中國(guó)在追趕的過程中有額外的挑戰(zhàn),我們?cè)谒懔Ψ矫嬗写罅康墓ぷ饕,要補(bǔ)齊在算力上的限制,比如在算法和數(shù)據(jù)方面探索更多的潛力,在產(chǎn)業(yè)發(fā)展上,雖然算力是一個(gè)短期的挑戰(zhàn),但是中長(zhǎng)期的機(jī)會(huì)就是中國(guó)自己做算力了。
在中國(guó)做這個(gè)產(chǎn)業(yè)發(fā)展有更多的兩個(gè)不確定性,一個(gè)不確定性是算力的不確定性,但長(zhǎng)期是個(gè)機(jī)會(huì);另外是軟件棧的不確定性,這也是中國(guó)自建的一個(gè)機(jī)會(huì)。
第四,中國(guó)的產(chǎn)業(yè)發(fā)展有越來越多國(guó)際化的機(jī)會(huì),因?yàn)槠渌麌?guó)家和地區(qū)是沒有能力獨(dú)立去自研的,比如東南亞、阿拉伯世界、非洲、南美,甚至于歐洲等等,中國(guó)的大模型都有能力去觸達(dá)它。
最后,中國(guó)的應(yīng)用生態(tài)在中期和長(zhǎng)期的發(fā)展空間是相當(dāng)寬廣的,早期已經(jīng)有很多中國(guó)的創(chuàng)業(yè)公司和大廠開始在準(zhǔn)備開發(fā)基于大模型的應(yīng)用。在國(guó)際化層面,中國(guó)的創(chuàng)業(yè)者在早期也有去北美的機(jī)會(huì),尤其是做相對(duì)來講敏感度不是很強(qiáng)的,比如企業(yè)應(yīng)用客服等,這些中國(guó)的創(chuàng)業(yè)者都有更寬的機(jī)會(huì),既可以在中國(guó)做,也可以在美國(guó)做,或者是在其他國(guó)家做。
全球化的創(chuàng)業(yè)機(jī)會(huì)
每個(gè)人都會(huì)有 Copilot,每個(gè)人都會(huì)有 auto pilot,每個(gè)人長(zhǎng)期下來都會(huì)有副駕駛員的團(tuán)隊(duì),人類的組織形式也會(huì)因此發(fā)生相應(yīng)變化。綜合在一起,每個(gè)職業(yè)的產(chǎn)能都將極大地提高。
Open AI 分析,19%的勞動(dòng)力將會(huì)被 GPT 影響至少50%。高盛研究,全球范圍3億人的工作將被AI自動(dòng)化,80%的美國(guó)勞動(dòng)力會(huì)被GPT影響至少10%。
基于對(duì)一些創(chuàng)業(yè)公司使用大模型的初步調(diào)研,我們發(fā)現(xiàn),其中超過77%的公司使用的是 Open AI 的接口(其中GPT4占21%, GPT3.5占46%);基于開源模型自研和使用 Stable Diffusion 的公司,各占3%。
國(guó)家引導(dǎo)
由于大模型的技術(shù)和它產(chǎn)業(yè)發(fā)展的本質(zhì),需要規(guī)模大和時(shí)間周期長(zhǎng)的投入和布局。在基礎(chǔ)設(shè)施層面,國(guó)家有機(jī)會(huì)起更大的作用,做出更多政策上面的引導(dǎo)。
尤其在一些特定領(lǐng)域,中國(guó)有彎道超車的機(jī)會(huì),比如說在醫(yī)療、生命科學(xué)、數(shù)字城市這些賽道,用大模型來驅(qū)動(dòng)創(chuàng)新,中國(guó)有獨(dú)特的優(yōu)勢(shì)。
同時(shí)由于大模型對(duì)產(chǎn)業(yè)和社會(huì)的特殊影響,國(guó)家也會(huì)做出多個(gè)維度的監(jiān)管治理。
社會(huì)影響
大模型對(duì)生產(chǎn)關(guān)系和社會(huì)關(guān)系有本質(zhì)性的長(zhǎng)期的影響。
首先對(duì)于教育而言,社會(huì)影響跟國(guó)外一樣大。教育非常重要,過去在全球競(jìng)爭(zhēng)格局當(dāng)中,中國(guó)的學(xué)生體量大,中國(guó)的碼農(nóng)多,中國(guó)學(xué)科學(xué)的人多。但是有了大模型之后,這個(gè)局面被改變了,給我們帶來了全新挑戰(zhàn)。但是,挑戰(zhàn)的另一面就是機(jī)會(huì)。中國(guó)未來的教育怎么發(fā)展?值得思考。
另外是對(duì)科研的影響,尤其是產(chǎn)學(xué)研更有效的結(jié)構(gòu)性組合,讓中國(guó)在科學(xué)發(fā)展基礎(chǔ)上有更多的加速創(chuàng)新機(jī)會(huì)。未來的科研格局里我們有新的機(jī)會(huì),第四范式、第五范式是數(shù)據(jù)和計(jì)算驅(qū)動(dòng)的,產(chǎn)學(xué)研在中國(guó)有重新組合的機(jī)會(huì)。
最后是關(guān)于文化和文明,這跟語言和文化的底蘊(yùn)有關(guān)。大模型代表了每個(gè)國(guó)家的基本文明,這一次大模型為先的創(chuàng)新,有機(jī)會(huì)在這個(gè)方面更進(jìn)一步地做適合中國(guó)傳統(tǒng)和文明的一個(gè)創(chuàng)新。
三、新機(jī)會(huì):系統(tǒng)性、全方位的如何探索和把控我們的機(jī)會(huì)
(一)全方位探索把控:“人+事”的機(jī)會(huì)空間
1. “人+事”的探索框架
我們提出的框架主要針對(duì)創(chuàng)業(yè)公司,但對(duì)于任何組織和企業(yè)而言,只要是在有組織的去追求某個(gè)目標(biāo),它在結(jié)構(gòu)本質(zhì)上和創(chuàng)業(yè)公司都是一樣的。因此,不僅是創(chuàng)業(yè)公司團(tuán)隊(duì),其他相關(guān)人員也可以將這個(gè)框架應(yīng)用于自己所做的企業(yè)、自己做的事情,從中獲得有助于探索大模型時(shí)代的啟示。不管你是從事什么行業(yè),都可以在這個(gè)框架當(dāng)中得到相應(yīng)的經(jīng)驗(yàn)收獲。
對(duì)于創(chuàng)業(yè)公司,它的發(fā)展基本上都是創(chuàng)始人團(tuán)隊(duì)早期帶來的核心能力、心力和愿力的組合。隨后的發(fā)展通過增加人才、組織機(jī)構(gòu)和文化價(jià)值觀,作為有機(jī)紐帶逐步增強(qiáng)組織活力。人基本上也都是這樣的體系。
在事務(wù)體系方面,基本上對(duì)任何一個(gè)創(chuàng)業(yè)公司來說,都是系統(tǒng)性的打造能力去實(shí)現(xiàn)價(jià)值的一個(gè)過程。能力方面,包括開發(fā)技術(shù)的能力、開發(fā)產(chǎn)品的能力、滿足用戶需求的能力、獲得商業(yè)價(jià)值的能力、觸達(dá)更多用戶客戶增長(zhǎng)的能力、在資本生態(tài)吸取養(yǎng)分的能力、融資的能力,任何企業(yè)都是能力的組合。
有了這種能力之后,你才在你的價(jià)值空間當(dāng)中去實(shí)現(xiàn)價(jià)值。我們一般都是用這個(gè)簡(jiǎn)單的管理框架,你今天做的產(chǎn)品和業(yè)務(wù)是碗里的,跟你今天做的有連帶關(guān)系的產(chǎn)品和業(yè)務(wù)是鍋里的,而田里的是未來通過公司的內(nèi)心可以跨界探索的更多價(jià)值空間。
2. 機(jī)會(huì)在哪里
新時(shí)代對(duì)人的機(jī)會(huì)在哪里?對(duì)事務(wù)的機(jī)會(huì)又在哪里?接下來是系統(tǒng)的拆解:
第一,強(qiáng)烈建議不要盲目追逐熱點(diǎn),浮躁可能導(dǎo)致不利后果。尤其值得強(qiáng)調(diào)的是,這次追逐熱點(diǎn)的代價(jià)可能更高,因?yàn)樗婕胺妒睫D(zhuǎn)變,需要改變思考方式和執(zhí)行方式。如果盲目追逐熱點(diǎn),可能會(huì)付出巨大代價(jià),其中包括機(jī)會(huì)成本。
第二,要勤于學(xué)習(xí)。這次技術(shù)變革相對(duì)復(fù)雜,建議大家閱讀必要的論文。僅僅依賴別人的解讀可能無法深入理解,必須花時(shí)間去深入研究關(guān)鍵論文,克服慣性思維。有一本書叫《科學(xué)發(fā)展的范式》,值得大家一看。一般大的范式,過去沒法克服慣性思維,包括深度學(xué)習(xí),因?yàn)檫@是不同的思考體系,所以一定要盡量克服慣性思維。
第三,一定要深度思考。務(wù)必認(rèn)真思考這次技術(shù)變革對(duì)人和事務(wù)方面的影響,沒有人能夠避開這一挑戰(zhàn)。
第四,必須采取行動(dòng)導(dǎo)向。一旦理清思路,要立即采取行動(dòng)。這次技術(shù)變革不進(jìn)則退,涉及結(jié)構(gòu)性改變,需要及時(shí)調(diào)整。在人際關(guān)系方面,這次技術(shù)變革可能會(huì)拉大人與人之間的距離,所以一旦想明白,要果斷采取行動(dòng),不然你很快掉隊(duì)。本來你跟你后面的人、前面的人可能距離不大,但一不小心你可能被甩得很后面,或者你有機(jī)會(huì)遠(yuǎn)遠(yuǎn)超過今天和你跑在差不多一條線上的人。
(二)“事”的機(jī)會(huì)空間
事情方面,基于這次范式變更的本質(zhì),對(duì)于創(chuàng)業(yè)公司和企業(yè),基本上可以通過三個(gè)維度去探索機(jī)會(huì):
第一,在產(chǎn)品和業(yè)務(wù)層面去探索機(jī)會(huì);
第二,你所在的產(chǎn)業(yè)是不是有根本性的變革,在產(chǎn)業(yè)變革的過程當(dāng)中去探索更大的機(jī)會(huì),你可能面臨換個(gè)生意的選擇,在價(jià)值鏈上占一個(gè)不同的價(jià)值點(diǎn);
第三,你所在的產(chǎn)業(yè)的研發(fā)體系、是不是徹底變革了。由于產(chǎn)業(yè)的研發(fā)體系會(huì)在有效環(huán)節(jié)發(fā)生大變化,大量的變化是找到全新的、由于研發(fā)體系變更而帶來的機(jī)會(huì),有可能就得徹底換一個(gè)新的賽道,或者是在同一賽道里面用完全不同的方法去做產(chǎn)品。
1. 事的三個(gè)機(jī)會(huì)版塊(數(shù)字化基礎(chǔ)、數(shù)字化應(yīng)用、改造世界)
人基本上就是在認(rèn)識(shí)世界,改造世界。人是減熵的物種,我們用數(shù)字化來延伸自己。數(shù)字化產(chǎn)業(yè)一直在驅(qū)動(dòng)著這個(gè)階段人類的進(jìn)步。
我們給大家一個(gè)系統(tǒng)性的框架,我們從數(shù)字化基礎(chǔ)、數(shù)字化應(yīng)用、改造世界,這三個(gè)機(jī)會(huì)版塊,進(jìn)行完整的、系統(tǒng)性的機(jī)會(huì)探索體系。
2. 完整系統(tǒng)的機(jī)會(huì)探索體系
數(shù)字化發(fā)展基礎(chǔ)
數(shù)字化發(fā)展基礎(chǔ)永遠(yuǎn)是平臺(tái)驅(qū)動(dòng)的,像移動(dòng)互聯(lián)網(wǎng)/云、人工智能/邊緣計(jì)算、新興平臺(tái)等。
數(shù)字化的應(yīng)用
我們將人群分為“消費(fèi)者”、“創(chuàng)作者”、“企業(yè)”三個(gè)類別,把它分成一格一格的,代表人群時(shí)長(zhǎng)的分割和人類的基本組織形成,用來系統(tǒng)、完整的探索數(shù)字化應(yīng)用。
在這里,創(chuàng)作者人群是我們特別關(guān)注的,他們是站在前沿的:碼農(nóng)、設(shè)計(jì)師、科學(xué)家等。
消費(fèi)者的需求結(jié)果體系,可以借助馬斯洛的人類需求層次出發(fā);企業(yè)的需求比較穩(wěn)定,都是降本增效。
借此,我們可以完整的去分析這次范式的變革,每類需求的機(jī)會(huì)位于哪里。
認(rèn)識(shí)世界、改造世界
人要永遠(yuǎn)認(rèn)識(shí)世界,認(rèn)識(shí)得更深。認(rèn)識(shí)世界,包括認(rèn)識(shí)自己是世界的一部分,要把知識(shí)數(shù)字化。
數(shù)字化有6種功能可見(Affordance):
1. 信息(2D):這個(gè)數(shù)字化的能力基本上觸達(dá)了每一個(gè)人類,我們每個(gè)人基本上都用電腦,用手機(jī),觸達(dá)所有的人。
2. 體驗(yàn)(3D):尤其是三維的體驗(yàn),元宇宙,目前只有少數(shù)的品類,游戲、社交等。
3. 關(guān)系(抽象)Web3:數(shù)字化的抽象關(guān)系,信任、激勵(lì)機(jī)制、所有權(quán)等;這個(gè)需要時(shí)間來逐步探索和發(fā)展。
4. 物理外部環(huán)境:數(shù)字化驅(qū)動(dòng)的物理環(huán)境交互,自動(dòng)駕駛、機(jī)器人等。
5. 生理內(nèi)部感知:數(shù)字化人內(nèi)在的腦機(jī)接口、內(nèi)部測(cè)試機(jī)制,這個(gè)目前也是覆蓋少數(shù)類別,如康復(fù)等。
6. 知識(shí)(模型):數(shù)字化帶來的知識(shí)是嵌入的,可以用在所有場(chǎng)景之下。
這次我們創(chuàng)新的空間,基本上是用二維的信息,加上嵌入知識(shí),去找所有可以應(yīng)用的類別;有些品類可以用到其他的數(shù)字化能力,如機(jī)器人等,可以三位一體的滿足人的需求。系統(tǒng)性的探索我們的機(jī)會(huì)。以上是這個(gè)完整的框架。
(三)數(shù)字化基礎(chǔ)的機(jī)會(huì)
穩(wěn)定的數(shù)字化平臺(tái)結(jié)構(gòu)
這個(gè)數(shù)字化平臺(tái)的結(jié)構(gòu)是我數(shù)十年開發(fā)系統(tǒng)的經(jīng)驗(yàn)總結(jié)。總結(jié)平臺(tái)的特點(diǎn)如下:
1. 前端是“完整課延伸”的體驗(yàn),有設(shè)備、容器、畫布等;
2. 后端是完整可延伸的能力,有計(jì)算、存儲(chǔ)、通訊。
值得關(guān)注的一個(gè)點(diǎn)是,目前為止任何一個(gè)萬億 美元的公司都在前端做設(shè)備和操作系統(tǒng),這是價(jià)值的控制點(diǎn)。
數(shù)字化的底層基礎(chǔ)設(shè)施是計(jì)算體系,是芯片,是基礎(chǔ)服務(wù),是開源代碼等等。在今天大模型流行的時(shí)代,基礎(chǔ)設(shè)施領(lǐng)域存在大量的機(jī)會(huì)。某種意義上,從投資和創(chuàng)業(yè)者的角度來講,這是最容易賺錢的地方。就像在淘金時(shí)代,一批人去加州淘金,淘金人的很多會(huì)死掉,但是如果你賣勺子、賣鏟子、籃子的就不會(huì),這是非常好的生意,因?yàn)闆]有這些工具就沒法淘金。
進(jìn)入大模型流行的時(shí)代,我們必須要有一系列新的算力、新的基礎(chǔ)設(shè)施。創(chuàng)業(yè)會(huì)有門檻,但是一定有機(jī)會(huì)。未來新一代的有效算力,都將基于 GPT 的系統(tǒng)架構(gòu),長(zhǎng)期機(jī)會(huì)非?捎^。
基礎(chǔ)設(shè)施和工具
第一點(diǎn),是算力,有效算力包括芯片、算力體系。
在大模型為先的時(shí)代,一個(gè)很明顯的趨勢(shì)是一個(gè)國(guó)家、一個(gè)地區(qū),它的經(jīng)濟(jì)發(fā)達(dá)的程度就看你有效算力有多少,這個(gè)生意可以做很久。新一代的算力和算力體系有很大的機(jī)會(huì),在中國(guó)相對(duì)來講挑戰(zhàn)和機(jī)會(huì)并存。一方面,中美關(guān)系之間,算力上我們是有一定的挑戰(zhàn)。另外國(guó)產(chǎn)自主可供的算力相對(duì)來說,克服困難之后發(fā)展機(jī)會(huì)更大。
第二點(diǎn),是新一代的算力體系和網(wǎng)絡(luò)架構(gòu)。
對(duì)未來機(jī)會(huì)來講,我們更多需要的是連在一起的帶寬和延時(shí)都很低的 GPU。可能我們根本就不需要服務(wù)器這個(gè)概念,需要的是幾萬張卡連在一起的能力。我們奇績(jī)創(chuàng)壇這屆有一個(gè)創(chuàng)業(yè)公司 Infracore 是一個(gè)清華的團(tuán)隊(duì),就是做 RDMA,在以太網(wǎng)上面連接起來,叫 RoCE 第二代基礎(chǔ)設(shè)施。
第三點(diǎn),是大規(guī)模的訓(xùn)練體系、微調(diào)體系、推理體系等等跟大模型相關(guān)的基礎(chǔ)設(shè)施。
第四點(diǎn),大模型時(shí)代需要一個(gè)全新的數(shù)據(jù)系統(tǒng)的數(shù)據(jù)堆棧,尤其是 Embedding,向量數(shù)據(jù)庫和基于向量數(shù)據(jù)庫的檢索系統(tǒng)。今天的數(shù)字化產(chǎn)業(yè),它的內(nèi)核技術(shù)是關(guān)系式數(shù)據(jù)庫,是符號(hào)和文字的表格,在這個(gè)時(shí)代它是向量集合,是向量相互之間的組織結(jié)構(gòu)和向量的檢索。最近融資非;鸨,你要賺快錢就在這里賺,大量的公司可以做這個(gè)東西。
第五條,開發(fā)工具鏈,有新的機(jī)會(huì),尤其是開發(fā)框架和新開的新框架。比如 Triton,它不是一個(gè)簡(jiǎn)單框架,它是一種特殊語言,它是基于大模型內(nèi)在計(jì)算結(jié)構(gòu)的需求而開發(fā)了多年的語言,Open AI 并購(gòu)的一家公司,但關(guān)鍵點(diǎn)在于它不是基于 GPU 的著色器 (shader)和 Cuda 工具鏈開發(fā)的,無論從商業(yè)發(fā)展角度來講還是從投資角度來講,這里都有戰(zhàn)略性的機(jī)會(huì)。
最后有大量的開源的模型體系,開源的工具,開源的數(shù)據(jù)集,創(chuàng)新的機(jī)會(huì)就在開源這里。
新平臺(tái)
在數(shù)字化基礎(chǔ)當(dāng)中,更大的機(jī)會(huì)是平臺(tái)。
前面講過,平臺(tái)有前臺(tái)和后臺(tái),商業(yè)機(jī)會(huì)價(jià)值非常大。對(duì)于這個(gè)平臺(tái),美國(guó)是 Open AI,有幾個(gè)創(chuàng)業(yè)公司,有谷歌、有微軟。中國(guó)有百度、阿里,百川智能是王小川的,光年之外是王慧文的,還有很多。大家可以設(shè)想一下,這些公司10年以后的體量有多大?
今天谷歌可以是1萬億美元的公司,這個(gè)將遠(yuǎn)不止1萬億美元,成功的概率可能不一定高,也會(huì)一定艱難,但是只要你有能力,這就是非常值得探索的機(jī)會(huì),因?yàn)檫@個(gè)平臺(tái)的體量實(shí)在太大了。
在新時(shí)代中,Open AI 的平臺(tái)基礎(chǔ)體系都已經(jīng)搭建好了,前后臺(tái)系統(tǒng)已經(jīng)準(zhǔn)備好了,但它的關(guān)鍵應(yīng)用(killer app)仍在發(fā)展中。目前,這個(gè)關(guān)鍵應(yīng)用主要體現(xiàn)在前端的“code interpret”,就是一個(gè)數(shù)據(jù)分析師的功能。Open AI 自己想涉足的領(lǐng)域是教育和醫(yī)療,但它的平臺(tái)基礎(chǔ)和關(guān)鍵應(yīng)用還在形成。
從平臺(tái)商業(yè)化的角度看,我們目前主要關(guān)注中國(guó)和美國(guó)市場(chǎng)。全球范圍內(nèi),只有這兩個(gè)地區(qū)有平臺(tái)公司。在美國(guó),各平臺(tái)之間,是一場(chǎng)激烈的競(jìng)爭(zhēng)。從投資和創(chuàng)業(yè)機(jī)會(huì)來看,創(chuàng)業(yè)空間很有限,基本上沒有了,市場(chǎng)主要被 Open AI、Anthropic 等幾家小公司以及谷歌和微軟所占據(jù)。
新體驗(yàn)端和新設(shè)備端
在大模型時(shí)代,硬件的體驗(yàn)將不一樣。
有一個(gè)比較典型意義的公司叫 Humane,是蘋果出來做硬件的的團(tuán)隊(duì),他們過去一直沒有找到好的產(chǎn)品。做的硬件是你戴在身上的,這個(gè)硬件能看到你所看到的一切、聽到你所聽到的一切,它不斷在幫你思考。
這個(gè)東西在很多場(chǎng)景比手機(jī)更管用。其他設(shè)備如頭盔和眼鏡等,也有機(jī)會(huì)。今天看到的是信息,你在眼睛里能看到的是知識(shí)、模型,比如“這個(gè)場(chǎng)地裝修了5年才成,這個(gè)人做生意不靠譜”等等,是新的體驗(yàn)和新的操作系統(tǒng),新的生態(tài),這方面都存在著機(jī)會(huì)。
第三代系統(tǒng)(自主/自動(dòng)化大模型平臺(tái)機(jī)會(huì))
第三代自動(dòng)駕駛、機(jī)器人組合的機(jī)會(huì)也加速到來,需要新的硬件,新的算力,新的開發(fā)體系,新的模態(tài),一定有用大模型來驅(qū)動(dòng)下一個(gè)拐點(diǎn)的機(jī)會(huì)。
第三代系統(tǒng),核心是指三位一體。大模型是生成模型,可以生成指令,控制設(shè)備和行動(dòng)。這些模型是雙向的,它既感知認(rèn)識(shí)、感知分析,又能夠進(jìn)行控制。所以,因?yàn)榇竽P偷谋举|(zhì),到了第三系統(tǒng)中,這個(gè)時(shí)代將被加速進(jìn)入。
它的核心是行動(dòng)體系,尤其是自主體系、自動(dòng)駕駛體系、機(jī)器人體系和空間計(jì)算體系,這些體系將有機(jī)地交互,可以系統(tǒng)性地用越來越低的價(jià)格去采取行動(dòng),滿足人們的需求。
自動(dòng)駕駛方面,有新的機(jī)會(huì),為什么?
今天自動(dòng)駕駛做了十幾年了,體系還是以視覺為主的,泛化能力還是不夠。我們?nèi)碎_車一點(diǎn)都不累,輕輕松松,聽聽音樂,講講話。我們?yōu)槭裁撮_車不累?因?yàn)槲覀冇姓Z言,我們能零樣本泛化。比如,我們?cè)诼飞祥_車,看到前面有一個(gè)老人舉著一個(gè)旗子走過來,我們會(huì)知道還早,根本不用擔(dān)心,慢慢開過去繞過他就是了。
但是今天的自動(dòng)駕駛系統(tǒng),遇到這個(gè)老人就會(huì)緊張的不得了,因?yàn)樗鼜膩頉]有見過,它不知道該怎么辦,它沒有泛化能力。所以我們可以有全新機(jī)會(huì),用新一代的語言模型帶來的泛化能力打通模態(tài)。當(dāng)然用機(jī)器人、用大模型驅(qū)動(dòng)新一代的機(jī)器人機(jī)會(huì)也一樣大,機(jī)器人和自動(dòng)駕駛將是人類最大的兩個(gè)產(chǎn)業(yè)。
(四)數(shù)字化應(yīng)用的機(jī)會(huì)
數(shù)字化的應(yīng)用有兩個(gè)重要的點(diǎn),它一定是技術(shù)推動(dòng)、需求拉動(dòng),一般是技術(shù)和需求相匹配才行。
這次技術(shù)的模型能力前面講了,封裝了所有的知識(shí)。所以這次的技術(shù)覆蓋所有的需求,你要判斷的是這個(gè)模型是不是足夠強(qiáng),模型在你這個(gè)領(lǐng)域的發(fā)展速度會(huì)不會(huì)很快。
判斷1:模型的能力是怎樣的?
首先我們必須做一個(gè)判斷,在大模型時(shí)代的早期模型能力,我們預(yù)測(cè)模型發(fā)展的速度,對(duì)我所在這個(gè)需求,它是否有比較務(wù)實(shí)的機(jī)會(huì)去有效地滿足用戶和客戶的需求?尤其是過去滿足不了的需求。也就是說,第一你要判斷是模型的能力,在早期模型的發(fā)展速度和模型能力,對(duì)我所在這個(gè)產(chǎn)業(yè)能改變多少?
判斷 2:三位一體能建立起來的機(jī)會(huì)有多大?
第二個(gè)判斷的是,三位一體的體驗(yàn)?zāi)軌蚪⑵饋淼臋C(jī)會(huì)有多大。
一開始,我們?nèi)灰惑w就是信息模型和行動(dòng)體系組合在一起來滿足這個(gè)需求。信息我們都可以給你,有二維的、模型的。前面講過了,你要判斷的就是行動(dòng)體系是不是有可現(xiàn)實(shí)的機(jī)會(huì)可以做。有些可以,有些未必。
在這里舉個(gè)例子,健身模式上可以用來做,比方說 Peloton,它以本來就是一個(gè)單車,我可以在上面給你信息,今天缺的就是模型,就是一個(gè)教練,是一個(gè)時(shí)刻提醒你告訴你怎么弄的。所以 Peloton 這樣就是三位一體,好的模型它內(nèi)容已經(jīng)有了。
判斷3:全方位顛覆的機(jī)會(huì)有多大?
大模型時(shí)代對(duì)你所在這個(gè)賽道,從開發(fā)生產(chǎn)的角度來講,能夠帶來全方位顛覆的機(jī)會(huì)有多大?比如你是做煉鋼的,那這次大模型給煉鋼這個(gè)產(chǎn)業(yè)帶來的研發(fā)體系變更不大。但如果,你是開發(fā)游戲的,那就全都變了,因?yàn)橛螒蛉魏苇h(huán)節(jié)它的開發(fā)都不一樣。
技術(shù)推動(dòng):大模型為先,形成閉環(huán)
所以,在“技術(shù)推動(dòng)”這個(gè)方面,我們采用這個(gè)三角形,用高中低來判斷一下每個(gè)行業(yè)都要用這個(gè)技術(shù)推進(jìn)的情況。
很多同學(xué)都在想:我這個(gè)領(lǐng)域能不能做?你一定要考慮你這個(gè)領(lǐng)域,你這個(gè)生意有沒有壁壘。這里有一個(gè)簡(jiǎn)單的范式,你自己有數(shù)據(jù),你可以自己開發(fā)模型,你可以用大模型來開發(fā),你的模型被使用之后,使用的數(shù)據(jù)你拿得到,使用的數(shù)據(jù)回歸到閉環(huán),你的既有數(shù)據(jù)越來越強(qiáng)。如果你有這樣一個(gè)結(jié)構(gòu),你這個(gè)生意肯定可以做。所以大模型為先,從數(shù)據(jù)到模型,到使用閉環(huán),是這個(gè)時(shí)代落地的有效方式。
需求拉動(dòng):大模型為先,而非信息為先
需求拉動(dòng),要找到需求,對(duì)知識(shí)、對(duì)模型比較敏感的需求。同時(shí),我們要強(qiáng)調(diào)一個(gè)概念:在這個(gè)時(shí)代,一定要做大模型為先的產(chǎn)品。
大模型為先:三位一體為王,自然語言為先
人類需求本質(zhì)也是三位一體的,任何一件事情,我們既需要信息,又需要知識(shí),又需要行動(dòng)來滿足我們的需求。
比如說電商,今天都是用的信息,模型幾乎沒有。
每一次看每一個(gè)領(lǐng)域,可以看這個(gè)領(lǐng)域里面的信息有多少,模型能有什么樣的模型,行動(dòng)有什么樣的行動(dòng)。大模型時(shí)代的產(chǎn)品,建議一定要做自然語言為先的產(chǎn)品。我們看到很多同學(xué)做產(chǎn)品,信息時(shí)代的慣性太大了,產(chǎn)品就是手機(jī)打開,看到圖片、視頻、文字,給出來的都是信息。這是過去的時(shí)代了。
今天做產(chǎn)品,起步就需要是自然語言交互,去思考“你跟我怎么交互”?
有機(jī)會(huì)、行動(dòng)導(dǎo)向,信息只是提供了一個(gè)基礎(chǔ),三位一體是終局。如果創(chuàng)業(yè)賽道有機(jī)會(huì)三位一體,要大模型為先,搶先進(jìn)去。
大模型基礎(chǔ)的閉環(huán)壁壘
考慮一個(gè)領(lǐng)域,生意有沒有壁壘,有一個(gè)簡(jiǎn)單的范式:
第一,你有自己的數(shù)據(jù);
第二,你可以自己開發(fā)模型,用大模型來開發(fā)模型;
第三,你的模型被使用之后,使用的數(shù)據(jù)你能拿得到;
第四,使用的數(shù)據(jù),返回過來有個(gè)閉環(huán),你的自有數(shù)據(jù)越來越強(qiáng)。
如果有這樣一個(gè)結(jié)構(gòu),這樣一個(gè)三位一體的體驗(yàn)和閉環(huán),大模型為先的時(shí)代里,落地是一定要做的。
1. 信息知識(shí)
大模型的第一仗
大模型時(shí)代的第一戰(zhàn)為何是在搜索引擎戰(zhàn)場(chǎng)上打響,例如 Bing 和 Bard。原因很簡(jiǎn)單,搜索引擎本身就是一個(gè)龐大的模型,是大模型時(shí)代最接近的產(chǎn)品。因此,制作一個(gè)大模型時(shí)代的產(chǎn)品時(shí),搜索引擎基本上能迅速實(shí)現(xiàn)。其次搜索引擎作為一種產(chǎn)品,它有更多機(jī)會(huì)更好地滿足用戶需求。
我們可以進(jìn)一步分析大模型時(shí)代的搜索引擎能滿足用戶的哪些需求,可以分為三大類:
第一類是尋找信息,例如要知道某家商店的電話號(hào)碼、某公司的地址及員工人數(shù)等。當(dāng)前的搜索引擎已經(jīng)在滿足這些需求方面做得不錯(cuò),大模型時(shí)代只是在這方面的局部提升。
第二類,搜索引擎的更大需求和更高的滿足需求是任務(wù)類的,英語稱之為transaction query,即搜索關(guān)鍵詞后有一系列明確的動(dòng)作,如下載游戲、打電話或購(gòu)買商品。大模型時(shí)代肯定會(huì)更好地滿足這類需求。對(duì)于數(shù)字化行動(dòng),大模型可以直接為用戶完成,如填表等。對(duì)于物理行動(dòng),大模型至少可以為用戶規(guī)劃下一步。這帶來的挑戰(zhàn)是廣告模式是否仍然適用,或者這是否是一個(gè)機(jī)會(huì),是否有比廣告更有效的變現(xiàn)方式?這需要有抱負(fù)、有創(chuàng)造力的創(chuàng)業(yè)者去探索。
搜索引擎的第三類需求實(shí)際上是尋找知識(shí),探討問題,例如研究為什么中東永遠(yuǎn)無法實(shí)現(xiàn)和平。如今,用戶通過輸入關(guān)鍵詞查閱大量文章來滿足這一需求。然而,有了大模型,根本不再需要這樣做。用戶只需讓大模型為其總結(jié),中東和平的原因及為何無法實(shí)現(xiàn)等。大模型可以將這些要點(diǎn)總結(jié)成一張表。那么這種商業(yè)模式是什么?廣告很難持續(xù),那么訂閱制和知識(shí)付費(fèi)是否可行?同樣,這是留給有遠(yuǎn)見、有勇氣、有創(chuàng)造力的同學(xué)去探索的機(jī)會(huì)。
綜合來看,Bing 和 Bard 之間的競(jìng)爭(zhēng)將開辟一系列新的創(chuàng)新前沿。像美國(guó)的 You.com 這樣的創(chuàng)業(yè)公司也有機(jī)會(huì)發(fā)展新一代搜索引擎,而中國(guó)市場(chǎng)我們拭目以待。
2. 內(nèi)容
在內(nèi)容領(lǐng)域,顛覆性創(chuàng)新的機(jī)會(huì)無處不在。
自古以來,只有少數(shù)人能夠創(chuàng)作出高質(zhì)量的內(nèi)容,如優(yōu)美的詩歌、引人入勝的小說、悅耳動(dòng)聽的歌曲和精彩紛呈的電影。然而,今天在大模型的支持下,我們可以看到更多的創(chuàng)意作品以更低的成本呈現(xiàn)出來。
在藝術(shù)創(chuàng)作中,有一位業(yè)界資深專家曾說過,只有當(dāng)藝術(shù)家的思維方式出現(xiàn)“錯(cuò)位”時(shí),才能創(chuàng)作出真正的杰作。我個(gè)人認(rèn)為,大模型或許很難替代這種特質(zhì)。未來,我們還需關(guān)注新一代腦科學(xué)的研究。
內(nèi)容產(chǎn)業(yè)呈現(xiàn)出金字塔結(jié)構(gòu),底層是 UGC(用戶生成內(nèi)容)和 PGC(專業(yè)生成內(nèi)容),上層則是營(yíng)銷和傳播等環(huán)節(jié)。在 PGC 方面,大模型或許能提供一定程度的輔助,但并非創(chuàng)作高質(zhì)量作品的關(guān)鍵。然而,在內(nèi)容傳播方面,大模型具有很大的替代潛力。
總結(jié)來說,首先,內(nèi)容產(chǎn)業(yè)領(lǐng)域的顛覆性機(jī)會(huì)廣泛存在,每個(gè)細(xì)分領(lǐng)域都有可能被顛覆和重塑。其次,內(nèi)容產(chǎn)業(yè)的機(jī)會(huì)點(diǎn)在于發(fā)行環(huán)節(jié)的游戲規(guī)則將被徹底改變,因?yàn)榇竽P途邆渫茝V和發(fā)行的能力。UGC 方面同樣擁有廣闊的機(jī)會(huì),因?yàn)榇竽P湍苌韶S富的內(nèi)容。而在高端 PGC 領(lǐng)域,同樣存在大量機(jī)會(huì)。核心在于,一流藝術(shù)家可以利用基于大模型的工具,將精力更加聚焦于原創(chuàng)性環(huán)節(jié),而其他環(huán)節(jié)則可以利用大模型作為輔助工具。最終,基于大模型和腦神經(jīng)科學(xué)相結(jié)合的技術(shù),未來原創(chuàng)爆款的能力機(jī)會(huì)也將悄然到來。
3. 游戲
游戲領(lǐng)域是距離大模型顛覆體驗(yàn)最近的一個(gè)生態(tài)環(huán)境。在這里,我們已經(jīng)看到了基于模型的資產(chǎn)生成場(chǎng)景,例如 Opus.ai 通過文字對(duì)話直接生成整個(gè)游戲場(chǎng)景,以及近期較為熱門的 NPC 和數(shù)字世界的生成。超參數(shù)打造了長(zhǎng)安城,而 AI Dungeon 則開發(fā)了對(duì)話交互式游戲。此外,Unity 最近展示了一種從語言交互到游戲開發(fā)的全新創(chuàng)作范式——copilot。
游戲大模型與平臺(tái)型公司擁有廣闊的發(fā)展想象空間,而巨頭公司的精力有限,這為創(chuàng)業(yè)者帶來了巨大的機(jī)遇。
制作環(huán)節(jié)發(fā)生變革:游戲產(chǎn)業(yè)的每個(gè)制作環(huán)節(jié)都發(fā)生了變化,因此很有可能形成一個(gè)全新的生產(chǎn)體系和產(chǎn)業(yè)生態(tài)。
游戲體驗(yàn)在改變:游戲本身是一個(gè)純數(shù)字化的行動(dòng)體系,每一個(gè)場(chǎng)景、每一個(gè) NPC 都是基于模型的。
隨著大模型帶來的生產(chǎn)能力和模型創(chuàng)新能力,未來將探索并形成大量新一代游戲體驗(yàn)。甚至可以想象到自動(dòng)生成整個(gè)游戲,包括游戲中的所有 NPC,與它們不斷互動(dòng),形成一個(gè)充滿活力的游戲世界。這一切都有可能實(shí)現(xiàn)。
4. 消費(fèi)|電商
電商是一個(gè)很大的產(chǎn)業(yè)。
阿里巴巴了不起,中國(guó)電商也很強(qiáng),電商有沒有機(jī)會(huì)?一定有,為什么?道理很簡(jiǎn)單,大家想今天電商是怎樣的產(chǎn)品?
今天電商給我們的都是信息,你看到的是價(jià)格多少?這個(gè)產(chǎn)品長(zhǎng)得怎么樣?
再下一個(gè)是消費(fèi)電商。
電商,我個(gè)人覺得是完全有機(jī)會(huì)。今天的購(gòu)物體系中模型上只能買便宜的,如果買一個(gè)高端的或者是基于場(chǎng)景的,那確實(shí)是要一個(gè)模型,是一個(gè)人和人之間交互的,尤其是基于場(chǎng)景。以場(chǎng)景為基礎(chǔ)的購(gòu)物的消費(fèi),是完全有機(jī)會(huì)的。
基于場(chǎng)景的購(gòu)物機(jī)會(huì)
但我真正要買東西,比方說我要去買一雙鞋,買一個(gè)帽子,一個(gè)好的、真正的交互體驗(yàn)更是不光帶來信息,還會(huì)帶來模型、帶來知識(shí)。
“好的老板都會(huì)說,誒,你買這個(gè)鞋,買這頂帽子干什么?”“哎,我說一家四口要去夏威夷度假,哦,夏威夷溫度是這樣的,照片是這樣的,這個(gè)帽子適合,這個(gè)鞋適合,對(duì)吧?”
這都是什么?都是知識(shí),都是模型,這種商品交流才是真正有價(jià)值的,而不是給我看一些網(wǎng)頁。
如果你是做電商,你是阿里,你既應(yīng)該緊張,又應(yīng)該興奮,該緊張的是創(chuàng)業(yè)者要革你的命,幸福的是你自己也有機(jī)會(huì)。
5. 社交|社區(qū)
社交是有局部機(jī)會(huì)的。核心原因是有一種新的非常強(qiáng)的內(nèi)容,只要你有別的內(nèi)容,你就有機(jī)會(huì)重新建立社交關(guān)系的。
比如說這里有個(gè)例子,我有5個(gè)很好的模型,這模型讓我炒股票、讓我男女交友,然后做有高價(jià)值執(zhí)行的這些模型,別的地方都沒有,那我可以說這個(gè)模型在臉書上不能分享,你要分享這個(gè)模型必須邀請(qǐng)好友,你就等于是重新建立一個(gè)社交網(wǎng)。社交歷史一直是這樣的,有新的強(qiáng)鎖內(nèi)容的人都想重新建立社交網(wǎng)絡(luò),你只能到我這里來重新要求。但是這是一個(gè)局部的機(jī)會(huì),真正要重新打造了一個(gè)很寬的社交的概率不是很高,但局部的社交網(wǎng)絡(luò)像是專業(yè)性的社交網(wǎng)絡(luò),這是有機(jī)會(huì)的。
今天男女交友軟件,比如 Tinder,是典型的信息產(chǎn)品,讓你看到照片、年齡、身高、體重。這些信息并不是沒有用,但也只是讓人初步知道對(duì)方在物理?xiàng)l件方面是不是跟我合適。
但對(duì)方性格怎么樣、第一次約會(huì)看什么電影,之后該吃什么,吃飯的時(shí)候講什么笑話,都不知道。這些東西都是模型,馬上就可以重做一遍。
在知識(shí)社區(qū)方面,中國(guó)有知乎,美國(guó)的知乎叫 Quora。Quora 創(chuàng)始人叫 Adam D‘Angelo,他在 Open AI 的董事會(huì)上,現(xiàn)在的 Quora,早就長(zhǎng)得不一樣了。
今天不是去 Quora 看文章、而是問問題去了,而是叫它給我研究一下這個(gè)問題,并幫我總結(jié)出來,是以對(duì)話的形式進(jìn)行的了。之前獲得知識(shí),要看一大堆大 V 的文章;現(xiàn)在,你叫 ChatGPT,幫你總結(jié)一下分析一下就可以了。
所以社區(qū)有大量的機(jī)會(huì)。
6. 通訊
類似 Zoom、騰訊會(huì)議這種產(chǎn)品,變革一定會(huì)很大,道理很簡(jiǎn)單,它是非常典型的搬運(yùn)信息的產(chǎn)品。
今天已經(jīng)有大量創(chuàng)業(yè)公司在做的事情是,30分鐘會(huì)議結(jié)束后,把所有會(huì)議內(nèi)容都給分析好了。因?yàn)槲覀兠恳淮伍_會(huì)背后都有模型。
7. 醫(yī)療
醫(yī)療是在新的范式、新的時(shí)代當(dāng)中機(jī)會(huì)最大的產(chǎn)業(yè)之一,可以完整的在多個(gè)維度,把大模型時(shí)代的能力充分運(yùn)用起來。
首先,醫(yī)療的信息化,一切都可以用自然語言,用大模型重新做,每個(gè)護(hù)士、每個(gè)醫(yī)生的能量都被放大。好的醫(yī)生就是非常好的模型,一流的外科手術(shù)外科醫(yī)生、好的老中醫(yī)、有經(jīng)驗(yàn)的護(hù)士,就是模型厲害。這些人可以把大模型作為工具,把他的模型加深,讓這些人的才智、經(jīng)驗(yàn)發(fā)揮得更強(qiáng)。
每一類診斷、每一類治療都是專業(yè)模型,這些專業(yè)模型都可以做得更深,做得更好,迭代更快。
治療手術(shù)都可以用到大量的機(jī)器人,專業(yè)機(jī)器人、服務(wù)機(jī)器人三位一體有大量的機(jī)會(huì)。因?yàn)獒t(yī)療這個(gè)行業(yè)它必須三位一體制。
三位一體,有大量的機(jī)會(huì)。它需求的類別,必須有效組合在一起,三個(gè)都有很大的發(fā)展空間。
關(guān)于醫(yī)療這個(gè)產(chǎn)業(yè)對(duì)社會(huì)的影響:
第一,這里機(jī)會(huì)是非常非常大,因?yàn)橹袊?guó)本身是醫(yī)療是供不應(yīng)求、供需不平衡,這次技術(shù)變革能夠很大地改變這個(gè)。
第二,通過大模型,可以在中國(guó)把醫(yī)療這個(gè)產(chǎn)業(yè)做得更健康。相對(duì)來說美國(guó)的醫(yī)療行業(yè)是 GDP 的20%,服務(wù)質(zhì)量差強(qiáng)人意,中國(guó)有機(jī)會(huì)做得更好,服務(wù)質(zhì)量做得更高,成本做得更低。
第三,在中國(guó)用大模型做醫(yī)療,中國(guó)有一定的結(jié)構(gòu)上的優(yōu)勢(shì),因?yàn)榇竽P褪切枰罅康墓潭ǔ杀,這個(gè)時(shí)候政府的引導(dǎo)、政府的在基礎(chǔ)設(shè)施和數(shù)據(jù)上的投入,能夠起政策上的作用,都可以在多個(gè)維度讓大模型時(shí)代的醫(yī)療做得更出色。
這是關(guān)于醫(yī)療的,就從多個(gè)維度,我們是有相當(dāng)好的機(jī)會(huì)。
8. 教育
教育非常核心,挑戰(zhàn)很大,機(jī)會(huì)更多。大家可能看到了,Open AI 的戰(zhàn)略合作伙伴的一個(gè) TED 演講,用大模型可以做一對(duì)一的教師,可以讓每一個(gè)小孩個(gè)性化地學(xué)任何概念,大學(xué)職業(yè)培訓(xùn),有大量的機(jī)會(huì),那是共通性的。一個(gè)國(guó)家,一個(gè)地域只要教育好了,一切都會(huì)好。
9. 開發(fā)者
開發(fā)者的機(jī)會(huì)相當(dāng)特殊。
首先我們講個(gè)概念, YC 的創(chuàng)始人 Paul 寫的一本書就黑客和畫家《Hacker and Painters》,為什么黑客、畫家那么重要?因?yàn)樗麄兌际莿?chuàng)造世界的人,在二維畫布上創(chuàng)造世界。開發(fā)者本質(zhì)上是驅(qū)動(dòng)世界進(jìn)步的一個(gè)核心的力量。
這一次為什么機(jī)會(huì)這么重要?
因?yàn)槭窃谌祟悮v史上首次讓每一個(gè)人可以用自然語言來開發(fā)。這是大模型最吸引人的地方,過去只有碼農(nóng)通過專業(yè)訓(xùn)練才能實(shí)現(xiàn),而現(xiàn)在不需要如此就都可以用自然語言。不光是用自然語言,你開發(fā)的對(duì)象抽象的層次、任務(wù)的拆解規(guī)劃,都可以按照不同的需求來,每個(gè)人都可以開發(fā),每個(gè)人都可以用不同的抽象的層次,用不同的規(guī)劃體系,用適合你自己想要做的風(fēng)格和解決的任務(wù)去開發(fā)。這代表著人類歷史上空前的機(jī)會(huì),有大量的創(chuàng)業(yè)者,大廠、小廠的創(chuàng)業(yè)者或者大廠,都有大量的創(chuàng)業(yè)機(jī)會(huì)。
10. 設(shè)計(jì)師
設(shè)計(jì)師跟開發(fā)者在本質(zhì)上類似,但是設(shè)計(jì)師用大模型時(shí)代,這個(gè)產(chǎn)品已經(jīng)高速在進(jìn)行了。
微軟有 Designer、Adobe 有 Firefly,有大量的創(chuàng)業(yè)公司,不管你是二維圖像的設(shè)計(jì)師、三維結(jié)構(gòu)的設(shè)計(jì)師、建筑物的設(shè)計(jì)師、家裝裝修的設(shè)計(jì)師,它都能夠用大模型來充足提高設(shè)計(jì)師的設(shè)計(jì)能力、設(shè)計(jì)質(zhì)量。但是這個(gè)發(fā)展過程是分階段走的,今天的設(shè)計(jì)工具主要是在創(chuàng)意階段,因?yàn)榻裉斓拇竽P秃苋菀咨蓤D像、生成視頻、生成三維結(jié)構(gòu),它的特性是人可以很快在看到這個(gè)設(shè)計(jì)后判斷是所需與否。以后可以用大模型進(jìn)入到每個(gè)設(shè)計(jì)過程的每個(gè)環(huán)節(jié),從根本意義上提升整個(gè)設(shè)計(jì)行業(yè),不管是哪一個(gè)設(shè)計(jì)的專業(yè)類別。
11. 研究員(科研)
關(guān)于研究,這個(gè)可以說是我個(gè)人最感興趣、潛力最為特殊的一個(gè)機(jī)會(huì)點(diǎn)。因?yàn)榭茖W(xué)是人類最終極的生產(chǎn)力,但是科學(xué)的發(fā)展可以通過大模型來根本性的加速,在產(chǎn)品和創(chuàng)業(yè)創(chuàng)新的機(jī)會(huì)點(diǎn)上,起步的可以是為每個(gè)科學(xué)家提供副駕駛員、正駕駛員,為每個(gè)科學(xué)實(shí)驗(yàn)提供基于模型的開發(fā)、推理、自動(dòng)化。
最重要的是大模型時(shí)代給科學(xué)的發(fā)展的范式帶入到下一個(gè)階段,也就是說我們不再是一個(gè)去解決具體的問題,而是用大模型帶來的涌現(xiàn)的能力,去更系統(tǒng)的、更高效地去發(fā)現(xiàn)新的科學(xué)現(xiàn)象。
綜合在一起,這里將帶來大量的具體的創(chuàng)業(yè)創(chuàng)新的機(jī)會(huì),更重要的是科學(xué)的發(fā)展將進(jìn)入一個(gè)從來沒有過的發(fā)展的速度。
12. OA/辦公
微軟在做的,已經(jīng)很多了。
在 OA 辦公這個(gè)領(lǐng)域,微軟已經(jīng)做了大量的工作。
微軟的辦公軟件里面都有副駕駛員,微軟這個(gè)季度財(cái)報(bào)里面已經(jīng)匯報(bào)說,微軟的主流客戶當(dāng)中有大量的客戶和用戶已經(jīng)在活躍的使用 copilot 副駕駛員,在辦公軟件體系里面都在活躍的使用。
在辦公軟件過程當(dāng)中,微軟的產(chǎn)品創(chuàng)新還可以往下再走一步就是跟 Adept AI 這家公司,跟行動(dòng)體系做更完整的連接,就更多的三位一體,因?yàn)橛辛?copilot 只是信息加模型。但是比如有很多行動(dòng)就是填表,基本上就是 OA 的自動(dòng)化,就是原來叫 RPA ,就像藍(lán)眼科技這類的,都可以更好地做到三位一體,這里也給創(chuàng)業(yè)者帶來更多的機(jī)會(huì)。
13. 營(yíng)銷與客戶
營(yíng)銷行業(yè)是大模型能夠立竿見影的一個(gè)行業(yè),用了大模型以后馬上就可以看到效果。因?yàn)闋I(yíng)銷離錢最近,這個(gè)從創(chuàng)業(yè)創(chuàng)新角度來講是最直接的。這里面大廠也好,小廠也罷,是高度活躍。Salesforce 有愛因斯坦大模型,Adobe 有 Firefly 大模型,也有相當(dāng)多的基于大模型做營(yíng)銷材料的,在營(yíng)銷上面的提升效益的創(chuàng)業(yè)創(chuàng)新機(jī)會(huì)系統(tǒng)性地存在,有大量可以探索的機(jī)會(huì)。
14. ERP
ERP 這個(gè)品類會(huì)有大量的創(chuàng)業(yè)創(chuàng)新的機(jī)會(huì),它本質(zhì)上是有機(jī)會(huì)做到三位一體。
因?yàn)榻裉斓?ERP 基本上是模型加信息,它的模型的所代表的標(biāo)的都是設(shè)備、企業(yè)資源,從以終為始的角度來講,是非常好的機(jī)會(huì)是做三維一體,就是 ERP 接入機(jī)器人、接入工廠場(chǎng)景的實(shí)體物件的管理。這樣的話我不光是有模型,不光是有信息,我還可以直接去做行動(dòng)、做執(zhí)行。今天 ERP 比方說排序,ERP比方說管理企業(yè)的物料,ERP比方說管理企業(yè)的財(cái)務(wù)賬,它都是分開做的,一步步做的。這一次給我們帶來機(jī)會(huì)就是三位一體,既有模型,又有信息,又有資金系統(tǒng),這是第一個(gè)大的機(jī)會(huì)點(diǎn)。
第二個(gè)大的機(jī)會(huì)點(diǎn)就是今天的 ERP 系統(tǒng),模型都是人搭建的,它僵硬難用。人要學(xué)這些模型,應(yīng)該馬上用自然語言,讓每個(gè)模型都可以直接交互,同時(shí)這些人搭的模型要跟機(jī)器學(xué)習(xí)的模型更有機(jī)的融合在一起,讓每個(gè)模型更靈活、更適應(yīng)場(chǎng)景的變化。ERP 它僵硬就是因?yàn)槠髽I(yè)在不斷在更新,這個(gè)模型一直是脫節(jié)的,如果用新一代的大模型的方法做接入人搭的模型,這些模型就避免今天模型僵硬不好用,模型永遠(yuǎn)是脫節(jié),跟不上企業(yè)的變更,這一切都有機(jī)會(huì)讓 ERP 的模型進(jìn)入到下個(gè)時(shí)代,它根本意義上是好用,它是自然語言可以交互,人不需要學(xué)這些模型,讓模型來適應(yīng)人,這些模型隨著企業(yè)的不斷地演變,它會(huì)自然地跟著演變而更好用。
最后還是三位一體,模型跟執(zhí)行體系、跟設(shè)備的控制、跟質(zhì)量的控制,可以通過新一代的技術(shù)直接融合在一起,真正意義上做到大模型時(shí)代的產(chǎn)品體驗(yàn)是三位一體的,這是 ERP 的機(jī)會(huì),這里大廠有機(jī)會(huì),小廠機(jī)會(huì)也一樣的多,創(chuàng)業(yè)公司也一樣有機(jī)會(huì)。
15. 生產(chǎn)制造
生產(chǎn)制造跟 ERP 一樣,它是三位一體的機(jī)會(huì),也就是說大模型時(shí)代和行動(dòng)時(shí)代要同時(shí)一起做,它可以直接地向著三位一體、數(shù)字化三位一體,因?yàn)橹圃鞓I(yè)今天,局部的信息化、局部的自動(dòng)化它都是割裂的,它都是分開的。但這次的機(jī)會(huì)是讓我們以大模型為先。
通過用大模型的方法揭露機(jī)器人、揭露機(jī)械臂、揭露控制體系,它可以系統(tǒng)性地、完整性地提升我們生產(chǎn)制造過程的有效性,讓每個(gè)人可以用自然語言去參與生產(chǎn)過程,然后生產(chǎn)過程可以更高效的、更自適應(yīng)工廠環(huán)境的變化,同時(shí)更有效的自動(dòng)化。因?yàn)檫@些模型都可以控制機(jī)器人、控制機(jī)械臂、控制一條流水線、控制一臺(tái)設(shè)備,就是大模型為線。
這個(gè)機(jī)會(huì)可以從工業(yè)也可以到農(nóng)業(yè)、農(nóng)田,核心是大模型為先,核心是三位一體,三位一體就是信息模型,行動(dòng)是有機(jī)的組合在一起的。在中國(guó)的機(jī)會(huì)尤其是特殊,因?yàn)橹袊?guó)是全球最大的制造業(yè)國(guó)家,我們有最多的數(shù)據(jù)、最大的實(shí)體經(jīng)濟(jì)。在大模型時(shí)代全面地提升我們國(guó)家的新一代的制造的能力,這里大廠一定有機(jī)會(huì),小廠機(jī)創(chuàng)業(yè)公司的機(jī)會(huì)也一樣的豐富。
基本上就是我前面講的,機(jī)器人自動(dòng)駕駛、物理空間的計(jì)算和空間資源的管理,這三者有機(jī)組合在一起,用大模型來驅(qū)動(dòng),是未來執(zhí)行體系的關(guān)鍵的組合。制造業(yè)是本質(zhì)上就是用這個(gè)方法來控制每一臺(tái)設(shè)備,控制每一條流水線,管理好每一條生產(chǎn)流程。
16. 政府城市
數(shù)字城市本質(zhì)上跟醫(yī)療體系很類似,中國(guó)有相當(dāng)大的優(yōu)勢(shì),全世界做數(shù)字城市最多的是中國(guó)。而且城市是未來人類社會(huì)的最基本、最重要的社會(huì)機(jī)制,在這里有系統(tǒng)性地提高。
首先,第一代系統(tǒng)就是城市的信息化,可以用自然語言處理。今天都是城市已經(jīng)信息化了,但是都是割裂、很難用的,至少是可以用自然語言處理,用模型把它所有的連在一起。
第二,城市的模型系統(tǒng)今天只有數(shù)字完勝,基本上局部用非常僵硬,不好用。因?yàn)榻裉鞈?yīng)該用大模型,用更多的城市的模態(tài),讓城市的模型是靈活適應(yīng)城市的變化,更柔和地去融入城市管理當(dāng)中的方方面面。
第三,是三位一體,城市精細(xì)化的引領(lǐng)必須是信息模型執(zhí)行體系在一起的,是通過移動(dòng)端、通過 IoT 設(shè)備控制、通過機(jī)械臂、通過機(jī)器人、通過自動(dòng)駕駛、通過空間計(jì)算,把這些有效的組合在一起,那城市精細(xì)化每個(gè)角落、每個(gè)社區(qū)、每一輛共享單車、每個(gè)服務(wù)都可以完整地用數(shù)字化三位一體來做得更好。
(五)改造世界
上述內(nèi)容,將用數(shù)字化讓人能夠更好地認(rèn)識(shí)自己、延伸自己能力相關(guān)的所有機(jī)會(huì)都講完了,下面是如何來改變世界。
1. 新能源科技
首先,核心是新能源技術(shù)的研發(fā)體系,大模型將帶來大量的研發(fā)體系上的新機(jī)會(huì),設(shè)計(jì)也好、生產(chǎn)也好,都可以用大模型來提升效益。
第二,新一代的可去能源的運(yùn)營(yíng)、新一代的電網(wǎng)需要大量的數(shù)據(jù)、大量的模型的能力,把能源的供需平衡好、運(yùn)營(yíng)好。
第三,新一代核心技術(shù),系統(tǒng)也好,部件也好,都可以切入大模型,直接植入大模型為先的技術(shù)。電池、觸電設(shè)備、風(fēng)電控制體系這一系列的核心技術(shù)都可以切入大模型為先的技術(shù),讓它做得更好。這里大廠已經(jīng)有大量的機(jī)會(huì)在做了,對(duì)創(chuàng)業(yè)公司也打開了越來越多可以參與的創(chuàng)新機(jī)會(huì)。
2. 新生命科技(生命科學(xué))
第一,新的技術(shù)可以直接用到大量的生命科學(xué)體系當(dāng)中。新的生命科學(xué)首先起步于今天深度學(xué)習(xí)的人工智能技術(shù)和相關(guān)的大模型技術(shù),它本質(zhì)上跟生命體系的計(jì)算過程在結(jié)構(gòu)上是類似的。
第二,生命科學(xué)的產(chǎn)業(yè)結(jié)構(gòu)越來越朝著今天的數(shù)字化工業(yè)的產(chǎn)業(yè)結(jié)構(gòu)方向去走,在結(jié)構(gòu)上會(huì)是非常類似的。有大量的計(jì)算和數(shù)據(jù)驅(qū)動(dòng)直接生產(chǎn)、設(shè)計(jì)、制造,每個(gè)維度都可以用這個(gè)方法來做。
第三,大模型將對(duì)生命科學(xué)的基礎(chǔ)研發(fā)和核心創(chuàng)新起到根本性的作用,尤其是在核酸、蛋白這一層,在其他維度的生命科學(xué)的結(jié)構(gòu)維度做大模型,將根本改變我們的研發(fā)環(huán)節(jié)。就是用大量的數(shù)據(jù)和算力,通過涌現(xiàn)更高效的加速科學(xué)探索和研發(fā)的方方面面,系統(tǒng)性地提高這個(gè)產(chǎn)業(yè)的進(jìn)展和創(chuàng)新的速度,這是關(guān)于生命科學(xué)體系。
3. 新材料科技(材料科學(xué))
材料科學(xué)體系跟生命科學(xué)體系大模型時(shí)代和數(shù)字化它所產(chǎn)生的效應(yīng)是一致的。
在材料科學(xué)里面它更是產(chǎn)業(yè)驅(qū)動(dòng)的,比如芯片所需要的材料,光伏、新能源需要的材料,這一切在產(chǎn)業(yè)發(fā)展上帶來的機(jī)會(huì)更直接、更優(yōu)先,它是產(chǎn)業(yè)驅(qū)動(dòng)的。
在結(jié)構(gòu)上,大模型將系統(tǒng)性地切入數(shù)據(jù)驅(qū)動(dòng)、計(jì)算驅(qū)動(dòng)的材料設(shè)計(jì)、研發(fā)、制造等方方面面,比如材料基因、計(jì)算驅(qū)動(dòng)的新的材料設(shè)計(jì)、材料工藝、材料生產(chǎn)等等。
4. 新空間科技
真正把空間用新的空間技術(shù)用好,是從地面開始,自動(dòng)駕駛、深海、軌道、軌道之外、指數(shù)深空,新的衛(wèi)星的、新的行星上,包括火星,這是長(zhǎng)期有系統(tǒng)化的機(jī)會(huì),大模型在每一個(gè)環(huán)節(jié)在探索。
在通訊、在遙感、在空間制造都可以直接驅(qū)動(dòng)探索創(chuàng)新和商業(yè)價(jià)值的獲取,在這個(gè)當(dāng)中既給國(guó)家和大學(xué)帶來非常多的創(chuàng)新的機(jī)會(huì),同時(shí)也給有遠(yuǎn)見、有抱負(fù),愿意長(zhǎng)期堅(jiān)持的創(chuàng)業(yè)者一樣帶來非常多的機(jī)會(huì)。
尤其是像自動(dòng)駕駛這樣一個(gè)巨大的產(chǎn)品,以大模型為先的方法,今天可以觸達(dá)的機(jī)會(huì)就很多,長(zhǎng)期更快,這是目前面臨的商業(yè)化最大的發(fā)展就是用技術(shù)、用大模型為領(lǐng)先的技術(shù)去探索更多的物理空間。
(六)新執(zhí)行環(huán)境
新的時(shí)代把事情的機(jī)會(huì)把控好,我們需要一個(gè)新的執(zhí)行體系。
首先,馬太效應(yīng)會(huì)非常明顯,對(duì)于已經(jīng)擁有強(qiáng)大算力/數(shù)據(jù)/技術(shù)和財(cái)務(wù)資源的組織來講,他們會(huì)更具有優(yōu)勢(shì),同時(shí),對(duì)于擁有大量高質(zhì)量數(shù)據(jù)的人,也會(huì)獲得更多優(yōu)勢(shì),而且大模型在生成內(nèi)容時(shí)可能存在偏見,少數(shù)人的聲音不被聽見。
同時(shí),壁壘和競(jìng)爭(zhēng)格局也有其特性,初創(chuàng)企業(yè)應(yīng)該尋找未被大廠覆蓋的市場(chǎng)細(xì)分領(lǐng)域和定位,在AI領(lǐng)域不斷探索新技術(shù)、新方法和新應(yīng)用,利用更多技術(shù)專利和知識(shí)產(chǎn)權(quán)建立競(jìng)爭(zhēng)壁壘,也要注重與大廠建立合作關(guān)系(比如共享資源和數(shù)據(jù)),同時(shí)也需要具備較強(qiáng)的適應(yīng)性和靈活性,快速適應(yīng)市場(chǎng)變化。
此外,也應(yīng)具備廣闊的國(guó)際化格局,這里既包括使用多種語言提供本地化服務(wù),也要基于中國(guó)文化,提供相應(yīng)的語言的工具和內(nèi)容,另外,垂直領(lǐng)域大模型的解決方案也很重要,也要同時(shí)注重跨語言溝通和翻譯工具,以及針對(duì)中文語料的數(shù)據(jù)分析。
另外,知識(shí)產(chǎn)權(quán)結(jié)構(gòu)也會(huì)有新格局,我們會(huì)面對(duì)不同的法律環(huán)境和保護(hù)方法,垂直領(lǐng)域數(shù)據(jù)的占比也會(huì)增加,而模型算法的占比會(huì)降低,同時(shí)也會(huì)有不同的產(chǎn)權(quán)激勵(lì)結(jié)構(gòu)。
最后,初創(chuàng)企業(yè)也需要面對(duì)新型的社會(huì)關(guān)系,我們會(huì)有不同的政府監(jiān)管環(huán)境,創(chuàng)業(yè)門檻也會(huì)大幅降低,創(chuàng)業(yè)者作為一種普世性職業(yè)的時(shí)代真正到來,同時(shí)人才需求也會(huì)發(fā)生變化,對(duì)應(yīng)聘人才的技術(shù)能力要求會(huì)更高。
(七) “人”的機(jī)會(huì)空間
對(duì)于個(gè)人來講,越來越重要的是你是不是有獨(dú)到的見解,而且你有很大的心力,可以堅(jiān)持不懈地追求這個(gè)愿景。
能力相對(duì)來講越來越不重要,而你需要的是獨(dú)到的能力,是能用好工具的能力。如果你的能力是別人或多或少都有的,那就越來越不重要了。
例如今天作為一個(gè)創(chuàng)業(yè)者,如果你是碼農(nóng),開發(fā)技術(shù)很強(qiáng),可能優(yōu)勢(shì)很大,但是未來這個(gè)優(yōu)勢(shì)越來越不重要,除非你有獨(dú)到的開發(fā)能力。芯片設(shè)計(jì)、蛋白設(shè)計(jì)等等一樣,今天這些能力起了重要的作用,但這個(gè)作用的相對(duì)重要性會(huì)越來越降低,因?yàn)榇竽P投寄茏鲞@些東西。
對(duì)一個(gè)創(chuàng)始人來講最重要的是獨(dú)到的見解,尤其是對(duì)未來獨(dú)到的看法和很強(qiáng)的心力,可以長(zhǎng)期堅(jiān)持努力把他獨(dú)到的對(duì)未來的愿景可以實(shí)現(xiàn)出來,這是越來越重要的一個(gè)特性。
Open AI 本身就是最好的一個(gè)案例,Open AI 看好的是別人不看好的。Open AI 的科研能力、開發(fā)能力在總體上是遠(yuǎn)遠(yuǎn)不如谷歌、他們就幾百號(hào)人,但是他們做出來了,本身就是驗(yàn)證了這一點(diǎn),它(Open AI)有著不同的愿景、不同的看法,它走的路是別人不走的路,它堅(jiān)持走下去了,它靠這些徹底改變了世界。大家如果要一個(gè)案例,看 Open AI 就行了。
技術(shù)驅(qū)動(dòng)發(fā)展帶來的職業(yè)趨向
人類歷史上由于生產(chǎn)力、生產(chǎn)關(guān)系的演變,在任何時(shí)代都有一類職業(yè),它是最賺錢的,創(chuàng)造財(cái)富最多。
以前打獵最厲害,創(chuàng)造的財(cái)富最多。有一個(gè)時(shí)代武功最厲害,能打架的武士是最賺錢的。上個(gè)世紀(jì)末,在華爾街買公司、賣公司的人,是最賺錢的,也就是投資者。而這個(gè)世紀(jì)初,即使把風(fēng)險(xiǎn)算在內(nèi),創(chuàng)業(yè)者是創(chuàng)造財(cái)富最多的一個(gè)職業(yè),毫無疑問。
在這個(gè)新時(shí)代創(chuàng)造價(jià)值、財(cái)富最多的是創(chuàng)業(yè)者,同時(shí)大模型時(shí)代為創(chuàng)業(yè)者帶來不同的發(fā)展機(jī)會(huì),你需要的資金越來越少,你開發(fā)的周期越來越短,你創(chuàng)造價(jià)值機(jī)會(huì)越來越多,以后有越來越多的人都可以做創(chuàng)業(yè),投資的生態(tài)也將為此而變,使創(chuàng)業(yè)者的機(jī)會(huì)越來越可觀,越來越普遍,越來越有價(jià)值。
同時(shí)在下個(gè)時(shí)代,最有價(jià)值的是科研,但不是傳統(tǒng)意義的科研,是新一代的科研。這個(gè)科研的典型代表就是 Open AI 。在 Open AI,你既是一個(gè)科研人員,同時(shí)又是碼農(nóng),同時(shí)又可以做生態(tài)。既能夠做科研寫論文,又能夠?qū)懘a,又能夠做平臺(tái),是新一代的科學(xué)機(jī)構(gòu),是新一代的科學(xué)范式。
Open AI 開了個(gè)先例。有越來越多的 Open AI 在未來 10年、 20年、 30年、40 年會(huì)涌現(xiàn),因?yàn)榻裉斓膭?chuàng)業(yè)生態(tài)是70年的歷史,再往后 50 年,會(huì)有越來越多人做這個(gè),這是新一代的科研的 open research。
(八)基礎(chǔ)范式的演變
1. 科研的發(fā)展跟商業(yè)化合為一體
科學(xué)將進(jìn)入第四范式和第五范式。新的科學(xué)范式需要數(shù)據(jù)、需要計(jì)算來發(fā)現(xiàn)新的科學(xué)現(xiàn)象,如果沒有商業(yè)化,數(shù)據(jù)哪里來,算力哪里來?所以本質(zhì)上,科研的發(fā)展必須逐步逐步跟商業(yè)化是合為一體。
今天引領(lǐng)信息科學(xué)的不是一流的大學(xué),不是國(guó)立實(shí)驗(yàn)室,早就是大廠。而今天引領(lǐng)數(shù)字化最前沿的人工智能的已經(jīng)不是大廠,是創(chuàng)業(yè)公司,是 Open AI,是 DeepMind。今天引領(lǐng)新空間科學(xué)的不是 NASA,不是波音,是一家創(chuàng)業(yè)公司,叫SpaceX。越來越多的產(chǎn)業(yè),比如生命科學(xué)、材料科學(xué)都會(huì)朝這個(gè)方向走。這種范式的變化是結(jié)構(gòu)性的,就是因?yàn)榭茖W(xué)的發(fā)現(xiàn)跟商業(yè)化分不開了。
2. 從技術(shù)到價(jià)值:5個(gè)核心環(huán)節(jié)
今天全球的主流科學(xué)發(fā)展范式是1944年奠定的。1944年有一個(gè)人叫 Vaneva Bush,那個(gè)時(shí)候羅斯?偨y(tǒng),他判斷二戰(zhàn)快結(jié)束了。他叫這個(gè)人寫一份報(bào)告,規(guī)劃如何讓美國(guó)在二戰(zhàn)之后保持技術(shù)的領(lǐng)先?這個(gè)人做了一番研究之后,寫了一本小冊(cè)子,名字叫《Science: the Endless Frontier》(《科學(xué):無盡的前沿》)。
他在書中提出了一個(gè)范式:中央政府收稅,把這個(gè)稅的錢交給兩個(gè)地方,一個(gè)是研究型大學(xué),在美國(guó)系統(tǒng)發(fā)展研究型大學(xué),研究大學(xué)里面做基礎(chǔ)研究,做應(yīng)用研究,做工程研究,教授和研究生一起做;第二,把錢給國(guó)立研究院等機(jī)構(gòu)。今天中國(guó)也好,歐洲也好,或多或少都是采用這個(gè)范式。
產(chǎn)生的結(jié)果是有大量的科研結(jié)果形成論文,然后這些論文待在書架上10 年或20 年。接著有些大廠、有些其他機(jī)構(gòu)說這些基礎(chǔ)研究可以來解決實(shí)際的問題的,這就是所謂的應(yīng)用研究。應(yīng)用研究是一般都是大學(xué)或者是研究機(jī)關(guān)或者是大廠在做。做完之后,發(fā)現(xiàn)這個(gè)可以做技術(shù),就把技術(shù)做出來。比如說芯片封裝技術(shù)、軟件驗(yàn)證技術(shù)。這些技術(shù)做出來之后,有產(chǎn)品經(jīng)理說這個(gè)技術(shù)可以做成產(chǎn)品,于是便把產(chǎn)品做出來。產(chǎn)品做出來,市場(chǎng)銷售、運(yùn)營(yíng)的人說這個(gè)可以去賣,于是便把產(chǎn)品賣給客戶。
技術(shù)驅(qū)動(dòng)社會(huì)進(jìn)步是這樣一個(gè)流水線。所以從技術(shù)到為人類提供價(jià)值,都是有5個(gè)核心環(huán)節(jié)一路走下來的。
3. 創(chuàng)業(yè)公司開始做基礎(chǔ)研究了
但今天我們看到趨勢(shì)是越來越倒過來了。創(chuàng)業(yè)公司,它不光是做產(chǎn)品,做技術(shù),做應(yīng)用研究,也開始做基礎(chǔ)研究了。為什么?
第一,科學(xué)的范式變了,科學(xué)發(fā)展離不開商業(yè)化。科學(xué)必須要有數(shù)據(jù),必須要有算力,所以離不開商業(yè)化。
第二,我們的歷史上從來沒有一個(gè)探索體系叫創(chuàng)業(yè)體系。
創(chuàng)業(yè)體系是什么呢?它無縫不入,只要哪里有機(jī)會(huì),哪里就有投資,就有想發(fā)財(cái)?shù)哪贻p人。它比其他體系都更靈活,它能吸收人才,它有大量的資源可以用。因?yàn)榻裉烊虻馁Y本太多,都在找回報(bào)。如果你能改變世界,只要你真的行,都有人愿意投。我看到的一個(gè)現(xiàn)象是在一流大學(xué),如伯克利、斯坦福,校內(nèi)的每一個(gè)系長(zhǎng)得越來越像一個(gè)基金,很多教授某種意義上都帶了好幾個(gè)創(chuàng)業(yè)團(tuán)隊(duì),這個(gè)趨勢(shì)越來越明顯。
當(dāng)然,今天主流科研模型有它的優(yōu)勢(shì),它將繼續(xù)在適合這個(gè)模式的領(lǐng)域中開拓科學(xué)新前沿。新的范式需要不斷地探索、更新和創(chuàng)造。
四、奇績(jī)創(chuàng)壇介紹
從某種意義上講,奇績(jī)創(chuàng)壇真正的創(chuàng)始人是 Sam Altman。
2014年,Sam Altman 擔(dān)任 YC 掌門人,就馬上來找還在微軟任職的我,希望能加入他們。他說未來人類社會(huì)的進(jìn)步,將由 10 家像谷歌這樣偉大的公司來驅(qū)動(dòng)。他判斷,至少有3家在中國(guó),而在當(dāng)年,這些創(chuàng)始人可能還在高中、大學(xué),“Qi, we need to find them, help them build a future.”。當(dāng)時(shí),雖然沒有如他所愿,但也在我心里留下了種子。最終,在2018年8月1日,他推動(dòng)了我加入 YC,擔(dān)任 YC 合伙人并兼任 YC 研究院的院長(zhǎng)。
Open AI 是 YC 研究院第一個(gè)獨(dú)立出來的研究項(xiàng)目,我們跟 Sam 花了不少時(shí)間設(shè)計(jì) YC 中國(guó)。后來 Sam 決定全身心投入 Open AI 的發(fā)展、卸任 YC 領(lǐng)導(dǎo)人一職,YC 有了新的領(lǐng)導(dǎo)人,加上地緣政治的影響,如實(shí)的說,這對(duì)當(dāng)時(shí)的我們還是有影響的,但我們真的相信這件事,決定獨(dú)立成為奇績(jī)創(chuàng)壇。YC 給予了我們幫助,Sam 也一直支持我們,他們送我們到了他們能送達(dá)的最遠(yuǎn)的地方。
2019年11月,我們正式獨(dú)立成為奇績(jī)創(chuàng)壇,把 YC 的模式在中國(guó)本地化,設(shè)計(jì)了奇績(jī)的獨(dú)特模式:合伙人會(huì)在 Office Hour 中與創(chuàng)業(yè)者一起解決問題;此外,我們還會(huì)組織 Group Office Hour,讓優(yōu)秀的創(chuàng)業(yè)者互相學(xué)習(xí);同時(shí),我們會(huì)安排路演日,讓創(chuàng)業(yè)者有機(jī)會(huì)接觸到一流的投資機(jī)構(gòu);最后,我們還構(gòu)建了一個(gè)為創(chuàng)業(yè)者提供長(zhǎng)期、多維度支持的活躍社區(qū)。
我們的發(fā)展也非常快,三年多,我們已經(jīng)做了7屆創(chuàng)業(yè)營(yíng),收到5萬多封申請(qǐng),投了318家創(chuàng)業(yè)公司,我們的路演日在北京,每次都有1000多個(gè)投資者。
在大模型時(shí)代,我們奇績(jī)也將迭代。我們推出了大模型日?qǐng)?bào),旨在為創(chuàng)業(yè)者提供前沿信息;我們也不斷創(chuàng)新,基于大數(shù)據(jù),正在開發(fā)一種可以幫助創(chuàng)業(yè)者解決難題的產(chǎn)品“創(chuàng)始人的 Co-Pilot”。
我們始終堅(jiān)信“中國(guó)+技術(shù)”是早期創(chuàng)新創(chuàng)業(yè)的前沿,并將持續(xù)以獨(dú)特可規(guī)模化的模式有效加速技術(shù)驅(qū)動(dòng)的創(chuàng)業(yè)企業(yè)。
(全文完)