(演講人:張亞勤 演講地點(diǎn):清華大學(xué)“人文清華講壇” 演講時(shí)間:2025年12月)
今天,我們正迎來(lái)一個(gè)全新的重大機(jī)遇——人工智能,它已然拉開(kāi)了第四次工業(yè)革命的序幕。
技術(shù)進(jìn)步的大趨勢(shì)
首先我想談一下技術(shù)大趨勢(shì),以及人工智能帶來(lái)的啟示。
經(jīng)過(guò)幾十萬(wàn)年的進(jìn)化,我們?nèi)祟?lèi)的大腦不足3斤重,功耗只有20瓦,但是人類(lèi)卻如此之聰明。人類(lèi)大腦包含了860億個(gè)神經(jīng)元,有百萬(wàn)億個(gè)連接或者說(shuō)突觸,存儲(chǔ)量至少有1個(gè)Petabyte(拍字節(jié))。
我們對(duì)人類(lèi)大腦的理解是漸進(jìn)的,現(xiàn)在可能也還不超過(guò)10%。早年間,美國(guó)科學(xué)家保羅?麥克萊恩提出“三重腦”理論,將大腦分為不同層次:負(fù)責(zé)呼吸、睡眠、運(yùn)動(dòng)等生理功能的層次,處理情感的層次,以及負(fù)責(zé)推理、決策的高級(jí)層次。這個(gè)理論雖然不夠精準(zhǔn),但為我們理解大腦提供了直觀(guān)的視角。如今我們知道,大腦擁有150多個(gè)不同的功能區(qū),860億個(gè)神經(jīng)元分布其中,分別負(fù)責(zé)聲音、視覺(jué)、語(yǔ)言、運(yùn)動(dòng)等不同功能。人類(lèi)的記憶功能尤為神奇,包含天生的DNA記憶、短期的海馬體記憶、長(zhǎng)期的皮層記憶,還有顯性記憶和隱性記憶??梢哉f(shuō),人類(lèi)大部分智能都來(lái)源于這些不同類(lèi)型的記憶體。
諾貝爾獎(jiǎng)獲得者丹尼爾?卡尼曼將人類(lèi)的思考模式分為兩種:系統(tǒng)1是快思考,面對(duì)事物時(shí)能快速產(chǎn)生直覺(jué)、迅速作出決定,無(wú)需深入思考;系統(tǒng)2是慢思考,需要經(jīng)過(guò)深度分析和推理,是人類(lèi)高級(jí)智能的體現(xiàn)。這兩種系統(tǒng)可以相互轉(zhuǎn)換,當(dāng)我們對(duì)某件事足夠熟悉后,慢思考會(huì)轉(zhuǎn)化為肌肉記憶和直覺(jué)。比如學(xué)車(chē)初期,我們會(huì)刻意關(guān)注交通規(guī)則、路牌、信號(hào)燈和路況,但熟練之后,駕駛就會(huì)變成自然、自覺(jué)的行為,這就是系統(tǒng)轉(zhuǎn)換的過(guò)程。
人工智能,本質(zhì)上是學(xué)習(xí)人類(lèi)智能的過(guò)程。多年來(lái)我們一直在探尋智能的本質(zhì)?!叭斯ぶ悄堋保ˋrtificial Intelligence)這一概念于1956年被正式定義,而它的理論奠基可追溯到更早——英國(guó)科學(xué)家圖靈率先定義了“計(jì)算”與“智能”,并提出了“圖靈測(cè)試”:若機(jī)器能通過(guò)多輪對(duì)話(huà),讓人類(lèi)無(wú)法分辨其是否為人類(lèi),就意味著通過(guò)了測(cè)試。另外還有兩位重要奠基人常常被忽略:一位是“信息論之父”香農(nóng),他定義了比特和信息量(熵),另一位是“控制論之父”維納,他定義了負(fù)反饋、學(xué)習(xí)和自適應(yīng),這些基礎(chǔ)概念對(duì)人工智能的發(fā)展起到了至關(guān)重要的作用。
多年來(lái),人工智能領(lǐng)域出現(xiàn)了很多不同的學(xué)派,大致來(lái)說(shuō)主要是兩種不同的思路。一種思路認(rèn)為,可以把大腦的邏輯、規(guī)則、推理過(guò)程都用符號(hào)表示出來(lái),這就是符號(hào)學(xué)派。基于這種方式,邏輯體系很漂亮、很簡(jiǎn)潔,也有明確的因果關(guān)系,具備透明性,我們知道機(jī)器是怎么推理的,但它唯一的缺點(diǎn)就是不實(shí)用,在實(shí)際應(yīng)用中效果不佳。還有一種思路來(lái)自連接學(xué)派。這個(gè)學(xué)派認(rèn)為,大腦如此復(fù)雜,智能的實(shí)現(xiàn)十分困難,所以要通過(guò)大量的數(shù)據(jù),通過(guò)積累經(jīng)驗(yàn)、持續(xù)學(xué)習(xí)、不斷適應(yīng),以及與世界的連接來(lái)獲取智能,這就是連接主義。最近10~20年主流的深度學(xué)習(xí)技術(shù)用的就是這樣的方法。
人工智能發(fā)展史上有幾個(gè)里程碑性質(zhì)的關(guān)鍵事件值得關(guān)注:2016年圍棋人工智能程序AlphaGo第一次擊敗了李世石九段,比分是4∶1??聺嵕哦尾环?,2017年他和AlphaGo下了三盤(pán)棋,最終0∶3。AlphaGo當(dāng)然很聰明,它用到了深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí),還有蒙特卡洛搜索,是很了不起的成果,它學(xué)習(xí)了人類(lèi)幾十萬(wàn)盤(pán)棋局。但我覺(jué)得更了不起的,是大家聽(tīng)聞?shì)^少的AlphaGo升級(jí)版AlphaGo Zero。它完全不用學(xué)習(xí)人類(lèi)的棋局,而是自己和自己下棋,通過(guò)不斷地博弈來(lái)學(xué)習(xí),進(jìn)化速度非???。AlphaGo Zero和AlphaGo的前一個(gè)版本下了100場(chǎng)棋,它完勝,比分100∶0。它不僅可以下圍棋,還可以下國(guó)際象棋以及別的棋類(lèi)。所以后來(lái)DeepMind(谷歌旗下人工智能公司)團(tuán)隊(duì)說(shuō),從此我們不和人類(lèi)下棋了,因?yàn)樗械钠孱?lèi),人類(lèi)都下不過(guò)人工智能。AlphaGo和AlphaFold代表的是一個(gè)特別重要的概念——智能體。
基于類(lèi)似邏輯但算法不同,DeepMind又推出AlphaFold,解決了人類(lèi)蛋白質(zhì)解析預(yù)測(cè)長(zhǎng)期面臨的難題。原本人類(lèi)需要花費(fèi)10億元、眾多科研人員耗費(fèi)十余年才能完成的工作,AlphaFold僅用一年就全部解決。
2024年,諾貝爾物理學(xué)獎(jiǎng)、化學(xué)獎(jiǎng)均授予了人工智能領(lǐng)域的奠基人,其中就包括DeepMind創(chuàng)始人德米斯?哈薩比斯——他的團(tuán)隊(duì)既創(chuàng)造了AlphaGo,也打造了AlphaFold。2025年1月,我在達(dá)沃斯與他有過(guò)一場(chǎng)關(guān)于新藥研發(fā)、生物計(jì)算及人工智能未來(lái)發(fā)展的有趣對(duì)話(huà)。
另外一個(gè)大的里程碑,是2022年,OpenAI的ChatGPT出現(xiàn)了。過(guò)去的深度學(xué)習(xí)或者神經(jīng)元網(wǎng)絡(luò),主要還是針對(duì)具體任務(wù),本質(zhì)上是一種很聰明的模式識(shí)別,比如說(shuō)語(yǔ)音識(shí)別、人臉識(shí)別、圖像識(shí)別,或者字符識(shí)別等,算是一種高級(jí)的識(shí)別技術(shù)。但ChatGPT出來(lái)之后,跳躍到了一個(gè)新的范式,它不僅可以識(shí)別,還可以生成、可以創(chuàng)造,生成式AI就這么出現(xiàn)了。
生成式AI有三個(gè)重要的元素:統(tǒng)一表征(Tokenization)、規(guī)模定律(Scaling Law)和涌現(xiàn)效應(yīng)(Emergence)。其中最重要的,我認(rèn)為是統(tǒng)一表征。ChatGPT是怎么做的呢?有點(diǎn)像人類(lèi)的神經(jīng)元,我們?nèi)祟?lèi)有860億個(gè)神經(jīng)元,不管分布在什么地方,每個(gè)神經(jīng)元的結(jié)構(gòu)都是完全一樣的,視覺(jué)的、聽(tīng)覺(jué)的、運(yùn)動(dòng)的、記憶相關(guān)的,都是同樣的結(jié)構(gòu)。生成式AI的統(tǒng)一表征也是類(lèi)似的道理,不管什么樣的信號(hào)進(jìn)來(lái),都把它變成Token(詞元),核心任務(wù)就是預(yù)測(cè)并生成下一個(gè)Token。它可以生成文字、圖像、視頻,現(xiàn)在大家已經(jīng)用得很多了。同時(shí)它還可以生成新的數(shù)據(jù)、代碼、數(shù)學(xué)方程式、工具——它不僅能生成工具,還能使用工具;它還可以生成新的蛋白質(zhì)、分子、材料、藥物。當(dāng)大語(yǔ)言模型的參數(shù)量突破百億級(jí)別時(shí),便會(huì)觸發(fā)規(guī)模定律,出現(xiàn)涌現(xiàn)效應(yīng)。也就是說(shuō),模型的性能并非線(xiàn)性增長(zhǎng),而是隨著規(guī)模擴(kuò)大發(fā)生躍遷,從而涌現(xiàn)出未經(jīng)編程的、令人驚喜的新能力。
還有一個(gè)重要的里程碑,是中國(guó)的DeepSeek,出現(xiàn)在2025年1月。DeepSeek出現(xiàn)之前,中國(guó)有上百個(gè)大模型,這些大模型基本都是在模仿學(xué)習(xí)ChatGPT等的技術(shù)路徑、算法的架構(gòu)體系。在DeepSeek出現(xiàn)之前,我曾經(jīng)說(shuō)過(guò),我們和美國(guó)在大模型領(lǐng)域的差距,大概是兩到三年。DeepSeek是一家小創(chuàng)業(yè)公司,它的工程團(tuán)隊(duì)所在地距離清華大學(xué)可能就5~10分鐘路程,團(tuán)隊(duì)里很多都是清華的學(xué)生。DeepSeek是一條新的路徑,在算法、技術(shù)、系統(tǒng)架構(gòu)上都有創(chuàng)新,它用1%的算力就可以達(dá)到和美國(guó)前沿大模型相似的能力。DeepSeek出來(lái)之后,咱們和美國(guó)在大模型領(lǐng)域的差距就縮短到大約2~3個(gè)月,也就是一個(gè)版本的差距,在有些應(yīng)用方面我們可能做得更好。另外,它采用開(kāi)源模式,它的開(kāi)源模型很快就被很多買(mǎi)不起大模型的國(guó)家、地區(qū)所使用,這使得整個(gè)模型的落地和應(yīng)用變得越來(lái)越快。所以我把它稱(chēng)為“DeepSeek時(shí)刻”,這是屬于中國(guó)的時(shí)刻。
從生成式AI到智能體AI
2025年,人工智能領(lǐng)域迎來(lái)了又一重要轉(zhuǎn)變——從生成式AI邁向智能體AI。在此之前,我們遵循“規(guī)模定律”:數(shù)據(jù)越多、算力越強(qiáng),模型效果越好,達(dá)到一定階段后會(huì)出現(xiàn)涌現(xiàn)效應(yīng)。但2025年我們發(fā)現(xiàn),語(yǔ)言領(lǐng)域預(yù)訓(xùn)練階段的規(guī)模效應(yīng)正在放緩,數(shù)據(jù)資源逐漸趨于飽和,繼續(xù)增加算力的邊際收益不斷減少。與之相對(duì),后訓(xùn)練(Post-train)階段的重要性日益凸顯。這就像人類(lèi)的成長(zhǎng):預(yù)訓(xùn)練如同上學(xué)階段,從本科到碩士、博士,通過(guò)學(xué)習(xí)積累知識(shí)變得聰明;而后訓(xùn)練則像是工作后的實(shí)踐,在具體場(chǎng)景中不斷學(xué)習(xí)、進(jìn)化,這也是智能體AI的核心來(lái)源。
什么是智能體?人類(lèi)作為高智能物種,能夠設(shè)定任務(wù)和目標(biāo)、規(guī)劃實(shí)現(xiàn)路徑、不斷試錯(cuò)反饋,憑借強(qiáng)大的記憶完成任務(wù)。例如,同學(xué)們想學(xué)習(xí)人工智能的話(huà),就會(huì)想需要去上哪位老師的課、會(huì)比較哪位老師講得最好,以及需要哪些參考書(shū)、要如何準(zhǔn)備考試、做哪些練習(xí)題等,把學(xué)習(xí)人工智能這個(gè)目標(biāo)分解,然后找到最佳的實(shí)現(xiàn)路徑,這是我們?nèi)祟?lèi)的核心特點(diǎn)之一。而AI智能體在學(xué)習(xí)人類(lèi)這種高級(jí)智能時(shí),具備三大關(guān)鍵能力:
第一點(diǎn),自主學(xué)習(xí)(Autonomous),而不是自動(dòng)學(xué)習(xí)(Automatic),這兩者之間存在很大差別:自主學(xué)習(xí)是沒(méi)有固定的規(guī)則,在不斷探索中學(xué)習(xí);而自動(dòng)化往往是有預(yù)設(shè)規(guī)則的,是按照定義好的規(guī)則來(lái)運(yùn)行的。
第二點(diǎn),可進(jìn)化,通過(guò)不斷迭代可以變得更好,而且進(jìn)化之后,下次再做類(lèi)似的事情,可以把原來(lái)學(xué)到的知識(shí)用上。這是我們?nèi)祟?lèi)和其他物種的重要區(qū)別之一——人類(lèi)的智能是可以疊加的。而和人類(lèi)親緣關(guān)系最近的物種黑猩猩,它們一代和另一代之間的智能是沒(méi)有本質(zhì)區(qū)別的。
第三點(diǎn),泛化能力,即舉一反三的能力。比如說(shuō)一個(gè)人學(xué)會(huì)了怎么去訂票,那么他所擁有的這個(gè)技能可以用到其他類(lèi)似的領(lǐng)域,例如報(bào)銷(xiāo)、購(gòu)物等等??煞夯允俏覀?nèi)祟?lèi)的特點(diǎn),但人類(lèi)的可泛化能力也是受到一些限制的。比如,有的同學(xué)可能理科成績(jī)很好,但文科就不一定和理科一樣優(yōu)秀了。再比如,我有一個(gè)好朋友,他特別聰明,工作也做得很棒,但他學(xué)開(kāi)車(chē)拿駕駛執(zhí)照前后用了15年都沒(méi)拿到,最后總算拿到了,結(jié)果馬上就撞車(chē)了。但我們還是希望人工智能能夠具備舉一反三的泛化能力。
這些智能的實(shí)現(xiàn),離不開(kāi)最基本的東西——數(shù)據(jù)。數(shù)據(jù)的本質(zhì)就是數(shù)字化,我們的技術(shù)底座就是數(shù)字化。首先是信息世界的數(shù)字化,然后是物理世界的數(shù)字化、生物世界的數(shù)字化。過(guò)去40年,我們最重要的工作就是數(shù)字化。這項(xiàng)工作的早期從1985年開(kāi)始,我們進(jìn)行內(nèi)容數(shù)字化、文檔數(shù)字化,我們的語(yǔ)音、圖像、視頻、文本、PPT等都是在那個(gè)時(shí)候變成數(shù)字化內(nèi)容的。后來(lái)加上HTML等技術(shù),取得了一個(gè)重大成果,就是互聯(lián)網(wǎng),先是PC互聯(lián)網(wǎng),后來(lái)是移動(dòng)互聯(lián)網(wǎng)。然后我們又對(duì)企業(yè)進(jìn)行數(shù)字化,或者說(shuō)對(duì)企業(yè)進(jìn)行信息化,包括ERP系統(tǒng)、CRM系統(tǒng)、數(shù)據(jù)庫(kù)等,還有各種各樣的業(yè)務(wù)流程。這一階段催生了兩個(gè)最大的成果,一個(gè)是數(shù)據(jù)庫(kù),另外一個(gè)是云計(jì)算?,F(xiàn)在,我們的物理世界正在被數(shù)字化,汽車(chē)、公路、交通燈、城市在數(shù)字化,我們的電網(wǎng)在數(shù)字化,我們的家庭在數(shù)字化,我們的車(chē)間在數(shù)字化,我們的工廠(chǎng)在數(shù)字化……整個(gè)物理世界都在經(jīng)歷數(shù)字化的變革。同時(shí),生物世界的蛋白質(zhì)、大腦、細(xì)胞、基因等等也都在被數(shù)字化。
美國(guó)麻省理工媒體實(shí)驗(yàn)室主任曾在數(shù)字化1.0開(kāi)啟時(shí)提出,我們正在從“原子”走向“比特”。“比特”是香農(nóng)所定義的數(shù)字世界的基本單位。而如今,我們正從比特回歸原子、走向分子——新一代智能是信息智能、物理智能和生物智能的融合,是比特、原子和分子的融合,也是碳基生命和硅基世界的融合。
清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)的實(shí)踐
2020年12月,我來(lái)到清華大學(xué)創(chuàng)立了智能產(chǎn)業(yè)研究院(AI Industry Research,簡(jiǎn)稱(chēng)AIR)。AIR的“I”有三重含義:國(guó)際化(International)、人工智能(AI)、產(chǎn)業(yè)(Industry)。我們的使命清晰明確:用人工智能創(chuàng)新賦能產(chǎn)業(yè),推動(dòng)社會(huì)進(jìn)步;目標(biāo)是打造面向第四次工業(yè)革命的國(guó)際化、智能化、產(chǎn)業(yè)化研究機(jī)構(gòu)。
要實(shí)現(xiàn)這一目標(biāo),核心是培養(yǎng)未來(lái)技術(shù)領(lǐng)軍人才。我們采用“學(xué)術(shù)+產(chǎn)業(yè)”雙引擎模式,大部分老師既具備深厚的學(xué)術(shù)造詣,又擁有豐富的產(chǎn)業(yè)經(jīng)驗(yàn)。目前研究院已有20多位老師、100多位博士后和博士生、400多位實(shí)習(xí)生,已成為全球人工智能領(lǐng)域最活躍、最具貢獻(xiàn)的機(jī)構(gòu)之一。
智能體AI的多元應(yīng)用
接下來(lái),我將結(jié)合AIR老師們的研究成果,從信息智能、物理智能、生物智能三個(gè)維度,為大家介紹智能體的具體應(yīng)用。
信息智能體:從數(shù)學(xué)解題到科學(xué)研究
智能體的核心難點(diǎn)之一是實(shí)現(xiàn)自主、可進(jìn)化、可泛化的能力,讓其能在手機(jī)、PC、眼鏡、手表、電視等不同設(shè)備上運(yùn)行,可應(yīng)用于購(gòu)物、旅游、企業(yè)供應(yīng)鏈管理等多個(gè)場(chǎng)景。更重要的是,我們希望智能體能夠完成更高級(jí)的任務(wù),比如解數(shù)學(xué)題、發(fā)明方程式、提出新問(wèn)題等。
AIR李鵬老師團(tuán)隊(duì)與清華大學(xué)丘成桐先生的數(shù)學(xué)研究團(tuán)隊(duì)合作,研發(fā)了數(shù)學(xué)智能體AIM。它能夠分解任務(wù),完成定理證明。例如在材料科學(xué)、分子動(dòng)力學(xué)領(lǐng)域的重要難題“均勻化問(wèn)題”的證明中,AIM形成了17頁(yè)的證明文檔。這是人機(jī)協(xié)作的絕佳范例,據(jù)數(shù)學(xué)老師反饋,證明中最難的部分由AI完成。
雖然目前AIM證明的問(wèn)題仍有一定難度限制,但我相信未來(lái)五年,人工智能能夠獨(dú)立證明更難的數(shù)學(xué)問(wèn)題——比如千禧年提出的7個(gè)最難數(shù)學(xué)問(wèn)題(目前已有2個(gè)被解決,剩余5個(gè),包括計(jì)算機(jī)領(lǐng)域的NP完備性問(wèn)題、哥德巴赫猜想、黎曼猜想等)。我與丘成桐先生就此“打賭”,我認(rèn)為五年內(nèi)AI能完成其中至少一個(gè)難題的證明。無(wú)論具體時(shí)間如何,核心意義在于:AI已具備證明難題、提出新問(wèn)題、生成新方程式的潛力。
物理智能體:從機(jī)器人到無(wú)人駕駛
不同于目前的語(yǔ)言模型,物理世界的智能體需要具備視覺(jué)(Vision)、語(yǔ)言(Language)、行動(dòng)(Action)能力,構(gòu)建“世界模型”。AIR曹婷老師團(tuán)隊(duì)研發(fā)的系統(tǒng),就實(shí)現(xiàn)了物理世界機(jī)器人智能體的核心功能——通過(guò)感知、推理、進(jìn)化、行動(dòng)和獎(jiǎng)勵(lì)機(jī)制,生成決策和動(dòng)作,指揮機(jī)器人完成任務(wù)。
詹仙園老師團(tuán)隊(duì)研發(fā)的X-VLA系統(tǒng),嘗試解決智能體的泛化問(wèn)題。傳統(tǒng)機(jī)器人學(xué)會(huì)一項(xiàng)技能后,難以遷移到其他機(jī)器人或不同場(chǎng)景。而X-VLA系統(tǒng)僅需9億個(gè)參數(shù),就能部署到不同機(jī)械臂和機(jī)器人上,實(shí)現(xiàn)技能的跨設(shè)備、跨場(chǎng)景遷移。比如機(jī)械臂學(xué)會(huì)疊衣服后,更換不同機(jī)械臂、調(diào)整桌子高度,仍能完成疊衣服任務(wù),還能將相關(guān)技能遷移到做家務(wù)等其他場(chǎng)景,完全通過(guò)自主學(xué)習(xí)適應(yīng)環(huán)境。
無(wú)人駕駛是物理智能體的另一重要應(yīng)用,也是我多年來(lái)持續(xù)關(guān)注的課題。無(wú)人駕駛的難度極高,需要車(chē)輛精準(zhǔn)感知復(fù)雜交通環(huán)境、規(guī)劃路徑、做出實(shí)時(shí)安全的決策,集成了人工智能的各項(xiàng)核心技術(shù),因此被稱(chēng)為“人工智能集大成者”。目前在全球范圍內(nèi)無(wú)人駕駛?cè)〉昧孙@著進(jìn)展,整個(gè)產(chǎn)業(yè)正從技術(shù)研發(fā)走向商業(yè)化落地。
生物智能體:從新藥研發(fā)到智能醫(yī)療
人工智能在生物智能領(lǐng)域的應(yīng)用,首先體現(xiàn)在新藥研發(fā)的加速上。德米斯?哈薩比斯曾在達(dá)沃斯對(duì)話(huà)中提到,未來(lái)十年左右人類(lèi)所有疾病都可能被治愈,這一觀(guān)點(diǎn)也許過(guò)于樂(lè)觀(guān),但人工智能確實(shí)能大幅縮短新藥研發(fā)周期。
AIR蘭艷艷老師團(tuán)隊(duì)研發(fā)了新藥篩選新技術(shù),通過(guò)AlphaFold解碼2萬(wàn)多個(gè)蛋白質(zhì)結(jié)構(gòu),找到“口袋靶點(diǎn)”,再與幾十億、上百億個(gè)蛋白質(zhì)進(jìn)行對(duì)接。目前僅有不到10%的蛋白質(zhì)可用于制藥,大量蛋白質(zhì)分子結(jié)構(gòu)的應(yīng)用價(jià)值尚未被發(fā)掘,而該技術(shù)通過(guò)人工智能算法實(shí)現(xiàn)了篩選速度的百萬(wàn)倍提升。該研究成果發(fā)表于《科學(xué)》。
聶再清老師團(tuán)隊(duì)打造的新藥研發(fā)智能體,能夠根據(jù)研發(fā)需求分解任務(wù),自動(dòng)查找資料、分析蛋白質(zhì)結(jié)構(gòu)和功能,生成初步研發(fā)圖譜,極大提升了新藥研發(fā)的效率,為科研人員提供了重要支持。
人工智能在醫(yī)療領(lǐng)域的另一突破,是AIR劉洋老師團(tuán)隊(duì)打造的全球首個(gè)無(wú)人智能體醫(yī)院——清華大學(xué)人工智能醫(yī)院(2025年4月成立)。這是一個(gè)虛擬醫(yī)院,醫(yī)生、病人、護(hù)士等角色均由智能體擔(dān)任,涵蓋不同科室,形成完整診療閉環(huán)。智能體之間通過(guò)協(xié)作、博弈不斷進(jìn)化,無(wú)需人工標(biāo)注數(shù)據(jù)。需要強(qiáng)調(diào)的是,AI智能體醫(yī)生并非要替代人類(lèi)醫(yī)生,而是作為醫(yī)生的助手,提升診斷效率和準(zhǔn)確性。目前,該系統(tǒng)已在清華校醫(yī)院、長(zhǎng)庚醫(yī)院等十幾家醫(yī)療機(jī)構(gòu)開(kāi)展測(cè)試。
未來(lái)技術(shù)發(fā)展和產(chǎn)業(yè)格局
人工智能時(shí)代的“操作系統(tǒng)”
下面,我想講一下未來(lái)技術(shù)的發(fā)展趨勢(shì),特別是產(chǎn)業(yè)格局的變化。
我在微軟公司工作近16年,其間主持開(kāi)發(fā)了全球最大的嵌入式操作系統(tǒng)WindowsCE。操作系統(tǒng),是定義一個(gè)時(shí)代最重要的技術(shù)平臺(tái),有了操作系統(tǒng)之后,芯片、應(yīng)用程序,整個(gè)技術(shù)生態(tài)其實(shí)都是圍繞著操作系統(tǒng)來(lái)部署的。在PC時(shí)代,我們知道操作系統(tǒng)是Windows(視窗操作系統(tǒng)),芯片是X86架構(gòu),圍繞著這個(gè)平臺(tái)開(kāi)發(fā)了各種各樣的應(yīng)用程序。到了移動(dòng)互聯(lián)網(wǎng)時(shí)代,我們用的手機(jī)操作系統(tǒng)是iOS和安卓,在國(guó)內(nèi)也用華為的鴻蒙系統(tǒng)。芯片變了,變成了ARM架構(gòu),應(yīng)用也變了,有各種不同的移動(dòng)應(yīng)用,像微信、短視頻等等。到了人工智能時(shí)代,大模型就是操作系統(tǒng)。圍繞著這個(gè)操作系統(tǒng),芯片架構(gòu)變成了以GPU為主流,應(yīng)用生態(tài)也變了。這次人工智能時(shí)代的技術(shù)規(guī)模,比移動(dòng)互聯(lián)網(wǎng)時(shí)代、PC時(shí)代都要大很多倍,可能會(huì)達(dá)到一個(gè)數(shù)量級(jí)、兩個(gè)數(shù)量級(jí),甚至更大的規(guī)模。
2023年3月,我繪制了人工智能時(shí)代的架構(gòu)圖:以前沿基座大模型為操作系統(tǒng),上層涵蓋行業(yè)垂直系統(tǒng)、SaaS應(yīng)用軟件,端側(cè)(手機(jī)、PC)則通過(guò)大模型蒸餾或壓縮后的小模型運(yùn)行App。到2025年10月,我對(duì)這一架構(gòu)進(jìn)行了更新,核心變化是將SaaS和App替換為智能體——我認(rèn)為智能體是未來(lái)的SaaS,也是未來(lái)的App。雖然短期內(nèi)手機(jī)App仍是主流,但智能體功能將逐步融入其中。
通用人工智能(AGI)的實(shí)現(xiàn)路徑
智能體是實(shí)現(xiàn)通用人工智能(AGI)的必然路徑。目前AGI的定義尚未統(tǒng)一,我對(duì)其的理解是:可進(jìn)化、可泛化、具備長(zhǎng)期記憶,在99%的任務(wù)上超過(guò)99%的人類(lèi)。要實(shí)現(xiàn)AGI,還需要解決一系列關(guān)鍵問(wèn)題,比如構(gòu)建符合物理定律的世界模型、理解因果關(guān)系、優(yōu)化記憶系統(tǒng)等。當(dāng)前AI的記憶較為粗糙膚淺,而人類(lèi)記憶是智能的核心復(fù)雜部分。
如果按照這樣的定義,我認(rèn)為我們?cè)?5~20年內(nèi)會(huì)達(dá)到AGI的水平,并且能夠通過(guò)“新圖靈測(cè)試”。圖靈測(cè)試一開(kāi)始只是文本對(duì)話(huà)層面的測(cè)試,現(xiàn)在它已經(jīng)延伸到各個(gè)領(lǐng)域了。首先在信息領(lǐng)域,在內(nèi)容生成方面,我覺(jué)得5年之內(nèi)就可以達(dá)到AGI的水平。10年之內(nèi),在物理智能方面可以實(shí)現(xiàn)AGI,無(wú)人車(chē)從技術(shù)方面已經(jīng)基本過(guò)關(guān)了,人形機(jī)器人還需要更長(zhǎng)的時(shí)間。我們現(xiàn)在看到各種人形機(jī)器人的表現(xiàn)都很好,也有很多相關(guān)研究,包括人形機(jī)器人的靈巧手、人臉肌肉控制等技術(shù),但要做到真正和人類(lèi)相似,估計(jì)至少還需要10年時(shí)間。我很看好這個(gè)產(chǎn)業(yè),我認(rèn)為,這會(huì)是一個(gè)巨大的產(chǎn)業(yè)。但是目前人形機(jī)器人還處于科研階段,還未達(dá)到完全量產(chǎn)的程度。更重要的是生物智能領(lǐng)域,比如腦機(jī)接口、生物體與AI的融合、生命體的數(shù)字化等,這個(gè)領(lǐng)域要實(shí)現(xiàn)AGI,我認(rèn)為還需要差不多20年的時(shí)間。
從互聯(lián)網(wǎng)的發(fā)展脈絡(luò)來(lái)看,1995年我們開(kāi)啟了PC互聯(lián)網(wǎng)時(shí)代,2005年開(kāi)啟了移動(dòng)互聯(lián)網(wǎng)時(shí)代,2015年開(kāi)啟了物聯(lián)網(wǎng)時(shí)代,也就是萬(wàn)物互聯(lián)的時(shí)代。現(xiàn)在我認(rèn)為,我們進(jìn)入了一個(gè)新的時(shí)代,即智能體互聯(lián)網(wǎng)時(shí)代,也就是Internet of Agents。
這里面有一個(gè)特別有意思的概念——Agent Swarm(智能體群)。這是2025年提出的概念,認(rèn)為未來(lái)人類(lèi)交往將通過(guò)智能體實(shí)現(xiàn),智能體之間將形成群體智能,通過(guò)協(xié)作、博弈、糾錯(cuò)不斷進(jìn)化,如同蜂群、動(dòng)物群體一般,最終進(jìn)化為類(lèi)似人類(lèi)大腦神經(jīng)元網(wǎng)絡(luò)的結(jié)構(gòu),并催生“智能體經(jīng)濟(jì)”。這種智能體經(jīng)濟(jì)將徹底改變經(jīng)濟(jì)形態(tài)、人類(lèi)組織架構(gòu)和企業(yè)運(yùn)作模式:企業(yè)的核心資產(chǎn)將變?yōu)樾酒?、?shù)據(jù)中心、數(shù)據(jù)和AI模型;團(tuán)隊(duì)組建不再局限于招聘人類(lèi)員工,智能體將成為重要組成部分。
人工智能的風(fēng)險(xiǎn)與治理
我們還要強(qiáng)調(diào)一件最重要的事:人工智能智能體在帶來(lái)巨大機(jī)遇和強(qiáng)大能力的同時(shí),也伴隨著不可忽視的風(fēng)險(xiǎn)。
風(fēng)險(xiǎn)包括幾個(gè)層面:首先是信息智能領(lǐng)域的風(fēng)險(xiǎn),我們已經(jīng)看到了,它可以生成虛假信息,它可以進(jìn)行深度偽造,有的時(shí)候它還會(huì)產(chǎn)生幻覺(jué),還可以用來(lái)欺騙他人。另外,還有版權(quán)歸屬的問(wèn)題。
我們現(xiàn)在使用的互聯(lián)網(wǎng)信息,從2025年11月開(kāi)始,已經(jīng)有50%以上由人工智能產(chǎn)生。該怎么防范這些信息中可能隱藏的風(fēng)險(xiǎn)?這需要我們從技術(shù)、政策、法規(guī)方面共同努力。不過(guò),目前這個(gè)領(lǐng)域存在的風(fēng)險(xiǎn),我認(rèn)為還是可控的。
在物理世界,我們把大模型、智能體和無(wú)人車(chē)、機(jī)器人、無(wú)人機(jī),包括軍事系統(tǒng)連接起來(lái),智能體之間的協(xié)作和博弈如果出現(xiàn)失控、被惡意濫用,造成的風(fēng)險(xiǎn)就會(huì)更大。在生物智能領(lǐng)域,假如人類(lèi)的大腦和AI連接在一起了,盡管這可以給人類(lèi)帶來(lái)巨大的好處,但是我們也可以想象到一旦出現(xiàn)失控、被濫用等情況,風(fēng)險(xiǎn)也會(huì)特別大。所以我們需要去研究和解決這些問(wèn)題。這就需要科學(xué)研究人員、技術(shù)開(kāi)發(fā)人員、產(chǎn)品設(shè)計(jì)人員,以及政策法規(guī)專(zhuān)家等各方協(xié)力共同打造有效的治理框架,這個(gè)治理框架應(yīng)該是全球范圍的。對(duì)此,我個(gè)人是有信心的——進(jìn)化了這么多年的人類(lèi),完全可以發(fā)明高級(jí)的工具,同時(shí)管理好高級(jí)的工具。
當(dāng)前,人工智能正從鑒別式AI走向生成式AI,并逐步邁向智能體AI。新一輪人工智能是信息智能、物理智能和生物智能的融合,是原子、比特和分子的融合。在這一進(jìn)程中,我們擁有天文級(jí)海量數(shù)據(jù)、指數(shù)級(jí)運(yùn)算能力,更重要的是人與機(jī)器將協(xié)同進(jìn)化,催生巨大的產(chǎn)業(yè)機(jī)遇——達(dá)沃斯AI理事會(huì)預(yù)測(cè),到2030年,人工智能帶來(lái)的新機(jī)遇將創(chuàng)造約20萬(wàn)億美元的經(jīng)濟(jì)價(jià)值。同時(shí),我們也必須直面隱私保護(hù)、安全保障、就業(yè)轉(zhuǎn)型、社會(huì)公平、風(fēng)險(xiǎn)治理等一系列社會(huì)挑戰(zhàn)。
人工智能正在開(kāi)啟第四次工業(yè)革命。我堅(jiān)信,憑借強(qiáng)大的國(guó)力、眾多的人才和有利的政策,中國(guó)必將成為其中的領(lǐng)軍者。
編輯:李華山