?劉云浩:具身智能,AI融入物理世界的“下一步”

本刊記者 謝瑋

從早期只能進(jìn)行簡單計(jì)算的程序,到如今能夠與人類流暢對話、戰(zhàn)勝頂級棋手的智能系統(tǒng),人工智能的每一次突破都震撼著世界。具身智能作為人工智能向物理世界的進(jìn)一步延伸,正逐步展現(xiàn)變革性潛力,成為學(xué)界和產(chǎn)業(yè)界共同關(guān)注的焦點(diǎn)。

清華大學(xué)全球創(chuàng)新學(xué)院院長、自動化系教授兼博導(dǎo)劉云浩在其新書《具身智能:人工智能的下一個浪潮》中,以通俗易懂的方式解讀人工智能的“前世今生”,并深入剖析具身智能的內(nèi)涵、前沿創(chuàng)新、科技成果轉(zhuǎn)化和超級場景。

近日,圍繞具身智能相關(guān)話題,《中國經(jīng)濟(jì)周刊》記者獨(dú)家專訪了劉云浩教授,請他深入剖析人工智能的發(fā)展階段、具身智能的關(guān)鍵意義,以及將如何重塑我們的世界。

《中國經(jīng)濟(jì)周刊》:當(dāng)前的人工智能發(fā)展到了什么階段?為什么越來越多的人開始擔(dān)心人工智能的安全?

劉云浩:人工智能概念正式定義于1956年的達(dá)特茅斯會議。根據(jù)MIT教授Alex Pentland發(fā)表于美國CACM雜志的《Perceptual Intelligence》(感知智能),學(xué)術(shù)界通常把人工智能劃分為三個階段,第一個階段是計(jì)算智能,即機(jī)器像人一樣計(jì)算和處理海量數(shù)據(jù)。經(jīng)過半個多世紀(jì)的發(fā)展,AI在算力和存儲方面已經(jīng)超越了人類。第二個階段是感知智能,先是機(jī)器通過模仿人類的視覺、聽覺、嗅覺、味覺等感知能力理解物理世界,進(jìn)一步可能會超越人類的感知維度,當(dāng)前人工智能正處于這個階段。尚未到來的第三個階段是認(rèn)知智能,學(xué)術(shù)界正在進(jìn)行從感知智能邁向認(rèn)知智能的路徑探索。

人們對人工智能的擔(dān)心很正常。事實(shí)上,人類歷史上每一次重大技術(shù)突破——無論是電力、火車、核能,還是今天的AI——都伴隨著爭議、擔(dān)心乃至恐慌。例如1960年生產(chǎn)自動化給人們帶來了巨大擔(dān)憂,《科學(xué)》(Science)期刊發(fā)表了一篇文章,寫道“機(jī)器可能脫離人類的控制,威脅人類生存”。

AI的這次飛躍和之前的技術(shù)爆發(fā)相比還有很多新特點(diǎn)。

首先,我們正親歷AI在迅速掌握那些人類曾引以為傲、視為與其他物種根本區(qū)別的核心能力。如歷史上兩次有名的“AI戰(zhàn)勝人類”——1997年“深藍(lán)”戰(zhàn)勝國際象棋世界冠軍卡斯帕羅夫;2016年,AlphaGo 擊敗圍棋頂尖選手李世石——都曾引發(fā)全球性的震動。2022年 ChatGPT 走進(jìn)大眾視野,大模型在語言理解和生成方面展現(xiàn)出令人驚嘆的能力。維特根斯坦曾說過:“語言的邊界就是世界的邊界?!币虼嗽絹碓蕉嗟娜碎_始相信,AI走進(jìn)了我們的工作、生活與思維體系,替代我們的職業(yè),人們難免產(chǎn)生本能的不安。

其次,與傳統(tǒng)技術(shù)革新相比,AI的推廣速度之快前所未有,其潛在影響之廣也遠(yuǎn)超預(yù)期。而在其背后,關(guān)于AI的可靠性、安全性與倫理機(jī)制的研究卻慢了一個節(jié)拍,引發(fā)了外界對AI可能失控、被濫用的深層次擔(dān)憂。

這件事情要辯證解讀,擔(dān)憂,并不意味著恐懼;謹(jǐn)慎,也不等于退卻。真正決定技術(shù)走向的不是技術(shù)本身,而是人類如何理解它、掌控它、引導(dǎo)它為人所用。

《中國經(jīng)濟(jì)周刊》:對人工智能來說,為何“身體”如此重要?

劉云浩:具身智能中“具身”是指憑借在物理世界中的實(shí)體感知能力,實(shí)現(xiàn)更高級別的人工智能。

早在1950年,人工智能之父——圖靈在他的經(jīng)典論文《計(jì)算機(jī)與智能》中就展望了人工智能可能的兩條發(fā)展道路:一是專注于抽象計(jì)算所需的智能,我們稱之為“離身智能”;二是為機(jī)器配置最佳的傳感器,教機(jī)器說話,使其可以與人類交流并像嬰兒一樣“成長”,我們稱之為“具身智能”。

過去幾十年,“離身智能”一直是人工智能的主流,目前火熱的大語言模型也屬于這一范疇,盡管已經(jīng)大獲成功,但是人工智能被困于“莫拉維克悖論”——AI做計(jì)算甚至下棋是容易實(shí)現(xiàn)的,但是要讓AI有如幾歲小孩般的感知和行動能力,卻相當(dāng)困難,甚至是不可能的。其中的原因是人工智能還沒有與物理世界直接交互的能力,只能與預(yù)設(shè)數(shù)據(jù)進(jìn)行互動。因此,人工智能要繼續(xù)向前發(fā)展,必須通過獲得實(shí)體感知能力,在物理世界中學(xué)習(xí)和進(jìn)化。

《中國經(jīng)濟(jì)周刊》:具身智能會帶來一個怎樣的世界?

劉云浩:具身智能是人工智能發(fā)展的新階段。隨著具身智能逐漸深入人們的生產(chǎn)、生活,它帶給我們的變化可以總結(jié)為三個層次,第一層次可以稱為“科學(xué)顯微鏡”。具身智能會為世界打造一副新的“顯微鏡”,揭示我們可能忽視或者無法可視的對象和過程。第二個層次可以稱為“靈感的源泉”。具身智能能夠從海量環(huán)境數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,找到其中隱藏很深的數(shù)據(jù)關(guān)聯(lián),為人類決策提供“靈感”。第三個層次可以稱為“科學(xué)理解的工具”。機(jī)器能夠協(xié)助人類獲取新的科學(xué)理解,并清晰地解釋這些理解。終極目標(biāo)是在某些方向上協(xié)助人類突破當(dāng)前認(rèn)知局限。

本刊首席攝影記者 肖翊I攝

《中國經(jīng)濟(jì)周刊》:當(dāng)前大熱的人形機(jī)器人產(chǎn)業(yè)處于怎樣的發(fā)展階段?中國有哪些優(yōu)勢?

劉云浩:具身智能和人形機(jī)器人不能簡單地畫等號。實(shí)現(xiàn)具身智能的路徑大概會有多條,人形機(jī)器人的突破毫無疑問是其中一條,其他可能的路徑還包括大模型加實(shí)體進(jìn)行強(qiáng)化學(xué)習(xí),以及通過萬物智聯(lián)實(shí)現(xiàn)智能涌現(xiàn)??赡苓€有其他路徑,學(xué)術(shù)界正在探索。全球人形機(jī)器人產(chǎn)業(yè)過去10年聚焦原型驗(yàn)證(注:指將初步設(shè)計(jì)或設(shè)想制作成實(shí)物模型或樣品,并測試功能和效果),如今已進(jìn)入“小批量交付 + 場景試點(diǎn)”窗口。中國在該領(lǐng)域核心優(yōu)勢很多,例如完整的制造鏈、良好的成本控制、積極的政策拉動,以及手機(jī)、車企跨界帶來的規(guī)模化能力等。亟待進(jìn)一步提升的方面也有很多,比如高端減速器、微特電機(jī)、具身大模型、控制軟件棧、統(tǒng)一的安全標(biāo)準(zhǔn)等。


頂部