先談一下對智能的看法。智能是系統(tǒng)通過獲取和加工信息而獲得的能力。智能系統(tǒng)的重要特征是能夠從無序到有序(熵減)、從簡單到復雜演化(進化)的。生命系統(tǒng)是智能系統(tǒng),也是物理系統(tǒng);既具有熵減的智能特征,也遵守熵增在內(nèi)的物理規(guī)律。人工智能是智能系統(tǒng),也是通過獲取和加工信息而獲得智能,只是智能載體從有機體擴展到一般性的機器。
就像人可以分為精神和肉體兩個層次(當然這兩個層次從根本上密不可分),機器智能也可以分為載體(具有特定結構的機器)和智能(作為一種現(xiàn)象的功能)兩個層次,兩個層次同樣重要。因此,我偏好用機器智能這個概念替代人工智能。
AI 技術途徑概述
一、經(jīng)典技術途徑
1. 符號主義
與機器智能相比,人工智能這個概念的重心在智能?!叭斯ぁ倍指吒咴谏系奶貦喔兄鲗Я巳斯ぶ悄苎芯康那鞍肴~,集中體現(xiàn)為符號主義。
符號主義主張(由人)將智能形式化為符號、知識、規(guī)則和算法,認為符號是智能的基本元素,智能是符號的表征和運算過程。符號主義的思想起源是數(shù)理邏輯、心理學和認知科學,并隨著計算機的發(fā)明而步入實踐。
符號主義有過輝煌,但不能從根本上解決智能問題,一個重要原因是“紙上得來終覺淺”:人類抽象出的符號,源頭是身體對物理世界的感知,人類能夠通過符號進行交流,是因為人類擁有類似的身體。
計算機只處理符號,就不可能有類人感知和類人智能,人類可意會而不能言傳的“潛智能”,不必或不能形式化為符號,更是計算機不能觸及的。要實現(xiàn)類人乃至超人智能,就不能僅僅依靠計算機。
2. 連接主義
與符號主義自頂向下的路線針鋒相對的是連接主義。
連接主義采取自底向上的路線,強調(diào)智能活動是由大量簡單單元通過復雜連接后并行運行的結果,基本思想是:既然生物智能是由神經(jīng)網(wǎng)絡產(chǎn)生的,那就通過人工方式構造神經(jīng)網(wǎng)絡,再訓練人工神經(jīng)網(wǎng)絡產(chǎn)生智能。
人工神經(jīng)網(wǎng)絡研究在現(xiàn)代計算機發(fā)明之前就開始了,1943年,沃倫·麥卡洛克(Warren McCulloch)和沃爾特·皮茨(Walter Pitts)提出的M-P神經(jīng)元模型沿用至今。
連接主義的困難在于,他們并不知道什么樣的網(wǎng)絡能夠產(chǎn)生預期智能,因此大量探索歸于失敗。20世紀80年代神經(jīng)網(wǎng)絡曾經(jīng)興盛一時,掀起本輪人工智能浪潮的深度神經(jīng)網(wǎng)絡只是少見的成功個案,不過這也是技術探索的常態(tài)。
3. 行為主義
人工智能的第三條路線是行為主義,又稱進化主義,思想來源是進化論和控制論。
生物智能是自然進化的產(chǎn)物,生物通過與環(huán)境以及其他生物之間的相互作用發(fā)展出越來越強的智能,人工智能也可以沿這個途徑發(fā)展。
這個學派在20世紀80年代末90年代初興起,近年來頗受矚目的波士頓動力公司的機器狗和機器人就是這個學派的代表作。行為主義的一個分支方向是具身智能,強調(diào)身體對智能形成和發(fā)展的重要性。
行為主義遇到的困難和連接主義類似,那就是什么樣的智能主體才是“可塑之才”。
二、路徑演進
機器學習從20世紀80年代中期開始引領人工智能發(fā)展潮流,本書給出了很通俗的定義:學習就是逐步減少系統(tǒng)誤差的過程,機器學習就是機器進行嘗試、犯錯以及自我調(diào)整等操作。
機器學習對人工智能最重要的貢獻是把研究重心從人工賦予機器智能轉(zhuǎn)移到機器自行習得智能。近年來,最成功的機器學習方法是深度學習和強化學習。
人工智能技術路徑的演進
深度學習是連接主義和機器學習相結合的產(chǎn)物,最大的貢獻是找到了一種在多層神經(jīng)網(wǎng)絡上進行機器學習的方法,本書作者楊立昆和約書亞·本吉奧、杰弗里·辛頓因此獲得2018年度圖靈獎。
深度學習首先回答了什么樣的神經(jīng)網(wǎng)絡可以訓練出智能,包括多層神經(jīng)網(wǎng)絡和卷積神經(jīng)網(wǎng)絡,也回答了訓練(學習)方法問題,包括受限玻爾茲曼機模型、反向傳播算法、自編碼模型等。
深度學習對連接主義的重大意義是給出了一條訓練智能的可行途徑,對機器學習的重大意義則是給出了一個凝聚學習成效的可塑載體。
強化學習的思想和行為主義一脈相承,可追溯到1911年行為心理學的效用法則:給定情境下,得到獎勵的行為會被強化,而受到懲罰的行為會被弱化,這就是強化學習的核心機制——試錯。
1989年,沃特金斯提出Q學習(Q-learning),證明了強化學習的收斂性。2013年,谷歌子公司DeepMind將Q學習和深度神經(jīng)網(wǎng)絡相結合,取得AlphaGo、AlphaZero(阿爾法元)和AlphaStar等重大突破。最近,DeepMind更是強調(diào),只需要強化學習,就能實現(xiàn)通用人工智能。
與DeepMind極力推崇強化學習不同,楊立昆認為強化學習不過是錦上添花,傳統(tǒng)監(jiān)督學習標注成本高,泛化能力有限,也只是點綴,自監(jiān)督學習才是機器學習的未來。自監(jiān)督學習是通過觀察發(fā)現(xiàn)世界內(nèi)在結構的過程,是人類(以及動物)最主要的學習形式,是“智力的本質(zhì)”,這就是本書第九章的核心觀點。最近,楊立昆和另外兩位圖靈獎獲得者發(fā)表的論文“Deep Learning for AI”(《面向人工智能的深度學習》)中,也重點談了這個觀點。
有了三位圖靈獎獲得者的大力倡導,相信自監(jiān)督學習將會掀起一波新的研究浪潮,但我不認為這就是“智力的本質(zhì)”。根本原因在于,這只是從機器學習層次看問題,或者更一般地說,是從功能層次看問題。我認為,學習方法(功能)固然重要,從事學習的機器(結構)同樣重要,甚至更重要,因為結構決定功能。正如我開始時強調(diào)過的,永遠不要忘記作為智能載體的機器。
楊立昆在第九章開篇提到了法國航空先驅(qū)克萊芒·阿代爾(Clément Ader),他比萊特兄弟早13年造出了能飛起來的載人機器。楊立昆從這位先驅(qū)身上看到的主要是教訓:
“我們嘗試復制生物學機制的前提是理解自然機制的本質(zhì),因為在不了解生物學原理的情況下進行復制必然導致慘敗?!?/p>
他的立場也很清楚:
“我認為,我們必須探究智能和學習的基礎原理,不管這些原理是以生物學的形式還是以電子的形式存在。正如空氣動力學解釋了飛機、鳥類、蝙蝠和昆蟲的飛行原理,熱力學解釋了熱機和生化過程中的能量轉(zhuǎn)換一樣,智能理論也必須考慮到各種形式的智能?!?/p>
我的看法和他不同,我認為克萊芒·阿代爾(和萊特兄弟)不僅沒有“慘敗”,而且取得了偉大的成功。
原因很簡單:克萊芒·阿代爾1890年和萊特兄弟1903年分別發(fā)明飛機,而空氣動力學是1939—1946年才建立起來的。兩次世界大戰(zhàn)中發(fā)揮重大作用的飛機,主要貢獻來自克萊芒·阿代爾和萊特兄弟的工程實踐,而不是空氣動力學理論的貢獻,因為空氣動力學還沒出現(xiàn)。
另一個基本事實是,至今空氣動力學也沒能全面解釋飛機飛行的所有秘密,更沒有全面解釋各種動物的飛行原理。
空氣動力學很偉大,但它是“事后諸葛亮”,對于優(yōu)化后來的飛機設計意義重大,但它不是指導飛機發(fā)明的理論導師。
智能比飛行要復雜得多,深度學習成功實現(xiàn)了智能,但是能夠解釋這種成功的理論還沒出現(xiàn),我們并不能因此否定深度學習的偉大意義。楊立昆和另外兩位圖靈獎獲得者的偉大,和克萊芒·阿代爾及萊特兄弟之偉大的性質(zhì)相同。
我們當然要追求智能理論,但是不能迷戀智能理論,更不能把智能理論當作人工智能發(fā)展的前提。如果這里的智能理論還試圖涵蓋包括人類智能在內(nèi)的“各種形式的智能”,則這種理論很可能超出了人類智能可理解的范圍。
所以,盡管自監(jiān)督學習是值得探索的一個重要方向,它也只是探索“智力的本質(zhì)”漫漫長途中的一個階段。人類和很多動物具有自監(jiān)督學習能力,并不是自監(jiān)督學習多神奇,而是因為他(它)們擁有一顆可以自監(jiān)督學習的大腦,這才是智力的本質(zhì)所在。
機器要進行自監(jiān)督學習,也要有自己的大腦,至少要有深度神經(jīng)網(wǎng)絡那樣的可塑載體,否則自監(jiān)督學習無從發(fā)生。相比之下,強化學習的要求簡單得多,一個對溫度敏感的有機大分子就能進行強化學習,這正是生命和智能出現(xiàn)的原因。所以,強化學習才是更基本的學習方法。
當然,從零開始強化學習,確實簡單粗暴、浪費巨大,這也是強化學習思想提出百年并沒取得太大進展的重要原因。
強化學習近十年來突然加速,是因為有了深度神經(jīng)網(wǎng)絡作為訓練的結構基礎,因而在圍棋、《星際爭霸》等游戲中超越人類。不過,人類輸?shù)貌⒉恍母是樵?,抱怨的主要理由是機器消耗的能源遠高于人類大腦。
我認為這種抱怨是片面的,人類棋手大腦的功耗確實只有數(shù)十瓦,但訓練一個人類棋手要花費十多年時間。更重要的是,人類棋手學圍棋時是帶著大腦這個先天基礎的,這顆大腦是億萬年進化來的,消耗了巨大的太陽能,這都應該記到能耗的總賬中。這樣比較,到底是機器棋手還是人類棋手能耗更大呢?
從節(jié)省能源角度看,機器智能確實不應該從頭再進化一次,而是應該以進化訓練好的生物神經(jīng)網(wǎng)絡為基礎,這就是純粹的連接主義:構造一個逼近生物神經(jīng)網(wǎng)絡的人工神經(jīng)網(wǎng)絡。
1950年,圖靈的開辟性論文《計算機與智能》中就表達了這個觀點:
“真正的智能機器必須具有學習能力,制造這種機器的方法是:先制造一個模擬童年大腦的機器,再教育訓練它?!?/p>
這也是類腦智能或神經(jīng)形態(tài)計算的基本出發(fā)點。相關科研實踐開始于20世紀80年代,基本理念就是構造逼近生物神經(jīng)網(wǎng)絡的神經(jīng)形態(tài)光電系統(tǒng),再通過訓練與交互,實現(xiàn)更強的人工智能乃至強人工智能。
除了改進訓練對象的先天結構,訓練不可或缺的另一個要素是環(huán)境。環(huán)境才是智能的真正來源,不同環(huán)境孕育不同智能。
人們往往把今天人工智能系統(tǒng)的成功歸結為三個要素:大數(shù)據(jù)+大算力+強算法,其中數(shù)據(jù)是根本,另外兩個要素主要影響效率。
訓練更強智能,需要更大數(shù)據(jù),這是智能發(fā)展的基本規(guī)律。有人提出“小數(shù)據(jù)”方法和小樣本學習,標榜要顛覆大數(shù)據(jù)方法,給出的典型理由是人類和動物能夠舉一反三,不需要大數(shù)據(jù)。
這種觀點貌似有道理,其實言過其實,因為他們忘記或者故意隱瞞了實現(xiàn)舉一反三的主體是大腦,而大腦本身是“進化大數(shù)據(jù)”訓練的結果。
所謂小數(shù)據(jù)方法,是以大數(shù)據(jù)“預訓練”為前提的。僅靠小數(shù)據(jù)不可能訓練出復雜智能,道理很簡單——小數(shù)據(jù)沒有蘊含足夠的可能性和復雜性,所謂的強大智能又從何而來呢?
但即便是大數(shù)據(jù),也不能完整有效地表達環(huán)境,數(shù)字孿生能更全面地刻畫物理環(huán)境,更好地保留環(huán)境自有的時空關系,因此也能夠哺育出更強的人工智能。物理世界的模型化本來就是科學最核心的任務,以前從中發(fā)現(xiàn)規(guī)律的是人類,未來這個發(fā)現(xiàn)主體將擴展到機器。
三、未來路徑
行文至此,我們已經(jīng)從人工智能發(fā)展史中小心翼翼地挑出三根靠得住的基本支柱:一是神經(jīng)網(wǎng)絡,二是強化學習,三是環(huán)境模型。
在這三根支柱中,楊立昆最突出的貢獻是對神經(jīng)網(wǎng)絡的貢獻,特別是卷積神經(jīng)網(wǎng)絡。至于想到用卷積神經(jīng)網(wǎng)絡,是因為借鑒了生物神經(jīng)感知系統(tǒng),這就是卷積神經(jīng)網(wǎng)絡在圖像識別和語音識別等領域大獲成功的主要原因——深度神經(jīng)網(wǎng)絡已經(jīng)借鑒了生物神經(jīng)網(wǎng)絡的部分結構。
總而言之,人工智能經(jīng)典學派有三個:符號主義、連接主義和行為主義。符號描述和邏輯推理不是智能的基礎,而是一種表現(xiàn),讀寫都不會的文盲就擁有的“低級”智能才更基礎。因此,連接主義和行為主義雖然困難重重,但有著更強的生命力,從中發(fā)展出的深度學習和強化學習兩套方法,成為當今支撐人工智能的兩大主要方法。
展望未來,人工智能的發(fā)展途徑有三條。
一是繼續(xù)推進“大數(shù)據(jù)+大算力+強算法”的信息技術方法,收集盡可能多的數(shù)據(jù),采用深度學習、注意力模型等算法,將大數(shù)據(jù)中蘊藏的規(guī)律轉(zhuǎn)換為人工神經(jīng)網(wǎng)絡的參數(shù),這實際上是凝練了大數(shù)據(jù)精華的“隱式知識庫”,可以為各類文本、圖像等信息處理應用提供共性智能模型。
人工智能路線之一
二是推進“結構仿腦、功能類腦、性能超腦”的類腦途徑,把大自然億萬年進化訓練出的生物神經(jīng)網(wǎng)絡作為新一代人工神經(jīng)網(wǎng)絡的藍本,構造逼近生物神經(jīng)網(wǎng)絡的神經(jīng)形態(tài)芯片和系統(tǒng),站在人類智能肩膀上發(fā)展機器智能。
人工智能路線之二
第三條技術路線的核心是建立自然環(huán)境的物理模型,通過強化學習訓練自主智能模型。比如,構造地球物理模型,訓練出的人工智能系統(tǒng)能夠適應地球環(huán)境,與人類共處共融;構造高精度物理模型(例如基于量子力學模型構造出粒子、原子、分子和材料模型),可以訓練出能夠從事物理學和材料學研究的人工智能;構造出宇宙及其他星球的物理模型,可以訓練出的人工智能則有望走出地球,適應宇宙中更復雜的環(huán)境。
人工智能路線之三
人類智能是地球環(huán)境培育出的最美麗的花朵,我們在為自己驕傲的同時,也要警惕人類中心主義。地球不是宇宙的中心,人類智能也沒有類似的獨特地位,把人類智能視為人工智能的造物主,曾經(jīng)禁錮了人工智能的發(fā)展。沉迷于尋求通用智能理論,將是阻礙人工智能發(fā)展的最大障礙。
破除人類中心主義的傲慢和對通用智能理論的迷思,構建更好的人工神經(jīng)網(wǎng)絡(包括逼近生物神經(jīng)網(wǎng)絡),堅持和發(fā)展強化學習基本思想,不斷提高環(huán)境模型的精度和廣度,人工智能將穩(wěn)步前行,前景無限。