AGI將高速地處理信息且高度智能,不斷自我改進(jìn)的系統(tǒng)將急劇提升機(jī)器智能程度。但是AGI的未來難以預(yù)測,沒人知道這一切是好是壞。
2010年奇點峰會,DeepMind創(chuàng)始人DemisHassabis在會上發(fā)表了關(guān)于AGI的演講,演講題目是:建立AGI的系統(tǒng)神經(jīng)學(xué)方法。
AGI指通用人工智能,它是一種假設(shè)的計算機(jī)程序,可以和人類一樣執(zhí)行智能任務(wù),甚至有希望超越人類。AGI將能夠完成離散的任務(wù),比如識別照片或翻譯。此外,它將會加減運算、下棋、說法語,還能理解物理論文、撰寫小說、設(shè)計投資策略、與陌生人談話。它將能夠監(jiān)測核反應(yīng)、管理電網(wǎng)和交通流量,它可以輕易地做任何事情。相比之下,目前最先進(jìn)的AI在AGI面前看起來就簡單得像個便攜式計算器。
上述任務(wù)目前只能由人類完成。但是人類智力受到腦容量所限,更受人類渺小脆弱的身體限制。既然AGI在計算機(jī)上運行,它就不會受到這些機(jī)體條件限制,其智能水平只受處理器數(shù)量的影響。AGI可能會先從監(jiān)測核反應(yīng)開始。但很快,它在一秒內(nèi)消化的物理論文數(shù)量比一個人在千年內(nèi)消化的還要多,并可以據(jù)此發(fā)現(xiàn)新能源。人類智慧,再加上計算機(jī)的速度和可擴(kuò)展性,將解決目前看來無解的問題。Hassabis預(yù)計AGI將掌握各種學(xué)科,包括癌癥研究、氣候變化、能源、基因組學(xué)、宏觀經(jīng)濟(jì)、金融系統(tǒng)等等。
AGI將高速地處理信息且高度智能,不斷自我改進(jìn)的系統(tǒng)將急劇提升機(jī)器智能程度。但是AGI的未來難以預(yù)測,沒人知道這一切是好是壞。
Hassabis解釋說,到目前為止,科學(xué)家們一直從兩個途徑發(fā)展AGI。第一個途徑是符號AI。研究人員試圖描述編寫一套完整的規(guī)則,使之能像人類一樣思考。這種方法在上世紀(jì)八九十年代很流行,但沒有達(dá)到預(yù)期的結(jié)果。Hassabis認(rèn)為,人類大腦神經(jīng)結(jié)構(gòu)太過微妙,編程模仿是做不到的。第二個途徑是以數(shù)字形式復(fù)制大腦的生物網(wǎng)絡(luò)。這聽起來似乎可行,畢竟大腦是人類智力的中心。但操作起來并不現(xiàn)實,因為這么做就好比繪制宇宙中每一顆恒星的地圖。最根本的問題在于,這種途徑是在錯位研究大腦功能。打個比方,這就像試圖通過打開計算機(jī)并檢查晶體管的交互來理解MicrosoftExcel是如何工作的。
Hassabis提出了中間立場:AGI應(yīng)該從大腦處理信息的廣泛方法中汲取靈感,而不是在特定情況下應(yīng)用生物系統(tǒng)或特定規(guī)則。換句話說,它應(yīng)該專注于理解大腦的軟件運作,而不是大腦的硬件構(gòu)成。功能性磁共振成像等新技術(shù)使人們能夠在大腦活動的同時觀察大腦內(nèi)部,因此理解“大腦的軟件運作”漸漸成為可能。最新研究表明,大腦通過在睡眠中重演經(jīng)驗來學(xué)習(xí),從而得出一般原則。AI研究者應(yīng)該模仿這種系統(tǒng)。
當(dāng)年Hassabis參加奇點峰會最重要的目的是募資,DeepMind最終獲得200萬英鎊投資,其中著名風(fēng)險投資人彼得·泰爾投資了140萬英鎊。谷歌在2014年1月以6億美元收購該公司時,Thiel和其他早期投資者的投資回報率高達(dá)5000%。
對許多創(chuàng)始人來說,這已經(jīng)算是一個完美的結(jié)局。但對Hassabis來說,被谷歌收購只是他追求AGI過程的一個步驟而已。2013年,他花費大量時間進(jìn)行協(xié)議條款談判,目的在于保持DeepMind的獨立性。它可以獲得被谷歌收購的好處,比如獲得現(xiàn)金流和計算能力,但是創(chuàng)始人仍然保有對公司的控制權(quán)。
Hassabis認(rèn)為DeepMind具備多種優(yōu)勢:擁有創(chuàng)企的動力、頂尖大學(xué)的優(yōu)異人才、大公司的財力支持。可謂萬事俱備,因此AGI的時代會加速到來,從而為人類造福。
天才游戲少年
DemisHassabis1976年出生于倫敦,他4歲開始下國際象棋,13歲時成為了世界上同年齡段中位列第二的棋手。8歲在老式電腦上自學(xué)編程。1992年提前兩年完成高中課程。他在BullfrogProductions找到一份電子游戲編程的工作,編寫的虛擬游戲ThemePark大賣1500萬張拷貝。
十幾歲的時候,Hassabis同時參加國際象棋、拼字游戲、撲克和西洋雙陸棋的比賽。1995年,在劍橋大學(xué)學(xué)習(xí)計算機(jī)科學(xué)時,又參加了學(xué)生圍棋錦標(biāo)賽且成績出色。下棋激發(fā)了Hassabis對人工智能的興趣。當(dāng)他下棋時也在思考,計算機(jī)是否也可以像人類一樣通過經(jīng)驗積累不斷學(xué)習(xí)。游戲提供了脫離現(xiàn)實的完美學(xué)習(xí)環(huán)境。游戲世界純粹又包容,玩游戲不會受到干擾而且可以迅速掌握。
先搞定智能,其它問題就能迎刃而解
1997年5月,IBM超級計算機(jī)DeepBlue擊敗了國際象棋世界冠軍GarryKasparov。這是計算機(jī)首次擊敗一位大師級棋手。這場比賽受到廣泛關(guān)注,也引起了人們對計算機(jī)不斷增長的力量和潛在威脅的擔(dān)憂。當(dāng)時Hassabis產(chǎn)生了一個想法,他要把戰(zhàn)略游戲和AI結(jié)合起來,有一天,他會建立一個計算機(jī)程序,打敗最高段位的人類圍棋手。
Hassabis有條不紊地規(guī)劃職業(yè)生涯。1998年,他創(chuàng)辦了自己的游戲工作室Elixir,專注開發(fā)一款復(fù)雜的模擬政治游戲Republic:TheRevolution。還在學(xué)校時,Hassabis就有這樣的想法:通過超級計算機(jī)來模擬復(fù)雜的世界動態(tài),以解決最棘手的社會問題。當(dāng)時,他試著在游戲中實踐自己的想法。不過現(xiàn)實很骨感,Elixir最終發(fā)布了精簡版的游戲但是反響平平。其它游戲也沒有成功。2005年4月,Hassabis關(guān)閉了Elixir。有人認(rèn)為Hassabis創(chuàng)立Elixir只是為了獲得管理經(jīng)驗?,F(xiàn)在,在正式踏上AGI之路以前,他只缺少一個關(guān)鍵的知識領(lǐng)域——了解人類的大腦。
2005年,Hassabis在倫敦大學(xué)學(xué)院開始攻讀神經(jīng)科學(xué)博士學(xué)位。他發(fā)表的關(guān)于記憶和想象力的研究很有影響力。一篇被引用上千次的論文顯示,患有健忘癥的人也很難想象新的體驗,這表明記憶和創(chuàng)造大腦圖像之間存在聯(lián)系。Hassabis所作的研究都是朝著AGI邁進(jìn)。他大部分研究都回歸一個問題:人腦是如何獲得并保留概念和知識的?
2010年11月15日,Hassabis正式成立DeepMind。從那時起,公司的宗旨就一直沒有變過:先搞定智能,其它問題就能迎刃而解。也就是說,把大腦如何完成任務(wù)的理解轉(zhuǎn)化為計算機(jī)軟件,軟件可以使用相同的方法進(jìn)行自我學(xué)習(xí)。
Hassabis并沒有假裝科學(xué)已經(jīng)完全理解了人類的思想。AGI的藍(lán)圖不能簡單地從數(shù)百項神經(jīng)科學(xué)研究中得出。我們對大腦的功能仍然知之甚少。2018年,Hassabis自己的博士研究結(jié)果甚至受到了澳大利亞研究團(tuán)隊的質(zhì)疑。所以DeepMind的起步工作還是很艱難。
Suleyman和ShaneLegg加入了公司聯(lián)合創(chuàng)始人的行列。公司位于倫敦,許多新員工來自歐洲,有效避開了和谷歌、Facebook等硅谷巨頭爭奪人才。也許DeepMind成功秘訣之一就在于留住了最優(yōu)秀的員工。
公司花大力氣發(fā)展的一種機(jī)器學(xué)習(xí)技術(shù)——強(qiáng)化學(xué)習(xí),源于Hassabis所擅長了兩個領(lǐng)域:游戲和神經(jīng)科學(xué)。建立這樣一個程序是為了收集有關(guān)其環(huán)境的信息,然后通過重復(fù)經(jīng)驗來從中學(xué)習(xí),就像Hassabis所說的“睡眠期間大腦活動”一樣。
在此之前,強(qiáng)化學(xué)習(xí)在計算機(jī)領(lǐng)域還是一片空白。程序顯示了一個虛擬環(huán)境,除了游戲規(guī)則,它什么也不知道。程序包含至少一個稱為神經(jīng)網(wǎng)絡(luò)的組件。由計算結(jié)構(gòu)層組成,可篩選信息,目的是識別特定特征或策略。每一層都在不同的抽象層次上檢查環(huán)境。起初,這些網(wǎng)絡(luò)的成功率很低。當(dāng)他們嘗試不同的策略時,變得越來越老練,當(dāng)成功時,也會得到獎勵。程序不會再次范同樣的錯誤。AI神奇的地方就在于它重復(fù)任務(wù)的速度。
DeepMind的AI項目在2016年獲得重大勝利,當(dāng)年,AlphaGo在首爾舉行的五局三勝比賽中擊敗圍棋世界冠軍,震驚世人。2.8億人見證了AlphaGo的勝利,有專家曾預(yù)測人機(jī)對戰(zhàn)機(jī)器取勝還需要十年時間。次年,升級版AlphaGo擊敗了中國圍棋冠軍。
人類智慧將被人工智能超越嗎?
就像1997年的DeepBlue一樣,AlphaGo改變了人們對人類成就的看法。人類冠軍無疑擁有地球上最聰明的頭腦,可是他們已經(jīng)被AI超越。近20年后,Hassabis實現(xiàn)了自己當(dāng)年的野心,他說這場比賽讓他熱淚盈眶。
當(dāng)年DeepBlue殺伐決斷,通過快速計算贏得了勝利,但是AlphaGo的風(fēng)格看起來卻很有藝術(shù)氣質(zhì),幾乎是人類的風(fēng)格。它的優(yōu)雅、復(fù)雜以及卓越的計算能力,似乎表明,在治療疾病和管理城市等領(lǐng)域,DeepMind將比競爭對手走得更遠(yuǎn)。
DeepMind控制權(quán)之爭
Hassabis一直說,DeepMind將使世界變得更好。但AGI存在不確定性。如果它真的出現(xiàn),我們不知道它是善是惡,也不知道它是否會服從于人類控制。即便它聽從人類控制,那這個人類舵手又會是誰呢?
從一開始,Hassabis就試圖保護(hù)DeepMind的獨立性。他一直堅持讓DeepMind留在倫敦。Hassabis不愿交出自己一手帶大的公司。因此DeepMind制定了一項協(xié)議,阻止谷歌單方面控制該公司的知識產(chǎn)權(quán)。據(jù)知情人士透露,在收購前一年,雙方簽署了《道德與安全審查協(xié)議》。該協(xié)議將DeepMind的核心AGI技術(shù)的控制權(quán)交給了一個名為EthicsBoard的委員會。EthicsBoard為DeepMind提供了堅實的法律支持,以保持對其最有價值、也可能是最危險的技術(shù)的控制。小組成員的名字尚未公布,但據(jù)消息人士透露,DeepMind的三位創(chuàng)始人都是EthicsBoard成員。
此外DeepMind在市場公關(guān)方面表現(xiàn)極好。AlphaGo就是典型的例子。自谷歌被收購以來,DeepMind多次創(chuàng)造了舉世矚目的奇跡。比如,一個軟件可以在眼睛掃描中發(fā)現(xiàn)黃斑病變。另一個程序使用與AlphaGo類似的架構(gòu)從無到有地學(xué)會了下棋,僅僅花費九個小時。2018年12月,一個名為AlphaFold的程序被證明可以從復(fù)合物列表中預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),其準(zhǔn)確率高于同行競爭對手,這有助于治療帕金森病和阿爾茨海默癥等疾病。
谷歌數(shù)據(jù)中心預(yù)計包含250萬臺服務(wù)器,DeepMind開發(fā)了一套算法,以優(yōu)化谷歌數(shù)據(jù)中心冷卻方案,DeepMind深以為傲,因為谷歌因此降低了40%的能源成本。谷歌母公司Alphabet為這類服務(wù)付給DeepMind豐厚的報酬。2017年,DeepMind向Alphabet收取了5400萬英鎊。但與DeepMind的日常管理費用相比,這一數(shù)字顯得微不足道。那一年僅在DeepMind員工身上就花了2億英鎊。總體而言,公司在2017年支出2.82億英鎊。
谷歌收購DeepMind五年后,控制權(quán)之爭不可避免??紤]到Hassabis對事業(yè)的執(zhí)著,他不太可能離開公司。他對金錢感興趣只是因為錢能幫助他完成事業(yè)追求。到目前為止,谷歌對DeepMind的干預(yù)還不大。但最近發(fā)生的一件事卻引發(fā)了對公司未來獨立性的擔(dān)憂。
2016年2月,DeepMind成立了新醫(yī)療保健部門DeepMindHealth,由公司聯(lián)合創(chuàng)始人之一的MustafaSuleyman領(lǐng)導(dǎo)。公司希望創(chuàng)建Streams項目,當(dāng)病人的健康狀況惡化時,可以向醫(yī)生發(fā)出警告。DeepMind將獲得基于績效的費用。由于這項工作需要獲得有關(guān)病人的敏感信息,Suleyman建立了一個獨立的審查小組(IRP)。
2018年11月8日,谷歌宣布成立自己的醫(yī)療保健部門GoogleHealth。五天后,公司宣布將把DeepMindHealth并入母公司相關(guān)部門。Suleyman曾在2016年寫道:“在任何階段,患者數(shù)據(jù)都不會與谷歌賬戶、產(chǎn)品或服務(wù)相關(guān)聯(lián)?!钡某兄Z似乎已經(jīng)落空。不過DeepMind還是說:“在這個階段,我們的合同都沒有轉(zhuǎn)到谷歌,只有得到合作伙伴的同意,才會轉(zhuǎn)去谷歌?!焙喜⒓づ薉eepMindHealth的員工。據(jù)消息人士說,一旦合并完成,就會有更多員工計劃離職。據(jù)多名知情人士透露,有員工于2017年12月辭職,原因是擔(dān)心合并后該獨立審查小組更多的是為了裝門面,而不會對病人隱私數(shù)據(jù)使用情況進(jìn)行真正的監(jiān)督。
這一事件表明,DeepMind的非核心業(yè)務(wù)容易受到谷歌的左右。DeepMind在一份聲明中對此次合并給出了正面評價。但是我們不禁要問,谷歌是否會將同樣的邏輯應(yīng)用于DeepMind在AGI方面的工作。
強(qiáng)化學(xué)習(xí)
總體上來說DeepMind進(jìn)步明顯。它的軟件可以模擬甚至超越人類學(xué)習(xí)執(zhí)行任務(wù)。比如打磚塊游戲。沒有人類指導(dǎo),DeepMind的程序不僅學(xué)會了玩這個游戲,而且還學(xué)會了如何把球打進(jìn)磚塊后面的空間,利用球回彈來打更多的磚塊。Hassabis說,這證明了強(qiáng)化學(xué)習(xí)的力量和DeepMind計算程序的非凡能力。
這個游戲演示令人印象深刻,但有個問題。如果虛擬球拍移動得更高一些,程序就會失敗。AI項目所掌握的技能非常有限,即使對環(huán)境的微小變化也無法做出反應(yīng),除非接受數(shù)千輪強(qiáng)化學(xué)習(xí)?,F(xiàn)實世界的變化太多了。對于智能診斷來說,沒有兩個身體器官是完全相同的。對于智能機(jī)械,沒有兩個引擎可以用相同的方式調(diào)整。因此,將虛擬空間中完善的程序投放到現(xiàn)實世界困難重重。
另外一個問題是,虛擬環(huán)境中的成功取決于獎勵機(jī)制:一個允許軟件衡量其進(jìn)程的信號。程序了解到物體從墻上回彈會加分。AlphaGo很多編程工作都是在構(gòu)建與復(fù)雜游戲兼容的獎勵函數(shù)。不幸的是,現(xiàn)實世界并不提供這種簡單的獎勵。政治因素使問題更加復(fù)雜化。要協(xié)調(diào)氣候健康的獎勵信號(單位體積二氧化碳粒子數(shù))與石油公司的獎勵信號(股價),牽涉到許多動機(jī)矛盾的各方。獎勵信號往往非常微弱。而人腦在執(zhí)行任務(wù)的過程中不會去想有沒有獎勵的問題。
DeepMind通過大量計算機(jī)電力找到了解決方法。公司最近專注于策略電腦游戲星際爭霸II,游戲早期所做的決定對后來會產(chǎn)生影響,這更接近于現(xiàn)實世界任務(wù)所特有的那種復(fù)雜而延遲的反饋。今年1月,DeepMind軟件擊敗了一些頂級人類玩家,給人留下了深刻印象。它的程序也已經(jīng)開始學(xué)習(xí)經(jīng)由人類反饋的獎勵功能。不過,把人類指令置于計算循環(huán)中,比起純粹的計算機(jī)處理,其計算規(guī)模和速度都會受到影響。
公司研究人員匿名表示,他們也對DeepMind能否通過這些方法達(dá)到AGI表示懷疑,專注于在模擬環(huán)境中實現(xiàn)高性能,這使得獎勵信號問題很難解決。然而,這種方法又是DeepMind的核心。
Hassabis的人生一直在和游戲打交道。就像公司的軟件一樣,Hassabis只能從以往的經(jīng)驗中學(xué)習(xí)。在發(fā)明了一些有用的醫(yī)療技術(shù),并超越了世界上最偉大的棋類游戲玩家之后,對AGI的追求最終還是可能會失敗。公司取得的成績斐然,卻不是Hassabis最終想要的。他仍然可以開創(chuàng)AGI的時代,就在谷歌的眼皮底下,但卻超出了它的控制范圍。如果這樣做,Hassabis將贏得最艱難的比賽。
聲明:本文為轉(zhuǎn)載類文章,如涉及版權(quán)問題,請及時聯(lián)系我們刪除(QQ: 2737591964),不便之處,敬請諒解!