【“AI 2.0時代”前瞻:機器智能與人機融合】人工智能正在變得越來越“聰明”,也越來越貼近人類。
在圖像大數(shù)據(jù)識別方面,人工智能已經(jīng)可以在海量圖像中精準(zhǔn)進(jìn)行人臉識別;在人機交互方面,人工智能開始加入情感元素,甚至機器人小冰已經(jīng)學(xué)會了寫詩;閱片機器人能夠基于大量數(shù)據(jù),進(jìn)行特殊疾病的輔助診斷;通過聲音合成,人工智能也可以模仿許多名人的嗓音,達(dá)到“以假亂真”的效果。
同時,人工智能已經(jīng)不再囿于線上虛擬世界,它也正在落地物理世界,成為真正物理世界的人工智能。通過高速視覺反饋技術(shù),機器人可以快速感知高速行動的物體方向,并進(jìn)行迅速躲避,通過未知動態(tài)系統(tǒng)和多傳感控制系統(tǒng),機器人甚至可以學(xué)會精準(zhǔn)地將籃球投入運動的球框內(nèi)。
“人工智能與機器人的高度結(jié)合,有望發(fā)展出能夠改變生命本身的技術(shù),使人類與機器進(jìn)一步融合,從而進(jìn)入‘人類2.0時代’?!痹诮张e辦的2018機器人與人工智能大會上,德國漢堡科學(xué)院院士、德國漢堡大學(xué)教授張建偉表示。
同時,他指出,未來人工智能技術(shù)本身也將從當(dāng)前基于單模態(tài)實現(xiàn)向基于多模態(tài)交互的轉(zhuǎn)變,進(jìn)入強人工智能時期。不過,要想真正實現(xiàn)與人腦類似的強人工智能,“可能至少還需要一個世紀(jì)的時間”。
機器智能
走出虛擬世界,走向物理世界——智能機器人的誕生,令人工智能技術(shù)有了真正實物的載體。
“當(dāng)前,新一輪科技革命和產(chǎn)業(yè)變革正在迸發(fā),大數(shù)據(jù)的形成、理論算法的革新、計算能力的提升以及智能機器人與人工智能產(chǎn)業(yè)的發(fā)展進(jìn)入新階段。”中國電子信息產(chǎn)業(yè)發(fā)展研究院黨委書記、副院長宋顯珠指出,“機器人與人工智能成為經(jīng)濟發(fā)展的新引擎?!?/p>
與之伴生的是機器智能(MachineIntelligence,即MI)的概念。德勤在《2017德勤技術(shù)趨勢》中首提MI的概念,指出機器智能的幾個主要分支包括:機器學(xué)習(xí)(ML)、深度學(xué)習(xí)(DL)、認(rèn)知分析、機器人過程自動化(RPA)和Bot。根據(jù)德勤預(yù)測,到2019年,全球商業(yè)在機器智能(MI)的支出將達(dá)到313億美元。
事實上,在全球?qū)χ圃鞓I(yè)提高重視的背景下,機器智能正被賦予了新的期許。去年9月,德國啟動智能平臺“學(xué)習(xí)系統(tǒng)”,擬將其作為工業(yè)4.0的發(fā)展新階段;12月,日本政府在《2017財年制造業(yè)白皮書》中強調(diào),應(yīng)將“互聯(lián)工業(yè)”納入超智能社會“社會5.0”議程,在實現(xiàn)超智能社會5.0的過程中重點關(guān)注利用智能機器人打造協(xié)同的數(shù)字化社會;今年3月,美國戰(zhàn)略和國際研究中心(CSIS)發(fā)布的《美國機器智能國家戰(zhàn)略》中,建議白宮方面應(yīng)任命專職人員協(xié)調(diào)和推進(jìn)機器智能相關(guān)戰(zhàn)略優(yōu)先實施,注重機器智能與人工智能發(fā)展齊頭并進(jìn)。
“人工智能的應(yīng)用創(chuàng)新面臨著由軟向硬的過渡?!惫ば挪抠惖现菐煅芯繂T王哲表示,“人工智能在軟的消費端模式創(chuàng)新已經(jīng)是遍地開花,但如何在硬的制造流程、產(chǎn)品、模式創(chuàng)新方面發(fā)力,是大家苦苦尋找的切入點?!?/p>
值得注意的是,作為我國國民支柱、亦是機器“重地”的制造業(yè),其轉(zhuǎn)型升級正有賴于與人工智能的深度融合?!拔覀兲岢龅墓秸J(rèn)為,機器智能=制造業(yè)+人工智能?!蓖跽苤赋?。
其中,關(guān)鍵的生產(chǎn)設(shè)備智能化是實現(xiàn)智能制造的前提條件和關(guān)鍵難點,也是機器智能發(fā)揮作用的關(guān)鍵領(lǐng)域。從生產(chǎn)流程而言,機器智能應(yīng)用在企業(yè)、生產(chǎn)線、車間、工廠的生產(chǎn)過程中,能夠?qū)崿F(xiàn)加工質(zhì)量的升級、加工工業(yè)的優(yōu)化、生產(chǎn)的智能調(diào)度和管理,推動企業(yè)生產(chǎn)能力的技術(shù)改造和智能升級。
此外,在具體產(chǎn)品方面,機器智能的核心是在終端產(chǎn)品中植入復(fù)雜程度不等的計算機系統(tǒng),即“嵌入式系統(tǒng)”,這不僅將催生智能制造中最重要、最具有代表性的技術(shù),而且會形成龐大的上下游產(chǎn)業(yè)鏈。
不過,張建偉指出,人工智能在機器中的應(yīng)用,不僅需要多源傳感器收集真實世界的鮮活數(shù)據(jù),并進(jìn)行感知和學(xué)習(xí),還需要進(jìn)一步使用決策驅(qū)動執(zhí)行機構(gòu)改變物理世界,從而引領(lǐng)機器人產(chǎn)業(yè)革命。
人機融合
人工智能不僅在走進(jìn)機器,還在走近人類,從而實現(xiàn)人機融合。
狹義層面的人機融合,是指人類將自己的神經(jīng)系統(tǒng)與計算機等機械相連接,以達(dá)到彌補人類感官、運動缺陷的效果,甚至還可能實現(xiàn)將人類意識與電腦AI融合的結(jié)果。
這在科幻電影中毫不新鮮:電影《星球大戰(zhàn)》中,盧克·天行者被砍斷手臂后接上了機械假肢,《攻殼機動隊》中人類意識與計算機程序徹底融合……這些便是人機融合未來的發(fā)展路線圖。
在當(dāng)下,已有了人機融合的雛形產(chǎn)品。近日,日本科學(xué)家發(fā)明了一種由肌肉纖維與機器骨骼融合的機械手指,可以完成90°彎曲的動作;在2017年柏林國際消費電子展(IFA)上,全球主要助聽設(shè)備制造商之一的丹麥瑞聲達(dá)公司展示了一款智能助聽器,與手機或平板電腦相連接后,該助聽器可以將導(dǎo)航信息、音樂、體育新聞甚至是外語翻譯等通過助聽器傳輸給佩戴者。
“人工智能與機器人的高度結(jié)合,有望發(fā)展出能夠改變生命本身的技術(shù),使人類與機器進(jìn)一步融合,進(jìn)而加強人類(特別是殘疾人和老人)的機能,提升人類生活質(zhì)量,提高學(xué)習(xí)者效率和增強學(xué)習(xí)動機,實現(xiàn)人機跨載體的協(xié)作學(xué)習(xí)?!睆埥▊ケ硎尽?/p>
不過,廣義的人機融合還包含了人機協(xié)作,人與機器之間不再是主仆關(guān)系,或替代關(guān)系,而是伙伴關(guān)系。人同時操控多個機器人協(xié)同工作,可以提高效率、增加靈活性;人與機器人協(xié)調(diào)互動,不僅將提高機器人的加工精度和加工速度,還能增強機器人的自我學(xué)習(xí)功能。
資料顯示,當(dāng)前機器人主要有工業(yè)機器人、服務(wù)機器人和特種機器人三大類。其中工業(yè)機器人主要應(yīng)用于3C裝配制造、物流倉儲搬運以及農(nóng)副產(chǎn)品制造等領(lǐng)域,服務(wù)機器人則在機器人助理、聊天和陪護(hù)等領(lǐng)域擁有市場空間,特種機器人的主要應(yīng)用市場是智能汽車、無人機、醫(yī)療手術(shù)和金融交易決策等專業(yè)領(lǐng)域。
然而在中國工程院院士王天然看來,相當(dāng)多的勞動密集型的工作,機器人未必能夠勝任。他舉例稱,富士康公司曾希望用100萬臺機器人代替人工,但最終發(fā)現(xiàn)很多工作機器人代替不了?!按送?,包括風(fēng)靡全球的‘再制造’產(chǎn)業(yè),也都是‘手工作坊’——把發(fā)動機拆下來、洗凈油污、維修翻新,并沒有現(xiàn)成的規(guī)律可循?!?/p>
因此,機器人發(fā)展的下一個階段中,人機共融的模式將成為主流?!拔磥淼淖詣踊圃?,不是機器換人、工廠無人、機器造人,而是機器助人、工廠要人、智能學(xué)人。”德國菲尼克斯電氣(中國)公司副總裁杜品圣表示。
智能升級
無論是機器智能還是人機融合,人工智能技術(shù)都是其中的一個關(guān)鍵要素。因此,AI自身的能力升級也備受關(guān)注。
張建偉介紹,現(xiàn)在的AI主要基于單模態(tài)實現(xiàn),如只針對圖像信息或語音信息進(jìn)行基于大數(shù)據(jù)的人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),屬于弱人工智能。所謂模態(tài)(Modality),是德國生物學(xué)家赫爾姆霍茨提出的生物學(xué)概念,即生物憑借感知感官與經(jīng)驗來接受信息的通道,如人類擁有視覺模態(tài)、聽覺模態(tài)等。
“未來的人工智能技術(shù)將基于多模態(tài)交互,能夠認(rèn)知整合包括文本、圖像、聲音等在內(nèi)的各種信息,從而讓人機交互變得更自然、更精確、更穩(wěn)定?!睆埥▊ケ硎?,要實現(xiàn)AI的多模態(tài)交互,需要進(jìn)行跨模態(tài)研究,包括機器記憶、預(yù)測與數(shù)據(jù)校準(zhǔn)、知識抽取、推理、歸納、表達(dá)和自主學(xué)習(xí)等。
21世紀(jì)經(jīng)濟報道記者了解到,當(dāng)前AI感知模態(tài)主要有三種:語音交互(包括語音指令控制、語義理解、多輪對話、NLP、語音精準(zhǔn)識別等領(lǐng)域)、機器視覺(包括自然物體識別、人臉識別、肢體動作識別等)和傳感器智能(包括AI對熱量、紅外捕捉信號、空間信號的閱讀與理解)。前沿的多模態(tài)感知研究當(dāng)中,還包括機器嗅覺、機器觸覺和情緒理解等內(nèi)容。
值得注意的是,近來雙模態(tài)交互甚至多模態(tài)混合交互的解決方案正在從實驗室走出來。例如,許多研究機構(gòu)或企業(yè)正在嘗試使用機器視覺讀取說話人的唇語和動作,從而判斷每個聲音指令的來源。在一些新的智能空調(diào)解決方案中,已開始出現(xiàn)空調(diào)在語音交互的基礎(chǔ)上,通過機器視覺判斷用戶位置,提供智能送冷,并結(jié)合傳感器判斷屋內(nèi)溫度和濕度進(jìn)行自行調(diào)控。
不過,目前的多模態(tài)交互協(xié)同主要還是依靠將不同傳感源輸入設(shè)備處理中心,啟動相關(guān)程序來開啟服務(wù),但這與AI模型本身理解多模態(tài)信號相去甚遠(yuǎn),“真正實現(xiàn)與人腦一樣的強人工智能至少還需要一個世紀(jì)的時間?!睆埥▊ケ硎?。