每個機器人的形態(tài)、大小、樣貌都不一樣,這需要根據(jù)具體的應(yīng)用場景進行分析和設(shè)計。但是無論是哪種形態(tài)的機器人,基本上都會嵌入視覺系統(tǒng),用于感知周圍的環(huán)境,然后通過反饋的信息規(guī)劃機器人的動作。
香港中文大學(xué)天石機器人研究所所長劉云輝教授自本科起就從事機器人研究,至今已經(jīng)有數(shù)十年的研發(fā)經(jīng)驗。在ACTLab和深圳灣聯(lián)合舉辦的“機器人控制系統(tǒng)和視覺的融合”活動中,劉云輝教授向慕名而來的創(chuàng)業(yè)者們分享了自己在機器人領(lǐng)域的所思所得。
我灣梳理了本次演講的重點和要點,帶領(lǐng)讀者了解機器視覺領(lǐng)域最前沿的研究課題。
三維視覺技術(shù)大有可為
實時三維視覺技術(shù)應(yīng)用廣泛,在機器控制、物件抓取和人機交互等技術(shù)領(lǐng)域,都不能脫離實時三維視覺技術(shù)。正因如此,該技術(shù)有著巨大的商業(yè)潛力。據(jù)報道,預(yù)計2020年,全球3D成像系統(tǒng)市場預(yù)計能達到536億人民幣,年度復(fù)合增長率39.4%,尤其是在體育醫(yī)學(xué)、矯形外科學(xué)、人體測量等醫(yī)學(xué)領(lǐng)域,對3D成像技術(shù)的需求更為強烈。
劉云輝教授研究實時三維視覺技術(shù)多年,他認為:“研究三維視覺技術(shù),歸根結(jié)底,就是要理解什么是視覺信息,然后將這些視覺信息在實際的場景中應(yīng)用起來?!彼邪l(fā)的基于結(jié)構(gòu)光的雙目視覺技術(shù)具有精度高、測量速度快、動態(tài)拍攝等特點,并且已經(jīng)應(yīng)用在商業(yè)化的3D成像系統(tǒng)中。
工廠叉車也要自動駕駛
目前,大型工廠的室內(nèi)物件搬運70%靠的是人工駕駛叉車進行操作,但從事重體力勞動工人的人工成本上升和人力資源的短缺,對很多行業(yè)造成重大影響,移動機械的自動化改造需求迫切。
經(jīng)研究發(fā)現(xiàn),室內(nèi)移動器械自動駕駛的挑戰(zhàn)主要有兩點:一是無GPS的定位和制圖,二是精確的運動控制。憑借多年的圖像傳感器研發(fā)經(jīng)驗,劉云輝教授將VisualSLAM算法和RGB-D傳感器集成到移動機器人的視覺導(dǎo)航模塊上,應(yīng)用于移動機械平臺,實現(xiàn)了低速且高精度的自動駕駛功能。
劉教授表示,目前為了保證安全性,移動器械的速度并沒有做得太快。不過,制造業(yè)、建筑業(yè)、采礦業(yè)、物流業(yè)等領(lǐng)域?qū)κ覂?nèi)移動器械自動駕駛有強烈的需求,所以,該項技術(shù)在未來會有很大的發(fā)展空間。
“軟”“硬”兩手抓
機器人或者機械臂所抓取的物件基本上都是剛體,很少能對變形體進行抓取。不過,在日常生活中,很多物件并不是棱角分明并且內(nèi)部結(jié)構(gòu)堅硬的剛體,而是以柔性體的形式存在,比如日常所穿的衣服、吃的食物、線材、柔性PCB以及人體組織。
劉云輝教授認為,在需要操作形變體的領(lǐng)域中,醫(yī)療健康對該技術(shù)的需求最強烈并且對操作的精準度也更高。劉教授結(jié)合自身的研發(fā)經(jīng)驗補充說:“醫(yī)療手術(shù)機器人的研發(fā)主要有三個挑戰(zhàn):首先是安全性,醫(yī)療手術(shù)中不能容許半點差錯,所以如何保證手術(shù)機器人的安全性,以及與操作醫(yī)師的有效配合是重中之重;保證安全性后,機器人如何在柔軟的體內(nèi)進行解剖和組織切除,機械結(jié)構(gòu)如何設(shè)計,視覺系統(tǒng)如何設(shè)計,就是研究人員面臨的第二大挑戰(zhàn);第三,如何讓不懂機器人技術(shù)的醫(yī)生快速上手操作,人機交互如何設(shè)計,則是第三個挑戰(zhàn)?!?/p>
為了應(yīng)對這三大挑戰(zhàn),劉教授針對性地提出了三個解決方案:首先,手術(shù)機器人可采用小尺寸的、彈性的、或者柔性的機械結(jié)構(gòu),在保證操作精度的同時防止人體組織被機械所傷;第二,在機器人內(nèi)部嵌入多種傳感器,比如IMU、聲音傳感器、體感設(shè)備、眼球跟蹤設(shè)備等,增強機器人的功能,并簡化操作方式;第三,通過在機器人中內(nèi)嵌攝像頭,以圖像引導(dǎo)的方式實時獲取手術(shù)反饋。
人形才是最適的人機交互方式
我們周圍的生活環(huán)境是以人類的行為方式為基準而建立的,人類可以相當(dāng)輕松地上樓梯、開門、適應(yīng)各種地形,所以說最好的機器人形態(tài)就是人形機器人。同理,人和人的溝通是我們最習(xí)慣的交互方式,所以最好的人機交互就是機器人以“人”的方式進行交互。
人類的語言以及表情能夠傳遞大量的情感信息,所以目前仿人形機器人的研究主要集中在機器人的語言以及表情模擬這兩個領(lǐng)域。但是,除了語言和表情,肢體動作也能夠傳遞人的情感信息。
劉云輝教授認為,相對于語言和表情,讓機器人模擬人的動作在技術(shù)上更容易實現(xiàn),通過用體感設(shè)備讓機器人模仿人類的肢體動作,學(xué)習(xí)人類的行為模式,增強機器人的智能,并最終實現(xiàn)自然的人機交互。
更多資訊請關(guān)注機器視覺頻道