MIT識物機器人不用標記數(shù)據(jù)便可“秒懂”物體

時間:2018-09-29

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導語:MIT團隊打造“密集目標網(wǎng)絡(luò)”(DON)的機器人系統(tǒng),能夠讓抓取機器人真正“讀懂”目標,該系統(tǒng)將目標處理生成三維“視覺路線圖”的點集合,讓機器人真正在視覺上理解目標。利用這一系統(tǒng),科學家們不必再像過去的計算機視覺研究一樣,繁瑣地對大量數(shù)據(jù)集中的數(shù)據(jù)進行標記了。

【中國傳動網(wǎng) 技術(shù)前沿】 MIT團隊打造“密集目標網(wǎng)絡(luò)”(DON)的機器人系統(tǒng),能夠讓抓取機器人真正“讀懂”目標,該系統(tǒng)將目標處理生成三維“視覺路線圖”的點集合,讓機器人真正在視覺上理解目標。利用這一系統(tǒng),科學家們不必再像過去的計算機視覺研究一樣,繁瑣地對大量數(shù)據(jù)集中的數(shù)據(jù)進行標記了。

MIT識物機器人:“秒懂”物體,過目不忘,不用標記數(shù)據(jù)!

長期以來,人類一直以靈巧著稱,這種特點在很大程度上要歸功于我們的眼睛。不過現(xiàn)在,機器人也逐步迎頭趕上。經(jīng)過幾十年的發(fā)展,現(xiàn)在用于生產(chǎn)線等受控環(huán)境中的機器人已經(jīng)能夠一次又一次地拾起同一個目標了。

最近在計算機視覺方面的突破,讓機器人也能區(qū)分出不同的目標。不過即使這樣,機器人還是無法真正理解物體的形狀,因此在拾取目標后,幾乎無法再做什么別的事。

近日,麻省理工學院計算機科學與人工智能實驗室(CSAIL)的研究人員在一篇新論文中表示,他們已在這個領(lǐng)域取得了一項重要進展:他們打造的機器人系統(tǒng)可以識別出之前未見過的隨機目標,并能夠在視覺上“理解”這些目標,以完成更豐富的任務(wù)。

“密集對象網(wǎng)絡(luò)”:讓機器人讀懂抓取目標

該系統(tǒng)名為“密集對象網(wǎng)絡(luò)”(DON),該網(wǎng)絡(luò)將對象視為點的集合,當作“視覺路線圖”來使用。這種方法可以讓機器人更好地理解和抓取目標,最重要的是,機器人能夠在大量類似目標中挑出特定的目標。亞馬遜和沃爾瑪?shù)裙驹谄鋫}庫中使用的機器就具備類似的技能。

比如,有人可能會使用DON系統(tǒng)讓機器人抓住目標上的特定位置,比如鞋舌頭。之后,它就能夠看到之前從未見過的鞋子,并成功抓住鞋舌頭。

參與該研究的博士生LucasManuelli說道:“許多控制系統(tǒng)和識別方法都無法識別朝多個方向放置的目標的特定部分?!彼c該論文另一作者、博士生PeteFlorence和MIT教授RussTedrake一起撰寫了該論文?!氨热纾F(xiàn)有的算法就無法抓住馬克杯的杯柄,尤其是在馬克杯朝多個方向放置的情況下,比如直立或側(cè)放?!?/p>

該團隊認為,該技術(shù)不僅能用于工業(yè)制造,還能走入家庭的日常生活。比如,給系統(tǒng)展示一座整潔的房子的圖像,讓機器人在你工作時打掃房間,或向機器人展示菜肴的圖像,讓機器人在你度假時把你的餐桌上的盤子收拾好。

DON抓取算法:訓練無需標注數(shù)據(jù)集,省時省力

值得注意的一點是,沒有任何數(shù)據(jù)事先被人類標記過。這個系統(tǒng)是“自我監(jiān)督的”,因此不需要任何來自人類的數(shù)據(jù)標注。

機器人抓取目標的兩種常見方法是,創(chuàng)建特定任務(wù)的機器學習,創(chuàng)建通用的抓取算法。這兩種技術(shù)都存在障礙:基于特定任務(wù)的方法很難推廣到其他任務(wù),而通用的抓取算法不夠具體,無法顧及處理特定任務(wù)時的細微差別,比如將目標放到特定的位置上。

而DON系統(tǒng)基本上是在給定目標上創(chuàng)建一系列坐標,作為基于目標的一種“視覺路線圖”,使機器人更好地理解自己需要抓取哪些目標,目標在何處等。

該團隊訓練系統(tǒng)將對象視為構(gòu)成較大坐標系的一系列點。然后將不同的點映射到一起,顯示出對象的三維形狀,這種方式和使用多張照片拼接全景照片的方式有些類似。在訓練之后,如果指定目標上的一個點,機器人可以拍攝該物體的照片,并一系列的點進行識別和匹配,然后就可以指定點拾取目標。

這個系統(tǒng)與加州大學伯克利分校的DexNet系統(tǒng)有所不同,伯克利的系統(tǒng)可以抓取許多不同的目標,但不能滿足抓取特定目標的要求。就好比一個一歲半的嬰兒,他不明白你想要他玩哪個玩具,但仍然可以抓起很多不同的玩具,而一個四歲的孩子,就可以準確地回應(yīng)“去抓住那輛紅色小卡車的車尾”的要求。

在形狀對稱毛絨玩具上進行的一組測試中,由DON驅(qū)動的Kuka機器人手臂可以從一系列不同的目標位置抓住玩具的右耳。這表明系統(tǒng)具有在對稱物體上區(qū)分左右的能力。

在利用不同棒球帽進行測試時,DON可以選擇特定的目標帽子,盡管所有的帽子的設(shè)計都非常相似,機器人在之前從未在訓練數(shù)據(jù)中看到過帽子的照片。

未來,團隊希望將系統(tǒng)進行改進,讓其具備執(zhí)行特定任務(wù)的能力,同時能夠更深入地了解相應(yīng)的目標,例如學習如何抓住目標,并將其移動到最終位置等。

團隊將于下個月在瑞士蘇黎世舉行的機器人學習會議上發(fā)表這一成果。

中傳動網(wǎng)版權(quán)與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.surachana.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0