美國艾倫AI研究院(AI2)宣布發(fā)布其嵌入式人工智能框架AI2-THOR的3.0版本,該框架在其測試框架中添加了主動(dòng)對象操縱技術(shù)。
ManipulaTHOR是此類虛擬代理中的第一款,它具有高度鉸接的機(jī)械臂,該機(jī)械臂配備了三個(gè)肢體長度相等的關(guān)節(jié),并且完全由旋轉(zhuǎn)關(guān)節(jié)組成,從而為操縱對象帶來了更人性化的方法。
AI2-THOR是第一個(gè)在超過100個(gè)視覺豐富,具有物理功能的房間中研究對象操縱問題的測試框架。通過支持對操縱模型中通用功能的訓(xùn)練和評估,與當(dāng)前的實(shí)際訓(xùn)練方法相比,ManipulaTHOR可以在更復(fù)雜的環(huán)境中進(jìn)行更快的訓(xùn)練,同時(shí)也更加安全和更具成本效益。
一個(gè)機(jī)器人能夠操縱廚房,打開冰箱并取出一罐蘇打水。這是機(jī)器人技術(shù)中最大的但經(jīng)常被忽視的挑戰(zhàn)之一,而AI2-THOR是第一個(gè)為將對象移動(dòng)到虛擬房間中不同位置,實(shí)現(xiàn)可重復(fù)性和測量進(jìn)度的任務(wù)而設(shè)計(jì)基準(zhǔn)的工具。
經(jīng)過五年的艱苦努力,我們現(xiàn)在可以開始訓(xùn)練機(jī)器人來像我們一樣感知和導(dǎo)航世界,從而使現(xiàn)實(shí)使用模型比以往任何時(shí)候都更容易實(shí)現(xiàn)。
盡管已經(jīng)成為機(jī)器人技術(shù)領(lǐng)域的一個(gè)成熟研究領(lǐng)域,但是對象操縱的視覺推理方面一直是研究人員面臨的最大障礙之一。實(shí)際上,人們早就知道機(jī)器人要努力正確地感知,導(dǎo)航,行動(dòng)并與世界上其他人交流。AI2-THOR通過復(fù)雜的模擬測試環(huán)境解決了這個(gè)問題,研究人員可以使用該環(huán)境來訓(xùn)練機(jī)器人進(jìn)行現(xiàn)實(shí)世界中的最終活動(dòng)。
隨著AI2-THOR體現(xiàn)的AI的開創(chuàng)性,為了共同的利益,景觀發(fā)生了變化。AI2-THOR使研究人員能夠有效地設(shè)計(jì)解決方案,以解決對象操縱問題以及與機(jī)器人測試相關(guān)的其他傳統(tǒng)問題。
與在實(shí)際的機(jī)器人上進(jìn)行實(shí)驗(yàn)相比,AI2-THOR的速度和安全性高得令人難以置信。多年來,AI2-THOR已使人們能夠研究許多不同的任務(wù),例如導(dǎo)航、指令遵循、多智能體協(xié)作、執(zhí)行家務(wù)、推理是否可以打開對象。AI2-THOR的這種發(fā)展使研究人員和科學(xué)家能夠擴(kuò)展當(dāng)前實(shí)現(xiàn)的AI的極限。
除3.0版本外,該團(tuán)隊(duì)還將在今年的計(jì)算機(jī)視覺和模式識別會(huì)議(CVPR)上與RoboTHOR Challenge 2021以及Embeded AI Workshop一起舉辦。AI2的挑戰(zhàn)包括RoboTHOR對象導(dǎo)航;ALFRED(指令跟隨機(jī)器人)。