作為世界上第二大的車企豐田不甘示弱,他們利用AI技術(shù)和機(jī)器學(xué)習(xí)系統(tǒng),使機(jī)器人能夠觀察和學(xué)習(xí)人類在家務(wù)活動(dòng)中的行為,并模仿人類做家務(wù)。這一項(xiàng)目不僅展示了生成式人工智能幫助機(jī)器人技術(shù)的進(jìn)步,同時(shí)也為未來智能家居和老年人生活提供了新的解決方案。
從公開的實(shí)驗(yàn)視頻上看,實(shí)驗(yàn)者以一個(gè)喜歡整理的人的角度,通過操控具有機(jī)械臂的遙控器,讓機(jī)器人學(xué)會(huì)了如何使用簸箕和刷子掃掉桌面上的豆子,機(jī)器人自身的傳感器讓機(jī)器人可以感知抓取的固體物品覺和物品的重量。通過示教后,可獨(dú)立自主完成這項(xiàng)家務(wù)活動(dòng)。
在這個(gè)機(jī)械臂上,豐田采用了一種稱為擴(kuò)散策略的機(jī)器學(xué)習(xí)系統(tǒng),這種系統(tǒng)類似于人工智能圖像生成器中使用的系統(tǒng),通過多種可能性和信息,迅速提出下一步正確的行動(dòng)。
據(jù)了解,該技術(shù)是與哥倫比亞大學(xué)教授Shuran Song領(lǐng)導(dǎo)的研究人員合作開發(fā)的,為機(jī)器人提供了更高效的學(xué)習(xí)方式。
這類的機(jī)器學(xué)習(xí)系統(tǒng)的運(yùn)用使得機(jī)器人能夠更靈活地吸收數(shù)據(jù),從而更好地適應(yīng)復(fù)雜多變的物理世界和人類環(huán)境,相較于傳統(tǒng)的預(yù)先編程例程,這種系統(tǒng)使機(jī)器人更適合處理需要適應(yīng)性、即興創(chuàng)作和靈活性的工作。
豐田正在嘗試將機(jī)器學(xué)習(xí)系統(tǒng)與支持ChatGPT及其競爭對(duì)手的語言模型結(jié)合起來,通過結(jié)合語言模型,機(jī)器人可以通過觀看視頻學(xué)習(xí)執(zhí)行任務(wù),將在線資源如YouTube轉(zhuǎn)變?yōu)閺?qiáng)大的機(jī)器人培訓(xùn)資源,這樣可以使機(jī)器人能夠通過觀看視頻學(xué)會(huì)更多的任務(wù),從而提高學(xué)習(xí)的效率。
這并不是第一臺(tái)通過YouTube學(xué)習(xí)技能的機(jī)器人,英國一研究團(tuán)隊(duì)曾推出過一款類似的機(jī)器人廚師,團(tuán)隊(duì)為這款機(jī)器人廚師植入了全新的學(xué)習(xí)算法,該算法基于人類廚師的視覺觀察,逐步將食譜添加到機(jī)器人的食譜中,通過計(jì)算這兩者的向量化之間的相似性,實(shí)時(shí)學(xué)習(xí)并添加新菜譜。
隨后的試驗(yàn)中,研究團(tuán)隊(duì)給機(jī)器人灌輸了八種簡單的沙拉食譜,并讓它觀看人類準(zhǔn)備沙拉的視頻,在觀看這些視頻后,機(jī)器人能夠識(shí)別所使用的配方并進(jìn)行復(fù)制。
機(jī)器人分析了視頻的每一幀,識(shí)別出各種物體,如刀或演示人員的手,這種能力使它能夠推斷接下來會(huì)發(fā)生什么,例如,如果演示者拿著一把刀和一根胡蘿卜,機(jī)器人就可以預(yù)測胡蘿卜即將被切碎。在機(jī)器人觀看了16個(gè)視頻后,該算法正確識(shí)別已知食譜成功率達(dá)到93%。
值得一提的是,研發(fā)該機(jī)器人的團(tuán)隊(duì),正是出自豐田2015年成立的劍橋機(jī)器人研究所。
現(xiàn)如今,在機(jī)器人研究中應(yīng)用語言模型似乎已經(jīng)成為了新的潮流,一些大型科技公司,如Google DeepMind,一直推動(dòng)著類似的研究。Google DeepMind 的一個(gè)團(tuán)隊(duì)發(fā)布了Auto-R軟件,該軟件利用大型語言模型幫助機(jī)器人確定實(shí)際且安全地完成的任務(wù),例如簡單的分類物品,拿起水杯等。
乘上生成式人工智能的快車,機(jī)器人通過學(xué)習(xí)而幫助人類分擔(dān)家務(wù)活動(dòng)已一步步實(shí)現(xiàn),這將會(huì)為我們的生活帶來更多的便利,同時(shí)也促進(jìn)了熱度爆棚的人形機(jī)器人等服務(wù)機(jī)器人的商業(yè)化進(jìn)程。未來也許真如馬斯克所說,每個(gè)家庭里會(huì)有幾個(gè)機(jī)器人為我們工作,這些更智能、更靈活的機(jī)器人或?qū)⒊蔀槲覀兩畹闹匾锇椤?/p>