本文轉(zhuǎn)自"機(jī)器之心",作者:杜雪;經(jīng)億歐編輯,供業(yè)內(nèi)人士閱讀。
兩會將人工智能寫進(jìn)政府報告,人工智能在國內(nèi)的發(fā)展達(dá)到了前所未有的熱度。無論是BAT這樣的巨頭,還是眾多創(chuàng)業(yè)公司,都試圖在人工智能上找到能落地的應(yīng)用場景。周劍認(rèn)為,在人工智能這件事上,優(yōu)必選有天然的優(yōu)勢。因為從某種意義上來說,機(jī)器人是人工智能落地最好的平臺。
尋找人形機(jī)器人商業(yè)化突破口
機(jī)器人的最終形態(tài)應(yīng)該是能適應(yīng)人類生活環(huán)境的雙足人形機(jī)器人,比如它能像人類一樣,在多種環(huán)境中行走,比如上下樓梯,這其中的核心問題就是驅(qū)動,只有解決這個問題,機(jī)器人才能真正意義上進(jìn)入家庭環(huán)境。周劍說。目前國際上名氣較大的人形機(jī)器人產(chǎn)品并不多,比如軟銀收購的AldebaranRobotics公司研發(fā)的人形機(jī)器人NAO、以及本田的ASIMO機(jī)器人和波士頓動力的輪式、腿式機(jī)器人等。
在周劍看來,目前市面上很多機(jī)器人產(chǎn)品都是過渡型產(chǎn)物,比如現(xiàn)在的一些音箱產(chǎn)品。如果實現(xiàn)商業(yè)化,是沒有人愿意跟一個音箱對話的。因為智能家居最終無法滿足人類的情感需求,它代替不了類似于《太空旅客》真正的人形機(jī)器人。
然而,目前人形機(jī)器人在驅(qū)動,包括關(guān)節(jié)驅(qū)動、運(yùn)動技術(shù)、控制運(yùn)動算法上面,還沒有實現(xiàn)真正突破,尤其是可商業(yè)化的驅(qū)動技術(shù)。據(jù)周劍介紹,在驅(qū)動方面,波士頓動力用的是液壓技術(shù),本田的阿西莫(ASIMO)機(jī)器人用的是電機(jī)伺服的控制方式,這兩種技術(shù)都能實現(xiàn)不錯的驅(qū)動,但是問題在于成本太高,阿西莫(ASIMO)一臺機(jī)器人搭出來需要200多萬美金。
除了高昂的成本外,使用中繁瑣的技術(shù)方式也讓一些機(jī)器人很難真正走進(jìn)市場,比如ASIMO機(jī)器人的傳動中用了20多根皮帶,在使用過程中,每隔一段時間都需要重新打開機(jī)器人內(nèi)部來調(diào)整皮帶的松緊度。這種技術(shù)方式導(dǎo)致ASIMO很難實現(xiàn)商業(yè)化量產(chǎn),而且本田在這條技術(shù)道路上耕耘了幾十年,某種程度上有些積重難返,即便他們的核心算法和機(jī)器人軀干部分都搭建的很好。
因此,用高性價比的技術(shù)方式,讓人形機(jī)器人價格降下來,被一般家庭所接受,是優(yōu)必選的目標(biāo)。周劍說,優(yōu)必選一直在朝著一個能夠真正讓驅(qū)動關(guān)節(jié)模塊化、商業(yè)化的方向去努力,所以我們現(xiàn)在做的伺服舵機(jī),包括在腿部的一些舵機(jī),某種意義上就是在朝著商業(yè)化目標(biāo)努力。
人形機(jī)器人的市場才剛剛開始,優(yōu)必選需要做一些比較前沿性、引導(dǎo)性的工作。未來我們希望在某種意義上建立一套全球化的機(jī)器人標(biāo)準(zhǔn),比如人形機(jī)器人的標(biāo)準(zhǔn)是什么、規(guī)格是什么、它的曲軸運(yùn)動,包括人工智能的一些基本的需求。
不過,雖然輪式機(jī)器人不是人形機(jī)器人的最終形式,但周劍也坦言,目前技術(shù)平臺下面,輪式機(jī)器人還有一些優(yōu)勢,包括在2B的一些場所。因此,優(yōu)必選在今年年初的CES上推出了首款商用服務(wù)機(jī)器人Cruzr。Cruzr是首款提供企業(yè)級商用服務(wù)的機(jī)器人,可為客戶提供定制的人工智能商務(wù)服務(wù)。
全面布局人工智能戰(zhàn)略
優(yōu)必選的機(jī)器人研發(fā)從舵機(jī)開始,經(jīng)過近10年的研發(fā),舵機(jī)已經(jīng)成為優(yōu)必選的核心技術(shù),并由此開拓了多個產(chǎn)品線。在舵機(jī)這條技術(shù)產(chǎn)品線上,優(yōu)必選一直專注于核心零部件的供應(yīng),硬件開發(fā)逐漸成為優(yōu)必選的優(yōu)勢。
而機(jī)器人商業(yè)化所需要的語音識別、機(jī)器視覺以及算法平臺等軟件技術(shù)能力,則是優(yōu)必選明顯存在的劣勢。周劍也坦言,優(yōu)必選是硬件起家,舵機(jī)一直是其引以為豪的核心技術(shù),而軟件是最薄弱的地方,這也是優(yōu)必選決定大力布局人工智能的原因。
據(jù)周劍介紹,優(yōu)必選在北京、硅谷分別設(shè)有研發(fā)中心,研發(fā)方向側(cè)重在機(jī)器視覺、語音識別、語義理解、算法平臺等人工智能領(lǐng)域,博士背景的核心研發(fā)人員達(dá)到數(shù)十人,公司在人工智能方面投入的資金比重也大大提升,占總營收的45%。
除了大型的伺服舵機(jī)關(guān)鍵驅(qū)動技術(shù)外,算法平臺和人工智能,將成為優(yōu)必選最為重要的發(fā)展陣地。
周劍希望能夠自助搭建出一個類似于比波士頓動力更好的平臺的一個算法。在此之前,優(yōu)必選對谷歌、波士頓動力、本田等全球所有大型人形機(jī)器人公司的技術(shù)都進(jìn)行了長期研究。在周劍看來,與優(yōu)必選在驅(qū)動產(chǎn)品上下功夫不同,這些機(jī)構(gòu)不算純商業(yè)化的公司,也根本沒有打算很快推出商業(yè)化的產(chǎn)品。他接著補(bǔ)充道:我們現(xiàn)正在研發(fā)中的伺服舵機(jī),跟波士頓他們的完全不一樣。此外優(yōu)必選把能耗看的很重,在運(yùn)動算法上投入了很大力量。
在人工智能方面,優(yōu)必選主要力量放在機(jī)器視覺和數(shù)據(jù)上。周劍解釋稱:因為信息來源大部分還是來自機(jī)器視覺,另外由于機(jī)器視覺技術(shù)需要更大量的數(shù)據(jù),數(shù)據(jù)是其要推動的技術(shù)。比如光線的細(xì)微變化都能影響到機(jī)器對物體的判斷。這一點周劍印象頗深,他舉了一個例子,在家庭廚房場景中,炒菜時的油煙會導(dǎo)致機(jī)器人的視覺判斷模糊,針對這個問題就需要做霧化、去白、去油煙的技術(shù)。
事實上,優(yōu)必選去年年底就開始為人工智能布局招攬人才,前IEEE主席霍華德博士、清華大學(xué)趙明國教授、歐洲科學(xué)院院士陶大程博士,先后加入并分別擔(dān)任其教育CTO、人形機(jī)器人首席科學(xué)家。
去年科大訊飛入股優(yōu)必選,也給了后者在語音識別上得到了強(qiáng)有力的支撐,周劍稱,訊飛的技術(shù)能用的我們都會拿來用。
在視覺和語音之外,另一個無法回避的問題是語義理解。這是一個全球性難題,周劍說,單純的自然語言理解(NLU)解決不了所有的機(jī)器人問題,未來的識別理解是多模態(tài)的,是基于視覺、語音、語意的多模態(tài)的理解。包括識別人體的姿態(tài),人類的動作有很多,機(jī)器人會做很多動作,到底這個動作的目的、意義是什么?比如,當(dāng)兩人第一次見面時,舉手就意味著是握手打招呼,在離別的時候,舉手的含義就是道別,這些都需要機(jī)器人能夠準(zhǔn)確的識別。
但優(yōu)必選并不打算全面開展這些技術(shù)的自主研發(fā),周劍表示,不可能所有的東西都由優(yōu)必選自己來做,可以通過融資來收購、并購一些技術(shù)公司。據(jù)了解,優(yōu)必選已經(jīng)有了比較中意的合作對象,可能會對其進(jìn)行戰(zhàn)略投資、入股,甚至是更加深入的合作,與此同時,其新一輪融資也在進(jìn)行中。
更多資訊請關(guān)注機(jī)器視覺頻道