想象這樣的情景:你躺在床上,忽然想關(guān)掉頭頂刺眼得令你無法直視的智能燈泡。于是你開始四處翻找手機(jī)、解鎖、打開控制APP、尋找這盞燈的選項(xiàng)、點(diǎn)擊按鈕——好了,總算關(guān)掉了。發(fā)現(xiàn)了沒?原本可能5秒走過去按個開關(guān)的事,硬生生的花去了你將近1分鐘的時間。
上面的情景,并不是個例。從目前智能硬件的發(fā)展?fàn)顩r來看,大部分智能設(shè)備仍只是“偽智能”設(shè)備,僅通過Wi-Fi通信模塊提供了基礎(chǔ)的聯(lián)網(wǎng)控制。在家庭設(shè)備的互聯(lián)領(lǐng)域,目前的重點(diǎn)都仍在設(shè)備及硬件連接上——然而,真正的智能化設(shè)備不僅僅是實(shí)現(xiàn)通信連接,更要在人與設(shè)備間的交互上不斷進(jìn)化。
語音=人機(jī)交互的未來?
回顧人機(jī)交互的發(fā)展歷程,實(shí)際上是工程師對機(jī)器不斷改造,以解放人的過程。最早期,鍵盤是唯一的輸入設(shè)備,與你為伴的只有枯燥的指令與冰冷的字符界面;后來有了圖形界面,才有了鼠標(biāo)。但是鼠標(biāo)和鍵盤都只是交互的介質(zhì),并不符合直覺。真正好的交互,應(yīng)該符合人的直覺,上手即可用。
裝備了觸摸屏的智能手機(jī),讓我們離這個目標(biāo)更近了一步。靈敏的指尖,代替了鍵盤/鼠標(biāo)這層中間介質(zhì),做到了所觸即所得,身體得以進(jìn)一步解放。然而,雖然在空間上,你的身體不再需要端坐在電腦前——但操控一部手機(jī),仍然需要手指和眼睛的全程參與——人機(jī)交互理應(yīng)有更好的未來。
語音交互,則為人機(jī)交互打開了新世界的大門。首先,感官占用更少了,手可以解放出來;其次,開口說話是我們先天具備的溝通技能,學(xué)習(xí)成本最??;最重要的是,聲波天然可以擺脫設(shè)備位置的束縛自由傳播,未來甚至可以做到device-free,在任何地方發(fā)出指令,都可以進(jìn)行交互。在信息輸入的速度上,語音直接說出指令也比觸控點(diǎn)選來的方便。
想象一下,你再也不用翻箱倒柜的找手機(jī),然后從一排排密密麻麻的APP中翻找目標(biāo)——你只需自然的說出來:“臥室的燈關(guān)了吧,太晃眼了”,它就會乖乖的熄滅掉,甚至下次再打開時,你會發(fā)現(xiàn)亮度變低不那么晃眼了。
人工智能幫助提升人機(jī)交互體驗(yàn)
要保證上面這種級別的語音交互,機(jī)器需要準(zhǔn)確提煉出的重要訊息有“臥室、燈、關(guān)、晃眼”,并最終組合為2個單獨(dú)的指令“臥室燈→關(guān)閉”“臥室燈→初始亮度75%這需要設(shè)備具備自然語言理解的能力(NaturalLanguageUnderstanding,NLU),以正確地理解用戶的語音指令。而談到NLU技術(shù),人工智能是無法避開的一個話題。
擊敗國際頂級棋手李世石的“AlphaGO”,可能最為人熟知的人工智能了。幫助它在圍棋上擊敗對手的技術(shù),和幫助機(jī)器理解人類語言的NLU,是基于同一種的、起源于上世紀(jì)50年代的技術(shù)——機(jī)器學(xué)習(xí)。作為人工智能的核心技術(shù)之一,機(jī)器學(xué)習(xí)的核心在于“學(xué)習(xí)”二字上。通過模擬人類的學(xué)習(xí)過程,機(jī)器學(xué)習(xí)用一些特定的算法指導(dǎo)計算機(jī)利用已知數(shù)據(jù)得出適當(dāng)?shù)哪P?,并利用此模型對新的情境給出判斷。這其中的關(guān)鍵,在于一種叫做“神經(jīng)網(wǎng)絡(luò)”的算法,它通過模仿人類神經(jīng)元工作方式,讓單一神經(jīng)元處理接收到的信號,并基于信號特性,給出相應(yīng)的反饋信息傳遞給關(guān)聯(lián)的其他神經(jīng)元,最終經(jīng)過多層神經(jīng)元的彼此篩選,得出針對信號的結(jié)論。
聽起很復(fù)雜的過程,實(shí)際上因?yàn)槟M了人腦處理信號的方式,可以通過有限次數(shù)的訓(xùn)練,讓程序自己學(xué)會對新信號的處理能力,即NLU(自然語言理解)。在神經(jīng)網(wǎng)絡(luò)算法,只要有足夠數(shù)量的語音數(shù)據(jù)來訓(xùn)練,機(jī)器也可以準(zhǔn)確的理解人類語言的意圖,甚至是“言外之意”——問完天氣的你隨口抱怨一句“最近外面好冷”,它或許會調(diào)皮的提醒你,要不要規(guī)劃一趟飛往熱帶的海島之旅。
取代“偽智能”,語音交互讓設(shè)備服務(wù)鏈接更緊密
NLU技術(shù)在美國市場的應(yīng)用最為成熟,各巨頭也紛紛推出其基于語音交互的智能設(shè)備,希望提前搶占市場。而這一市場,目前有著界限鮮明的兩派:一邊是以Apple、Microsoft為代表的語音輔助派,把自家的手機(jī)版助手直接移植到了AppleTV、XBOX設(shè)備上,語音僅作為輔助交互手段。而另一邊是則更為激進(jìn)的Google和Amazon,其推出的智能設(shè)備GoogleHome、AmazonEcho僅支持語音交互。技術(shù)方案各有不同,但四家巨頭在商業(yè)上的戰(zhàn)略野心驚人的相似:通過融入家庭生活,而成為家庭成員獲取服務(wù)的新入口。
如果把目光轉(zhuǎn)回國內(nèi),國內(nèi)有此野心的廠商目前并不在少數(shù),但市場反響平平。究其原因,智能音箱只是連接服務(wù)的一個可以實(shí)現(xiàn)語音交互的端口,最重要的是通過不斷疊加不同的服務(wù),并提升使用體驗(yàn),實(shí)現(xiàn)真正意義的智慧服務(wù)系統(tǒng)——設(shè)備+云服務(wù),這才是智慧家庭產(chǎn)業(yè)的重要發(fā)展方向。
在2015年底的第二次世界互聯(lián)網(wǎng)大會上,聯(lián)想集團(tuán)總裁楊元慶曾提出:“未來的用戶需要的是設(shè)備+云服務(wù)的完美結(jié)合體驗(yàn),為此我們就必須打造更加智能的連接”,并很快組建了SmartHome(聯(lián)想智慧家庭)部門。
有消息表明,聯(lián)想SmartHome的首個智能設(shè)備將于近期推出。其“設(shè)備+云服務(wù)”的概念將如何踐行?設(shè)備的人機(jī)交互會采用Apple還是Amazon模式?如何更好的讓NLU適應(yīng)中國人的習(xí)慣?一切答案,恐怕只能等產(chǎn)品浮出水面才能揭曉了,讓我們共同期待吧!
更多資訊請關(guān)注工業(yè)機(jī)器人頻道