十年前,谷歌開始布局無人駕駛汽車項目,將昂貴的光學(xué)雷達及高清地圖技術(shù)作為其戰(zhàn)略發(fā)展目標。時至今日,這兩項技術(shù)仍然是谷歌無人駕駛項目的重要支柱。
基于光學(xué)雷達和相機所獲取的數(shù)據(jù),我們可以通過算法在地圖上定位無人汽車,但是這個方法還未能很好地滿足實際要求。無人駕駛汽車要實現(xiàn)在復(fù)雜環(huán)境或不斷變化的街道中駕駛,需要有很好的感知及決策能力,而這本身就具有不確定性。
現(xiàn)在,我們主要依靠人工智能技術(shù)——深度學(xué)習(xí)來解決這個問題。與以往不同的是,我們不再使用預(yù)設(shè)算法,而是讓系統(tǒng)通過實例學(xué)習(xí),自主學(xué)會如何對一個輸入做出正確的響應(yīng)??梢哉f,對于大部分感知任務(wù)以及一些低級的控制問題,深度學(xué)習(xí)是目前最有效的解決方法。
無人駕駛汽車需要通過感知系統(tǒng)去辨識正在運動的物體(汽車,行人)及固定不動的物體(路燈柱、路的邊緣)。它可以通過三種方式檢測動態(tài)對象,包括相機、激光掃描儀和雷達。在這三種方式中,相機是最便宜的,但在過去,將圖像轉(zhuǎn)化為檢測對象很困難,所以這也是使用率最低的方式。而通過深度學(xué)習(xí),我們發(fā)現(xiàn)無人駕駛汽車理解和使用這些圖像的能力顯著提高。
更讓人興奮的是,我們發(fā)現(xiàn)“多任務(wù)深度學(xué)習(xí)”使得無人駕駛技術(shù)取得更進一步進展。多任務(wù)深度學(xué)習(xí)是指同時訓(xùn)練系統(tǒng)去識別車道標志線、汽車以及行人,其訓(xùn)練結(jié)果優(yōu)于這三個子系統(tǒng)獨立執(zhí)行,這是因為在單一網(wǎng)絡(luò)中,信息可以被共享。
無人駕駛技術(shù)不是完全依賴于預(yù)先設(shè)定的地圖,而是僅將地圖作為其中一個數(shù)據(jù)流,并結(jié)合傳感器獲取的數(shù)據(jù)幫助系統(tǒng)進行決策。比如,神經(jīng)網(wǎng)絡(luò)系統(tǒng)通過地圖信息預(yù)先獲取人行橫道的位置,進而對檢測準備通過的行人,這比僅僅依靠圖像數(shù)據(jù)要準確得多。
在過去,由于自動駕駛汽車駕駛不平穩(wěn),導(dǎo)致許多人乘坐自動駕駛汽車時會產(chǎn)生暈車的感覺?,F(xiàn)在,深度學(xué)習(xí)可以幫助我們緩解這個讓人頭疼的問題,讓自動駕駛汽車學(xué)會人類的駕駛方式及技巧,會讓乘客感覺更加自然。
現(xiàn)在,深度學(xué)習(xí)只是剛開始在無人駕駛技術(shù)領(lǐng)域中嶄露頭角。但正如它對圖片搜索和語音識別的突破性貢獻一樣,深度學(xué)習(xí)可能會改變無人駕駛技術(shù)的未來。
更多資訊請關(guān)注汽車制造頻道