3D成像-機(jī)器視覺(jué)核心技術(shù)
計(jì)算機(jī)視覺(jué)爆炸式發(fā)展的背后是3D成像領(lǐng)域的巨大發(fā)展。
AI/ML中最有用和研究最透徹的分支之一是機(jī)器視覺(jué)。機(jī)器視覺(jué),或者說(shuō)計(jì)算機(jī)分析和預(yù)測(cè)圖像內(nèi)容的能力,通常只取決于輸入的圖像的好壞。
這就是為什么工程師們一直孜孜不倦地從硬件和軟件的角度創(chuàng)造出新的、更好的三維成像技術(shù)手段的原因。
什么是3D成像?
在研究成像時(shí),工程師可以地從人眼捕獲和解釋圖像的方式中找到了靈感。
人類視覺(jué)系統(tǒng)的工作方式是,每只眼睛從不同的角度觀看世界,并通過(guò)稱為視差的過(guò)程將這些圖像合并為一個(gè)圖像。3D成像采用相同的方法,每次拍攝都使用兩個(gè)鏡頭,每個(gè)鏡頭拍攝的圖像彼此都不相同。
主動(dòng)與被動(dòng)3D成像
一般來(lái)說(shuō),3D成像技術(shù)可以分為主動(dòng)和被動(dòng)兩種。
主動(dòng)3D成像系統(tǒng)是使用人工照明以捕獲和記錄對(duì)象的數(shù)字表示的系統(tǒng)。這種人工照明提供了密集和準(zhǔn)確的圖像,甚至是無(wú)紋理的物體,否則很難獲得。
一個(gè)主動(dòng)三維成像系統(tǒng)使用不同的方法,包括飛行時(shí)間、三角測(cè)量和干涉測(cè)量。例如,飛行時(shí)間要求通過(guò)測(cè)量光到達(dá)目標(biāo)物體然后返回傳感器的時(shí)間,將3D數(shù)據(jù)編碼到每個(gè)像素中。激光雷達(dá)是一個(gè)典型的主動(dòng)三維成像。
另一方面,被動(dòng)方法是從僅使用環(huán)境照明的場(chǎng)景中恢復(fù)3D信息。他們傾向于利用聚焦和光場(chǎng)的深度。在基于快照的方法中,同時(shí)捕獲的兩個(gè)快照之間的差異用于計(jì)算到對(duì)象的距離,此過(guò)程稱為被動(dòng)立體成像。許多領(lǐng)域可以極大地受益于3D成像。
目前比較熱門的應(yīng)用就是自動(dòng)駕駛汽車。隨著3D成像技術(shù)的改進(jìn),自動(dòng)駕駛汽車的視覺(jué)系統(tǒng)將會(huì)更好,讓它們實(shí)時(shí)做出更準(zhǔn)確、更安全的決策。另外增強(qiáng)現(xiàn)實(shí)也是將受益于3D成像應(yīng)用。
3D成像是已成為科技領(lǐng)域熱門領(lǐng)域之一,隨著技術(shù)在電路層面的不斷完善,很多領(lǐng)域都可能將3D成像確立為一項(xiàng)司空見(jiàn)慣的技術(shù)。
文章轉(zhuǎn)載自新機(jī)器視覺(jué)微信公眾號(hào),如有問(wèn)題,請(qǐng)及時(shí)聯(lián)系刪除。