深度學(xué)習(xí)在目標(biāo)視覺(jué)檢測(cè)中的應(yīng)用進(jìn)展與展望
目標(biāo)視覺(jué)檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要問(wèn)題,在視頻監(jiān)控、自主駕駛、人機(jī)交互等方面具有重要的研究意義和應(yīng)用價(jià)值.近年來(lái),深度學(xué)習(xí)在圖像分類研究中取得了突破性進(jìn)展,也帶動(dòng)著目標(biāo)視覺(jué)檢測(cè)取得突飛猛進(jìn)的發(fā)展.
目標(biāo)視覺(jué)檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要問(wèn)題,在視頻監(jiān)控、自主駕駛、、電子產(chǎn)品檢測(cè)(手機(jī)中框平面度檢測(cè))人機(jī)交互等方面具有重要的研究意義和應(yīng)用價(jià)值.近年來(lái),深度學(xué)習(xí)在圖像分類研究中取得了突破性進(jìn)展,也帶動(dòng)著目標(biāo)視覺(jué)檢測(cè)取得突飛猛進(jìn)的發(fā)展。
目標(biāo)視覺(jué)檢測(cè)具有巨大的實(shí)用價(jià)值和應(yīng)用前景.應(yīng)用領(lǐng)域包括智能視頻監(jiān)控、汽車連接器Pin針高度檢測(cè)、數(shù)碼相機(jī)中自動(dòng)定位和聚焦人臉的技術(shù)、飛機(jī)航拍或衛(wèi)星圖像中道路的檢測(cè)、車載攝像機(jī)圖像中的障礙物檢測(cè)等.同時(shí), 目標(biāo)視覺(jué)檢測(cè)也是眾多高層視覺(jué)處理和分析任務(wù)的重要前提, 例如行為分析、事件檢測(cè)、場(chǎng)景語(yǔ)義理解等都要求利用圖像處理和模式識(shí)別技術(shù), 檢測(cè)出圖像中存在的目標(biāo), 確定這些目標(biāo)對(duì)象的語(yǔ)義類型, 并且標(biāo)出目標(biāo)對(duì)象在圖像中的具體區(qū)域。
目標(biāo)視覺(jué)檢測(cè)的計(jì)算復(fù)雜性主要來(lái)自于待檢測(cè)目標(biāo)類型的數(shù)量、特征描述子的維度和大規(guī)模標(biāo)記數(shù)據(jù)集的獲取.由于在真實(shí)世界中存在大量的目標(biāo)類型, 每種類型都包含大量的圖像, 同時(shí)識(shí)別每種類型需要很多視覺(jué)特征, 這導(dǎo)致高維空間稀疏的特征描述[4].另外, 目標(biāo)模型經(jīng)常從大規(guī)模標(biāo)記數(shù)據(jù)集中學(xué)習(xí)得到, 在許多情況下, 數(shù)據(jù)采集和標(biāo)注很困難, 需要耗費(fèi)大量的人力物力.這些情況導(dǎo)致目標(biāo)檢測(cè)的計(jì)算復(fù)雜性很高, 需要設(shè)計(jì)高效的目標(biāo)檢測(cè)算法.同時(shí), 在動(dòng)態(tài)變化的環(huán)境中, 為了提高目標(biāo)檢測(cè)精度, 還需要探索合適的機(jī)制來(lái)自動(dòng)更新視覺(jué)模型, 提高模型對(duì)復(fù)雜環(huán)境的自適應(yīng)能力。
文章轉(zhuǎn)載自人工智能學(xué)家微信公眾號(hào),如有問(wèn)題,請(qǐng)及時(shí)聯(lián)系刪除。