你可能每天都在使用計(jì)算機(jī)視覺系統(tǒng),甚至感受不到它的存在。你有沒有使用過Snapchat上提供的最新濾鏡?這就是計(jì)算機(jī)視覺的產(chǎn)物。你有沒有使用iPhone上的人臉解鎖功能?這也是計(jì)算機(jī)視覺的體現(xiàn)。你有沒有使用手機(jī)將自己的工資轉(zhuǎn)到指定的銀行卡當(dāng)中,并直接從銀行賬戶內(nèi)提取現(xiàn)金?沒錯(cuò),這還是計(jì)算機(jī)視覺的應(yīng)用。
我們所知的計(jì)算機(jī)視覺技術(shù)正處于發(fā)展的臨界點(diǎn)。由于行業(yè)范圍內(nèi)的開發(fā)工作以及深度學(xué)習(xí)算法與圖形處理器的快速進(jìn)步,我們正迎來一系列十年前難以想象的成果。
這項(xiàng)技術(shù)的一部分成果早在幾年之前就已經(jīng)存在,但過去一年的幾項(xiàng)重大發(fā)展令計(jì)算機(jī)視覺達(dá)到了新的高度。更強(qiáng)大的傳感器、大量標(biāo)記圖像、易于使用的深度學(xué)習(xí)軟件再加上不斷改進(jìn)的處理器,共同將此前只能由少數(shù)幾家巨頭級(jí)科技企業(yè)掌握的計(jì)算機(jī)視覺交付給普羅大眾。
亞馬遜公司發(fā)布的Rekognition服務(wù)將計(jì)算機(jī)視覺功能推廣至每一位開發(fā)人員手中。微軟為其OneDrive以及SharePoint提供新的AI服務(wù)。谷歌照片也借此讓我們的回憶變得可供搜索。
看起來,未來似乎就在當(dāng)下。
充滿無限可能的世界
在2018年,我們看到一系列雄心勃勃的計(jì)算機(jī)視覺項(xiàng)目先后涌現(xiàn),這意味著該項(xiàng)技術(shù)的應(yīng)用效果終于趕上了開發(fā)人員長(zhǎng)久以來的期望。這同時(shí)也意味著開發(fā)定制化計(jì)算機(jī)視覺應(yīng)用將很快變得成本低廉、極具可行性。
舉例來說,ModiFace允許用戶利用智能手機(jī)進(jìn)行化妝。Topology公司則讓用戶能夠通過手機(jī)試戴各款眼鏡。MTailor使用類似的技術(shù)為您定制牛仔褲與襯衫。除了時(shí)尚行業(yè)之外,PotteryBarin允許用戶查看新家具擺在家中的樣子,Hover則允許用戶將家居照片轉(zhuǎn)換為尺寸準(zhǔn)確的3D模型。
這些項(xiàng)目雖然不像自動(dòng)駕駛汽車或者無人雜貨店那么復(fù)雜,但同樣預(yù)示著現(xiàn)有計(jì)算機(jī)視覺產(chǎn)品有望在未來幾年中得到大規(guī)模普及:一旦小型企業(yè)有能力開發(fā)出針對(duì)大眾群體的計(jì)算機(jī)視覺產(chǎn)品,此項(xiàng)技術(shù)則將快速滲透至我們生活中的幾乎每個(gè)角落。
計(jì)算機(jī)視覺為何值得關(guān)注?
計(jì)算機(jī)視覺與其它人工智能技術(shù)有所不同。首先,對(duì)于大多數(shù)組織而言,計(jì)算機(jī)視覺是一項(xiàng)全新的功能,而非像預(yù)測(cè)分析那樣只是對(duì)原有解決方案的一種漸進(jìn)式改善。
此外,計(jì)算機(jī)視覺還能夠以無障礙方式改善人類的感知能力。當(dāng)這些算法從圖像當(dāng)中推斷出信息時(shí),其并不像其它人工智能方案那樣是在對(duì)本質(zhì)上充滿不確定性的未來做出預(yù)測(cè);相反,它們只是在判斷關(guān)于圖像或圖像集中當(dāng)前內(nèi)容的分類真相。這意味著計(jì)算機(jī)視覺將隨著時(shí)間推移而變得愈發(fā)準(zhǔn)確,直到其達(dá)到甚至超越人類的圖像識(shí)別能力。
最后,計(jì)算機(jī)視覺能夠以遠(yuǎn)超其它AI工具的速度收集訓(xùn)練數(shù)據(jù)。大數(shù)據(jù)集的主要成本體現(xiàn)在訓(xùn)練數(shù)據(jù)的收集層面,但計(jì)算機(jī)視覺只需要由人類對(duì)圖片及視頻內(nèi)容進(jìn)行準(zhǔn)確標(biāo)記——這項(xiàng)工作的難度明顯很低。正因?yàn)槿绱耍陙碛?jì)算機(jī)視覺技術(shù)的采用率才得到迅猛提升。
2019年之后的計(jì)算機(jī)視覺前景
雖然我們已經(jīng)開始在消費(fèi)級(jí)產(chǎn)品當(dāng)中看到計(jì)算機(jī)視覺技術(shù),但其中大部分方案將繼續(xù)面向特定行業(yè)中的特定用途。舉例來說,CCCInformationServices正在幫助汽車保險(xiǎn)公司利用熱圖識(shí)別車輛損壞情況——該熱圖能夠高亮顯示出損壞程度最高的位置。
這類計(jì)算機(jī)視覺產(chǎn)品可能不夠驚艷,但最重要的是這些新的應(yīng)用方式意味著開發(fā)人員能夠更輕松地判斷信息是有效還是無效——如此一來,我們才能一步步邁向智慧城市這類規(guī)模極為龐大的項(xiàng)目。
亞馬遜、微軟以及谷歌在2018年展示的最新突破性進(jìn)展也成為推動(dòng)計(jì)算機(jī)視覺迎來發(fā)展轉(zhuǎn)折點(diǎn)的催化劑。產(chǎn)品設(shè)計(jì)師與人工智能工程師已經(jīng)開始研究利用計(jì)算機(jī)視覺與增強(qiáng)現(xiàn)實(shí)技術(shù)建立新型解決方案。硬件制造商正在改進(jìn)組件性能并提高成本效益,從而確保該項(xiàng)技術(shù)在實(shí)際表現(xiàn)與使用門檻方面皆有所改善。
在不久的未來,計(jì)算機(jī)視覺領(lǐng)域最重要的創(chuàng)新成果應(yīng)該體現(xiàn)在訓(xùn)練數(shù)據(jù)層面。目前,人類仍需要以手動(dòng)方式標(biāo)記圖像內(nèi)容以訓(xùn)練計(jì)算機(jī)視覺AI。(大家可能填寫過網(wǎng)頁(yè)表單,其中要求您從網(wǎng)格當(dāng)中選擇一些圖像來指示像店面或者汽車這類常見的對(duì)象。在執(zhí)行這些操作時(shí),您實(shí)際上已經(jīng)在為計(jì)算機(jī)視覺項(xiàng)目創(chuàng)建標(biāo)記數(shù)據(jù)。)
不過隨著技術(shù)的進(jìn)步,人工智能將最終實(shí)現(xiàn)自我訓(xùn)練,這將進(jìn)一步簡(jiǎn)化流程并加快模型的改進(jìn)速度。
計(jì)算機(jī)視覺市場(chǎng)規(guī)模的增長(zhǎng)速度幾乎與能力提升保持同步:預(yù)計(jì)到2025年,市場(chǎng)總量將達(dá)到262億美元,即年均復(fù)合增長(zhǎng)率超過30%。人工智能代表著未來,而計(jì)算機(jī)視覺則是人工智能最為有力的表現(xiàn)形式。很快,計(jì)算機(jī)視覺應(yīng)用將隨處可見——以至于大家甚至不會(huì)注意到它的存在。
聲明:本文為轉(zhuǎn)載類文章,如涉及版權(quán)問題,請(qǐng)及時(shí)聯(lián)系我們刪除(QQ:2737591964),不便之處,敬請(qǐng)諒解!