計(jì)算機(jī)視覺簡(jiǎn)史:為了讓機(jī)器學(xué)會(huì)“看”,人類到底有多努力

時(shí)間:2021-09-14

來源:中國(guó)傳動(dòng)網(wǎng)

導(dǎo)語:發(fā)展60多年來,機(jī)器視覺作為AI技術(shù)的急先鋒,經(jīng)歷了幾輪起落,終于迎來技術(shù)上的爆發(fā)。但隨著技術(shù)進(jìn)入深水區(qū),尋找合適的商業(yè)模式真正成為了機(jī)器視覺這門技術(shù)的最大難點(diǎn)。

  1999年上映的《黑客帝國(guó)》雖然不是人類關(guān)于人工智能的第一次影視化探索,卻可以說是最有影響力的一次。

  電影講述的是基努李維斯飾演的網(wǎng)絡(luò)黑客尼奧發(fā)現(xiàn)自己生活的世界被某種外部力量控制并通過調(diào)查發(fā)現(xiàn)自己活在人工智能的虛擬世界里,之后同一個(gè)反抗者組織奮起而抗?fàn)幍墓适隆?/p>

  在《黑客帝國(guó)》設(shè)定的真實(shí)世界中,他們的肉體早已被當(dāng)作被養(yǎng)殖的作物,為母體供應(yīng)能量,只有意識(shí)在母體Matrix中活動(dòng),誤以為自己還在過正常生活。

  2011年,英劇《黑鏡》第一季上線,之后連續(xù)推出四季,這是一部探討科技對(duì)人類生活改變的電影,其中也包含諸多人工智能對(duì)于人類生活的改變與顛覆故事。

    2016年,HBO發(fā)行的科幻類美劇《西部世界》上線,講述了由一座巨型高科技以西部世界為主題的成人樂園,提供機(jī)器人接待員給游客,讓他們實(shí)現(xiàn)殺戮與性欲的滿足;但后來隨著接待員有了自主意識(shí)和思維,他們開始懷疑這個(gè)世界的本質(zhì),進(jìn)而覺醒并反抗人類的故事。

    這些電影,講述的多是人工智能發(fā)展的高級(jí)階段,更是最近大家討論的“元宇宙”的形象化表現(xiàn)。

  拋開道德上的善惡對(duì)錯(cuò)不談,回到人工智能技術(shù)本身,在達(dá)成這些了不起的成就之前,在計(jì)算機(jī)能夠“思考”之前,最早需要開始學(xué)習(xí)的技能是“感知”,其中最重要部分之一就是學(xué)會(huì)“看”,這也幾乎是公認(rèn)的人工智能第一步。

  就在《黑鏡》上映的同一年——2011年,如今被稱為“AI四小龍”之一的曠視科技在三個(gè)天才少年的帶領(lǐng)下成立了,隨后四年間,商湯科技、依圖科技和云從科技業(yè)全部拔地而起,所選擇的賽道都是“人臉識(shí)別”,其實(shí)本質(zhì)就是讓計(jì)算機(jī)看圖。

  最近,在經(jīng)過多年的奮戰(zhàn)之后,基于搶占賽道或者搶占資金的想法,他們?nèi)缃窠K于走進(jìn)了資本市場(chǎng)的視野。除了依圖科技已經(jīng)撤回上市申請(qǐng)之外,其他三家都離上市僅一步之遙了。

  走進(jìn)了資本市場(chǎng).jpg


  這些年,被稱為“人臉識(shí)別”的計(jì)算機(jī)視覺都經(jīng)歷了什么?

  

起步階段:人類對(duì)教會(huì)機(jī)器“看”的執(zhí)念


  在我們講述計(jì)算機(jī)視覺之前,先要了解目前人工智能所處的階段,那就是“感知智能”,無論是AI四小龍的“人臉識(shí)別”還是科大訊飛的“語音識(shí)別”,都落在這一階段。

  在此之前,我們還只是用計(jì)算機(jī)來計(jì)算數(shù)據(jù)、運(yùn)行代碼,但這只是初級(jí)的“計(jì)算智能”階段?,F(xiàn)在計(jì)算機(jī)已經(jīng)學(xué)會(huì)了“感知”,不過距離計(jì)算機(jī)“能理解、會(huì)思考”的認(rèn)知智能階段,也就是最開始講的那些電影里能達(dá)到的最終水平,還差得很遠(yuǎn)。

  人工智能發(fā)展三個(gè)階段.jpg


  讓計(jì)算機(jī)學(xué)會(huì)“感知”,最重要的一步就是”看“了。

  眼睛,是人類用來觀察這個(gè)世界的最重要器官,也是唯一的視覺器官。在佛家所謂的六根——眼耳鼻舌身意中,眼睛也排在首位。

  用眼睛看,是人類與生俱來的能力,剛出生的嬰兒只需要幾天的時(shí)間就能學(xué)會(huì)模仿父母的表情,人們能從復(fù)雜結(jié)構(gòu)的圖片中找到關(guān)注重點(diǎn)、在昏暗的環(huán)境下認(rèn)出熟人。

  人類對(duì)眼睛的功能是有執(zhí)念的。

  為了將自己看到的東西保存下來,人類發(fā)明了照相機(jī)。最早的真正照相機(jī)來自1839年1月,當(dāng)時(shí)中國(guó)還在清朝的道光年間。攝影師達(dá)蓋爾在巴黎沙龍上展示了銀板照相法,將涂有碘化銀的銅片暴露在光線下,然后通過汞蒸汽和食鹽溶液來顯影,震驚了法國(guó)科學(xué)院,并于當(dāng)年推廣開來。

  

達(dá)蓋爾.jpg

  達(dá)蓋爾

  銀板照相法所使用的就是這種用木箱子裝的相機(jī)。

  

銀板照相機(jī).jpg

  銀板照相機(jī)

  自此人類終于學(xué)會(huì)長(zhǎng)時(shí)間保存眼睛看到的圖像了,之后又有了膠卷和即顯攝影。

  但似乎對(duì)于人類來說,光是記錄并不夠,我們還想讓機(jī)器自己去看,并且告訴我它們看到了什么。

  為了讓機(jī)器學(xué)會(huì)如何去“看”,就有了計(jì)算機(jī)視覺,當(dāng)然,它更為大家所熟知的名稱是“人臉識(shí)別”。

  最初的探討發(fā)生在1956年左右。在當(dāng)年的達(dá)特茅斯會(huì)議上,約翰麥卡錫、馬文閔斯基、克勞德香農(nóng)、艾倫紐厄爾和赫伯特西蒙等科學(xué)家聚在一起,討論著一個(gè)完全不食人間煙火的主題:用機(jī)器來模仿人類學(xué)習(xí)以及其他方面的智能。

  會(huì)議一共開了兩個(gè)月的時(shí)間,雖然大家沒有達(dá)成普遍的共識(shí),但是卻為會(huì)議討論的內(nèi)容起了一個(gè)名字:人工智能。因此,1956年也就成為了人工智能元年。

  1957年春天,美國(guó)國(guó)家標(biāo)準(zhǔn)局的科學(xué)家拉塞爾·基爾希為他的兒子瓦爾登拍了一張照,并將其掃描到了東部標(biāo)準(zhǔn)自動(dòng)計(jì)算機(jī)(SEAC)中。為了使圖片可以放進(jìn)SEAC有限的存儲(chǔ)空間中,他將圖片分割成176176的網(wǎng)格——共30976位二進(jìn)制,并進(jìn)行了多次掃描。這張邊長(zhǎng)5厘米的正方形圖片就是歷史上第一張數(shù)字圖像,從某種意義上來講它甚至是CT掃描、衛(wèi)星圖像和數(shù)碼攝影的鼻祖。

  1959年,神經(jīng)生理學(xué)家大衛(wèi)·休伯爾和托斯坦·維厄瑟爾通過貓的視覺實(shí)驗(yàn),首次發(fā)現(xiàn)了視覺初級(jí)皮層神經(jīng)元對(duì)于移動(dòng)邊緣刺激敏感,發(fā)現(xiàn)了視功能柱結(jié)構(gòu),為視覺神經(jīng)研究奠定了基礎(chǔ)——促成了計(jì)算機(jī)視覺技術(shù)40年后的突破性發(fā)展,奠定了深度學(xué)習(xí)的核心準(zhǔn)則。

  

大衛(wèi)休伯爾和托斯坦維厄瑟爾.jpg

  大衛(wèi)休伯爾和托斯坦維厄瑟爾

  到了60年代,勞倫斯羅伯茨在《三維固體的機(jī)器感知》描述了從二維圖片中推導(dǎo)三維信息的過程,成為計(jì)算機(jī)視覺的前導(dǎo)之一,開創(chuàng)了理解三維場(chǎng)景為目的的計(jì)算機(jī)視覺研究。這個(gè)研究給世界帶來了很大啟發(fā),并且對(duì)邊緣、線條、明暗等各種特征建立了各種數(shù)據(jù)結(jié)構(gòu)和推理規(guī)則。

  勞倫斯羅伯茨.jpg


  1969年秋天,貝爾實(shí)驗(yàn)室的兩位科學(xué)家韋拉德博伊爾和喬治史密斯正忙于電荷耦合器件(CCD)的研發(fā)。它是一種將光子轉(zhuǎn)化為電脈沖的器件,很快成為了高質(zhì)量數(shù)字圖像采集任務(wù)的新寵,逐漸應(yīng)用于工業(yè)相機(jī)傳感器,標(biāo)志著計(jì)算機(jī)視覺走上應(yīng)用舞臺(tái),投入到工業(yè)機(jī)器視覺中。

  70年代是人工智能發(fā)展的低潮期。

  80年代后計(jì)算機(jī)視覺成為一門獨(dú)立學(xué)科,并開始從實(shí)驗(yàn)室走向應(yīng)用。80年日本科學(xué)家福島邦彥建立了第一個(gè)神經(jīng)網(wǎng)絡(luò),82年大衛(wèi)馬爾發(fā)表了一篇非常有影響力的論文,介紹了處理視覺數(shù)據(jù)的算法框架,同年《Vision》這本書問世,標(biāo)志著計(jì)算機(jī)視覺正式成為了一門獨(dú)立學(xué)科。

  

《Vision》.jpg

  大發(fā)展:卷積神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)

  90年代計(jì)算機(jī)視覺的發(fā)展整體比較落寞,因?yàn)橛?xùn)練神經(jīng)網(wǎng)絡(luò)是一項(xiàng)資源非常密集、并且進(jìn)展極為緩慢的工作。

  一直到2005年之后,才又迎來快速發(fā)展階段。

  

人工智能發(fā)展.jpg

  2006年左右,杰弗里·希爾頓(Geoffrey Hilton)和他的學(xué)生首次提出了深度置信網(wǎng)絡(luò)(DBN)的概念。他給多層神經(jīng)網(wǎng)絡(luò)相關(guān)的學(xué)習(xí)方法賦予了一個(gè)新名詞–“深度學(xué)習(xí)”(Deep Learning)。

  人腦視覺系統(tǒng)的信息處理是分層的。簡(jiǎn)單來說,就是要先從功能相對(duì)低級(jí)的區(qū)域分辨出朝向、空間位置和運(yùn)動(dòng)方向,然后到下一個(gè)區(qū)域再去處理形狀和顏色等信息。

  比如當(dāng)你看《黑客帝國(guó)》時(shí),你是先看到一個(gè)人朝著鏡頭走過來,然后才分出這個(gè)人的臉型和各種面部特征、穿著的衣服顏色,根據(jù)這些信息和你大腦中原有的海量信息做匹配,你就能夠判斷出來這個(gè)正在運(yùn)動(dòng)的人是基努里維斯。

  所以在大腦中,對(duì)一個(gè)形象的判別是分層次處理的,并不是一股腦把所有信息交給某個(gè)部分,然后它突然得出結(jié)論這個(gè)人是里維斯。

  而深度學(xué)習(xí)就是借鑒人腦的信息處理過程,對(duì)信息進(jìn)行分層處理,進(jìn)行特征提取和分類。深度學(xué)習(xí)的實(shí)質(zhì),是通過構(gòu)建具有很多隱層的機(jī)器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù),來學(xué)習(xí)更有用的特征,從而最終提升分類的準(zhǔn)確性。

  計(jì)算機(jī)需要學(xué)習(xí)足夠的數(shù)據(jù),才能訓(xùn)練出一個(gè)能夠用于識(shí)別的模型。

  

識(shí)別.jpg

  數(shù)據(jù)量很重要,對(duì)你的大腦也是一樣。一個(gè)不是特別恰當(dāng)?shù)睦邮?,如果你沒見過里維斯,你就算看到了這個(gè)五官、清晰地分別出頭發(fā)和瞳孔顏色,也沒有辦法判斷他到底是誰。

  這也是為什么,在網(wǎng)絡(luò)數(shù)據(jù)受限的情況下,深度學(xué)習(xí)的資源就不夠。

  此外,神經(jīng)網(wǎng)絡(luò)的分層也是在不斷進(jìn)步的。

  2005 年以前提出的人工神經(jīng)網(wǎng)絡(luò)只是一種淺層模型,只含有一層隱層節(jié)點(diǎn),但這比人腦簡(jiǎn)化太多了,效果也就差得多。

  而用深度置信網(wǎng)絡(luò)解決來這個(gè)問題,可以構(gòu)建更多層的模型,更接近人的視覺神經(jīng)系統(tǒng)的結(jié)構(gòu)。

  不過隨著時(shí)間的推移,深度置信模型(DBP)也有一些問題,包括計(jì)算量太大、樣本量太大等等。卷積神經(jīng)網(wǎng)絡(luò)(CNN)又可以解決這個(gè)問題,它將每一層信息僅通過一個(gè)“卷積核”相連。

  你可以理解兩個(gè)平面之間,前者是需要每個(gè)點(diǎn)直接相連,現(xiàn)在只需要中間的一個(gè)點(diǎn)直接相連。

  等于DBN需要計(jì)算機(jī)一次性看完整張圖,全局對(duì)比;但CNN可以一步一步一塊一塊地對(duì)比小特征,和分布式系統(tǒng)的感覺有點(diǎn)像。

  這樣處理樣本的速度就顯著加快了。

  據(jù)廣證恒生在2019年的研究報(bào)告,美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)公布了全球權(quán)威人臉識(shí)別比賽(FRVT)最新報(bào)告,從前十名企業(yè)在千分之一的誤報(bào)率下的識(shí) 別準(zhǔn)確率來看,其平均能達(dá)到 99.69%,在千萬分之一誤報(bào)下的識(shí)別準(zhǔn)確率超過 99%,意味著機(jī)器幾乎可 以做到在 1000 萬人的規(guī)模下準(zhǔn)確識(shí)別每一個(gè)人。

  而人腦記憶100個(gè)人的身份都有可能出錯(cuò)。

  

人工識(shí)別專利.jpg

  這幾年,無論是安防中的人臉識(shí)別,還是高鐵閘機(jī)上的人臉識(shí)別,抑或是證券在線開戶、交易等,大家都開始自由地使用人臉作為個(gè)人識(shí)別的特征。

  當(dāng)技術(shù)不再困難的時(shí)候,在討論倫理之前,創(chuàng)業(yè)公司們卻首先迎來了商業(yè)化的難題。

  

艱難的商業(yè)化:合適的落地場(chǎng)景難找

  

       其實(shí),在2015年那一次機(jī)器識(shí)別準(zhǔn)確率高于人眼之前,如今的AI四小龍已經(jīng)成立了。

  其中曠視科技成立最早——2011年,云從科技成立最晚——2015年。

  曠視科技由三個(gè)年輕人正式創(chuàng)立,三位創(chuàng)始人是清華“姚班”畢業(yè)的印奇、唐文斌、楊沐。

  商湯科技則是由香港中文大學(xué)信息工程系湯曉鷗組建的,是產(chǎn)學(xué)研的極佳代表。

  云從科技周曦的核心創(chuàng)始團(tuán)隊(duì)有中科院背景,融資又是全內(nèi)資與政府基金背景,云從又被外界稱為“AI國(guó)家隊(duì)”,在“AI四小龍”中,云從國(guó)資背景最強(qiáng)。

  依圖科技由朱瓏、林晨曦共同創(chuàng)立,林晨曦曾經(jīng)是阿里的第一任技術(shù)總監(jiān),更早之前是在微軟亞洲研究院,是產(chǎn)業(yè)背景最深的一個(gè)。

  這四家都在2015年拐點(diǎn)之前成立并一起迎接了牛市的到來。

  當(dāng)人臉識(shí)別的算法首次獲得突破人眼的成就之時(shí),創(chuàng)業(yè)者和資本都很興奮。

  整個(gè)計(jì)算機(jī)視覺行業(yè)和人臉識(shí)別產(chǎn)業(yè)也迎來了第一波投資上的熱潮,但隨后的商業(yè)化過程卻并不容易。

  因?yàn)?,?dāng)為這項(xiàng)技術(shù)找一個(gè)落地姿勢(shì)的時(shí)候,就非常明顯地遇到了兩個(gè)大問題:

  第一個(gè)困境是,人臉識(shí)別就算再牛,也只是一個(gè)模塊技術(shù)。這個(gè)屬性意味著,它無法作為一個(gè)獨(dú)立的業(yè)務(wù)出現(xiàn),而大多是為原先的業(yè)務(wù)做增強(qiáng)服務(wù)。比如在金融業(yè)務(wù)中做人臉校驗(yàn)加強(qiáng)密碼屬性,比如使用人臉檢索功能加強(qiáng)安防等領(lǐng)域的防控效率,比如相似人臉推薦可以用來做婚介社交和整容設(shè)計(jì)。

  這樣的屬性意味著,如果沒有合適的落地賽道,人臉識(shí)別就是空中樓閣。即便找到了合適的落地賽道,人臉識(shí)別在其中的價(jià)值量占比也不夠高。

  第二個(gè)困境其實(shí)是第一個(gè)困境帶來的,由于需要具體的落地場(chǎng)景、價(jià)值占比不夠高,這項(xiàng)技術(shù)始終沒有找到比較好的商業(yè)模式。

  行業(yè)中常見的有幾種模式,要么是直接賣產(chǎn)品、要么賣人臉SDK授權(quán)和API服務(wù),要么使用后臺(tái)流量變現(xiàn)。算法再好,也需要產(chǎn)品。沒有真正的標(biāo)準(zhǔn)化產(chǎn)品,它就會(huì)淪為項(xiàng)目制中的一個(gè)模塊,很難做大規(guī)模;甚至有些將它作為免費(fèi)的額外服務(wù)提供。

  比如在A股曾經(jīng)火爆過一陣的人臉識(shí)別閘機(jī)相關(guān)概念股,最后大家發(fā)現(xiàn)其實(shí)只要達(dá)到一定精度(不需要最高),誰都可以做,技術(shù)門檻并不高。

  也就是說,AI的最終任務(wù)是實(shí)現(xiàn)在各垂直行業(yè)的場(chǎng)景化落地,并找到在其中AI能發(fā)揮最大價(jià)值、實(shí)現(xiàn)良好商業(yè)模式的場(chǎng)景賽道?;蛘撸蛟煲粋€(gè)通用型平臺(tái)。

  中國(guó)AI行業(yè)融資規(guī)模與投融資數(shù)量在2013-2018年整體快速增長(zhǎng),但2019年出現(xiàn)45%左右的顯著下滑,2020年投融資金額恢復(fù)42.5%正增長(zhǎng),但距2018年顛覆時(shí)期仍有差距,投融資數(shù)量顯著下降。

  AI投資.jpg


  二級(jí)市場(chǎng)的熱度也可以通過研報(bào)數(shù)量提供輔證,以”人臉識(shí)別“作為關(guān)鍵詞為例,在Wind上2015年這一關(guān)鍵詞搜索到的行業(yè)研究(不含個(gè)股研究)報(bào)告(僅以Wind數(shù)據(jù)為例,不保證完全覆蓋)數(shù)量為17篇。而在2014年這一數(shù)據(jù)為0,2018年-2020年,每年都只有1篇。

  

行業(yè)研報(bào).jpg

  在人工智能發(fā)展的最初,算法研發(fā)能力的評(píng)判是對(duì)一家創(chuàng)業(yè)企業(yè)最有效的估值方法,換句話說,也就是從企業(yè)的投資轉(zhuǎn)為對(duì)技術(shù)甚至是對(duì)人才的投資。

  2014年年初,谷歌創(chuàng)始人拉里佩奇親自操刀了一宗收購(gòu)案,斥資5.4億美元,收購(gòu)一家名為DeepMind的人工智能公司,也就是后來研發(fā)AlphaGo的公司。而那時(shí),DeepMind是沒有任何商業(yè)模式方面的探索的,谷歌僅僅是為了人才,就可以掏出5.4億美元。

  但當(dāng)AI競(jìng)爭(zhēng)進(jìn)入深水區(qū),商業(yè)化才是真正的考驗(yàn)。


  上市肉搏戰(zhàn):商業(yè)模式破冰乏力


  在這種困境中,AI四小龍也基本都開始轉(zhuǎn)型了,尋找不同的落地場(chǎng)景。

  計(jì)算機(jī)視覺產(chǎn)業(yè)鏈可劃分為基礎(chǔ)層、技術(shù)層和應(yīng)用層?;A(chǔ)層包括硬件支持、算法支持和數(shù)據(jù)集;技術(shù)層包括視覺技術(shù)平臺(tái)、視頻識(shí)別、圖片識(shí)別和模式匹配;應(yīng)用層包括計(jì)算機(jī)視覺技術(shù)在智慧城市、智慧安防、智慧物流、智慧金融、手機(jī)終端和智慧商業(yè)等領(lǐng)域的應(yīng)用。

  計(jì)算機(jī)視覺產(chǎn)業(yè)鏈.jpg


  曠視科技,在原創(chuàng)技術(shù)的研究基礎(chǔ)上加上IOT、公共IOT、商業(yè)IOT等三個(gè)領(lǐng)域的頂層設(shè)計(jì),開始逐步打開局面,主要專注于物聯(lián)網(wǎng)領(lǐng)域。

  商湯科技呢,則開始向平臺(tái)型“操作系統(tǒng)”轉(zhuǎn)型,試圖擺脫單一賽道帶來的困境。與其他企業(yè)專注特定賽道相比,商湯沒有選擇具體的細(xì)分賽道。從現(xiàn)在的情況看,它更多是將自己定義為了一個(gè)“AI零部件”生產(chǎn)工廠。

  云從科技從創(chuàng)立一開始,就是唯一一個(gè)有”國(guó)家隊(duì)“背景的公司,它背后站著中科院,目前公司主力業(yè)務(wù)針對(duì)金融,是銀行領(lǐng)域第一大AI供應(yīng)商,以為客戶提供解決方案為主。

  依圖則是一開始將計(jì)算機(jī)視覺業(yè)務(wù)對(duì)接安防的,提供算法產(chǎn)品的輸出。隨著后續(xù)項(xiàng)目落地,開始轉(zhuǎn)向醫(yī)學(xué)圖像和智能城市業(yè)務(wù)。目前,依圖的業(yè)務(wù)重點(diǎn)已經(jīng)是自研AI芯片了,逐步從純軟件轉(zhuǎn)向底層硬件+平臺(tái)結(jié)合的路線。

  AI四小龍.jpg


  從競(jìng)爭(zhēng)格局來看,以收入規(guī)模計(jì),商湯科技排第一,曠視科技排在第二位,高于依圖科技與云從科技。不過依圖科技自從撤回招股書之后未再出現(xiàn)更新。

  

收入規(guī)模.jpg

  來源:招股書、華爾街見聞?wù)?/p>

  至于盈利能力,借用此前某位AI行業(yè)的一級(jí)市場(chǎng)投資人的話說:

  全球大部分AI公司的毛利率都很低,毛利率一般都在50%-60%,而軟件服務(wù)行業(yè)的毛利率在60%-80%以上。

  這樣的結(jié)果正是目前AI行業(yè)普遍面臨的商業(yè)模式導(dǎo)致的,大部分公司都還在做定制化業(yè)務(wù),不管是做政府業(yè)務(wù)、還是金融業(yè)務(wù),只要面對(duì)大型客戶,這些AI企業(yè)都很難使用通用打包產(chǎn)品提供客戶所需要的服務(wù)。

  最后就會(huì)變得和傳統(tǒng)IT企業(yè)一樣,要通過堆人頭、做項(xiàng)目來獲得收入。

  2G的業(yè)務(wù)越多,毛利率就越低、銷售費(fèi)用率就越高。以2020年數(shù)據(jù)計(jì)算,依圖科技(只有上半年數(shù)據(jù))和商湯科技毛利率均超過70%,但云從和商湯毛利率都低于上述投資人說的50%下限。

  更要命的是,由于AI類企業(yè)的研發(fā)投入要高于一般的IT企業(yè),因此最終每一家公司都處于虧損狀態(tài)。

  

虧損狀態(tài).jpg

  虧得最多的商湯科技,3年多虧200多億。

  在這種局面之下,上市尋求更多資金支持就成為一條不得不走的路。

  計(jì)算機(jī)視覺的前路——工業(yè)、醫(yī)療

  但計(jì)算機(jī)視覺之路卻并沒有被堵死,因?yàn)槌恕比四樧R(shí)別“之外,還有工業(yè)機(jī)器視覺和醫(yī)療影像識(shí)別。

  1、工業(yè)機(jī)器視覺

  據(jù)天風(fēng)證券的研究報(bào)告,機(jī)器視覺在工業(yè)應(yīng)用中,可以用來甄別物體特征、定位、測(cè)量并檢測(cè),而這些通過人眼是很難完成的。

  工業(yè)視覺具備極強(qiáng)的機(jī)器特性,如極高的速度、精度、重復(fù)性等,這些特性成為工業(yè)機(jī)器視覺 產(chǎn)品的重要參數(shù)。

  與此同時(shí),工業(yè)機(jī)器視覺擁有采集大量現(xiàn)場(chǎng)數(shù)據(jù)的能力,數(shù)據(jù)是驅(qū)動(dòng)行業(yè)快速迭代、獲取信息 的重要來源,這也將成為工業(yè)機(jī)器視覺未來的巨大可能。

  

工業(yè)機(jī)器視覺.jpg

  傳統(tǒng)的工業(yè)機(jī)器視覺采用本地?cái)?shù)據(jù)存儲(chǔ)和處理, 通過本地總線連接,每臺(tái)設(shè)備搭載一臺(tái)性能強(qiáng)大的電腦進(jìn)行數(shù)據(jù)的存儲(chǔ)和處理;而現(xiàn)在的機(jī)器視覺系統(tǒng)通過有線(光纖/銅纜) 或無線(WiFi/4G/5G)連接至PC端,PC端無需放置在本地。

  因此隨著5G的到來,機(jī)器視覺有望迎來更好的發(fā)展。

  2、醫(yī)療影像

  當(dāng)前中國(guó)CT行業(yè)影像數(shù)據(jù)爆 炸增長(zhǎng),2019年市場(chǎng)規(guī)模達(dá)到24.7億元,CAGR約30%。另一方面,目前我國(guó)放射科醫(yī)師僅有8萬多名,每年承擔(dān)的診 斷工作量卻達(dá)到了14.4億張影像,結(jié)合中國(guó)醫(yī)學(xué)影像數(shù)據(jù)每年30%的增速,與之相對(duì)應(yīng)的放射科醫(yī)師的年增長(zhǎng)速率卻只有4%,兩者之間存在巨大缺口,AI+CT影像識(shí)別有望彌補(bǔ)這一缺口,發(fā)展?jié)摿薮蟆?/p>

  

CT行業(yè)影像.jpg

  AI+CT影像的主要產(chǎn)品形態(tài)包括:影像分析與診斷軟件、CT影像三維重建系統(tǒng)、靶 區(qū)自動(dòng)勾畫及自適應(yīng)放療系統(tǒng)。通過智能CT影像識(shí)別,能夠完成病例篩查、智能分析診斷、輔助臨床診療決策等工 作。從應(yīng)用的場(chǎng)景來看,主要包括胸部、四肢關(guān)節(jié)等部位,乳腺、心肺、冠狀動(dòng)脈、骨骼等器官組織,應(yīng)用領(lǐng)域廣闊。

  

人工讀片.jpg

  人工讀片存在主觀性高、重復(fù)性低、定量及信息利用度不足、耗時(shí)及勞動(dòng)強(qiáng)度和知識(shí)經(jīng)驗(yàn)的傳承困難等問題;而人工智能讀片的優(yōu)勢(shì)體現(xiàn)在高效率低成本。隨著產(chǎn)品的成熟帶動(dòng)識(shí)別率的提升,人工智能讀片的精準(zhǔn)度也將形成比較優(yōu)勢(shì)。

  尾聲

  發(fā)展60多年來,機(jī)器視覺作為AI技術(shù)的急先鋒,經(jīng)歷了幾輪起落,終于迎來技術(shù)上的爆發(fā)。但隨著技術(shù)進(jìn)入深水區(qū),尋找合適的商業(yè)模式真正成為了機(jī)器視覺這門技術(shù)的最大難點(diǎn)。

  互聯(lián)網(wǎng)巨頭的AI技術(shù)可以在自身不斷得到驗(yàn)證,字節(jié)的推薦算法可以通過用戶點(diǎn)擊數(shù)據(jù)驗(yàn)證;美團(tuán)的算法可以優(yōu)化騎手路線通過送達(dá)時(shí)間變化來驗(yàn)證等。

  我們最近看到的四小龍?jiān)袸PO僅僅是行業(yè)規(guī)范化、商業(yè)化的開端,計(jì)算機(jī)視覺的前路還很長(zhǎng)。

  但是國(guó)家政策一直是鼓勵(lì)并支持AI產(chǎn)業(yè)的發(fā)展的,相信未來它們一定能找到更好的出路,帶領(lǐng)中國(guó)的計(jì)算機(jī)視覺乃至整個(gè)AI產(chǎn)業(yè)走在全球前列。

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.surachana.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0