計算機視覺幫助解決業(yè)務(wù)挑戰(zhàn)的 5 種方法

時間:2022-06-30

來源:千家網(wǎng)

導(dǎo)語:讓我們來看看計算機視覺如何顛覆各個行業(yè),以及它為幫助業(yè)主解決關(guān)鍵業(yè)務(wù)挑戰(zhàn)帶來了哪些獨特的好處。

  自動駕駛汽車、交通標(biāo)志檢測、面部識別和自助結(jié)賬。 將所有這些先進解決方案結(jié)合在一起的是計算機視覺。 計算機視覺允許計算機從原始圖像中提取信息,并為更有效的業(yè)務(wù)數(shù)字化開辟了許多機會。 讓我們來看看計算機視覺如何顛覆各個行業(yè),以及它為幫助業(yè)主解決關(guān)鍵業(yè)務(wù)挑戰(zhàn)帶來了哪些獨特的好處。

  #1:物體檢測

  傳統(tǒng)的計算機視覺實現(xiàn)使用對輸入和輸出的深入分析。老式 CV 的典型流程依賴于邊緣檢測等圖像處理技術(shù)來識別和標(biāo)記圖像中的對象。

  計算機科學(xué)中深度學(xué)習(xí)架構(gòu)的出現(xiàn)導(dǎo)致了從經(jīng)典的 CV 技術(shù)(如基于定義的特征結(jié)構(gòu))到 AI 驅(qū)動的圖像神經(jīng)網(wǎng)絡(luò)分析的巨大轉(zhuǎn)變,這使得圖像中數(shù)據(jù)的提取和分類幾乎完全自動化。簡單來說,人工智能將編程從畫面中剔除,取而代之的是一種監(jiān)督較少的方法,在這種方法中,計算機解釋輸入數(shù)據(jù)并訓(xùn)練自己識別圖像的內(nèi)容。

  用例

  當(dāng) AI 進入醫(yī)學(xué)成像等領(lǐng)域時,計算機會利用卓越的模式識別來識別原始圖像中的細(xì)微元素,例如 X 射線或 MRI 中是否存在微量癌細(xì)胞。盡管仍然需要人工解釋和專業(yè)知識來檢查機器的推斷,但額外的閃電般的快速分析層有助于補充人類智能并挽救生命。

  隨著自動駕駛汽車在美國和其他許多國家上路,CV 領(lǐng)域?qū)⒂瓉肀l(fā)式增長。沒有計算機視覺,自動駕駛汽車就無法存在。由于車輛的車載計算機需要對道路上的潛在障礙物做出快速決策,因此它依賴于一套高度優(yōu)化的基于 CV 的技術(shù)。

  值得注意的是,在醫(yī)學(xué)、安全、制造等領(lǐng)域,人工智能驅(qū)動系統(tǒng)如何做出決策的透明度至關(guān)重要。這就是可解釋的人工智能發(fā)揮作用的地方。該技術(shù)允許以人類可以理解的方式解釋系統(tǒng)的發(fā)現(xiàn),并顯示人工智能算法做出的特定決策的可靠性。

  使用計算機視覺解決以下業(yè)務(wù)挑戰(zhàn):

  公安(車輛識別、武器類型識別、可疑物體定位等)

  銷售自動化和庫存管理(識別貨架上的低庫存或錯放物品、檢測空貨架、執(zhí)行質(zhì)量控制、自助結(jié)賬的產(chǎn)品識別等)

  消除人為錯誤并防止工作流程中的重復(fù)計算

  #2:光學(xué)字符識別(OCR)

  光學(xué)字符識別 (OCR) 是計算機視覺的獨特實現(xiàn),可解決各種特定領(lǐng)域的任務(wù)。 OCR 旨在從輸入圖像中檢測和提取字母、數(shù)字和其他字符。

  用例

  Google Lens 使用 OCR 讓客戶從照片中翻譯外語,并從圖像或 Google 搜索中提取文本。 OCR 技術(shù)還使傳統(tǒng)媒體的數(shù)字化變得簡單,從報紙、雜志和書籍的掃描中提取文本。以前,大學(xué)很難將藏傳佛教宗教文本等更晦澀的文件數(shù)字化,但現(xiàn)代 OCR 技術(shù)使得從非標(biāo)準(zhǔn)語言文件中提取文本變得簡單。

  金融機構(gòu)使用 OCR 來改善客戶的生活質(zhì)量,例如讓客戶從文件中提取他們的國際銀行帳號 (IBAN) 或掃描支票圖像,這樣就不必去銀行存款.一些應(yīng)用程序可以掃描借記卡或信用卡以輸入付款詳情,因此您不必在結(jié)帳窗口繁瑣地輸入所有付款信息。

  政府通常使用 OCR 來縮短國家邊境的處理時間或識別和登記文件?,F(xiàn)代護照和駕駛執(zhí)照上的機器可讀區(qū)域與政府和商業(yè)環(huán)境中的 OCR 系統(tǒng)兼容。

  #3:面部識別

  與對象識別類似,面部識別旨在使用計算機視覺識別圖像中的人類面部特征。經(jīng)典的計算機視覺方法利用“Haar-like features”來計算面部特征之間的片段,但現(xiàn)代面部識別實現(xiàn)依賴于人工智能,就像人工智能用于物體識別一樣。

  用例

  面部識別技術(shù)對于安全應(yīng)用程序至關(guān)重要,因為它有助于防止移動和 Web 應(yīng)用程序漏洞。無數(shù) Apple iPhone 用戶依靠 Apple 的 Face ID 技術(shù)進行生物識別來解鎖他們的手機。

  零售商已經(jīng)部署了類似的實現(xiàn)來識別已知的商店扒手。實時掃描儀從安全攝像頭流中抓取客戶的面部,并交叉引用已知犯罪分子的數(shù)據(jù)庫。同樣的技術(shù)通過從執(zhí)法數(shù)據(jù)庫中提取來幫助尋找失蹤兒童。

  面部識別還可以幫助您完成以下任務(wù):

  安全和訪問控制

  身份驗證

  員工跟蹤

  醫(yī)療保健中的患者篩查程序

  識別和追蹤犯罪分子

  下一代面部識別軟件甚至可以查看姿勢、手勢和面部表情,以確定客戶是否可能在賭場作弊。與相同的安全軟件捆綁的步態(tài)分析還可以幫助根據(jù)他們獨特的腳步和步幅模式來檢測犯罪分子,因為許多犯罪分子通過戴口罩來躲避面部識別。

  #4:圖像恢復(fù)和場景重建

  計算機視覺技術(shù)還可以恢復(fù)嚴(yán)重退化的檔案鏡頭和圖像,這可能是一項關(guān)鍵的業(yè)務(wù)技術(shù)。與從照片中去除噪點就足夠的簡單情況不同,計算機視覺可以幫助處理更多損壞的圖像,這些圖像需要進行重大更改和詳細(xì)分析。圖像的損壞部分通常使用評估照片廣播內(nèi)容的生成模型來填充。

  用例

  除了恢復(fù)圖像和視頻之外,現(xiàn)代神經(jīng)網(wǎng)絡(luò)還可以僅通過掃描照片中的對象來重建 3D 場景??脊艑W(xué)家、法醫(yī)專家、環(huán)境科學(xué)家和許多其他專業(yè)人士使用場景重建,這是一種改變游戲規(guī)則的計算機視覺范例。 RetrievalFuse 等項目能夠從單個 RGB 圖像構(gòu)建全景 3D 場景。

  #5:人體姿勢估計

  姿勢估計旨在模擬人類視覺能力,特別是識別圖像和視頻中的姿勢和手勢。一些最早的高級人體姿勢估計示例出現(xiàn)在大預(yù)算電影中,例如彼得杰克遜的《指環(huán)王》。隨著計算資源隨著時間的推移而擴大,姿勢估計將在許多不同的產(chǎn)品中發(fā)揮作用。

  用例

  在安全應(yīng)用中,姿勢估計通過分析面部識別不可行的步態(tài)來幫助識別潛在的麻煩制造者。計算機視覺可以通過分析身體姿勢來幫助實時檢測入店行竊。該系統(tǒng)可以區(qū)分正常的購物行為和可疑行為,例如拿走物品并將其藏在口袋或外套中。當(dāng)檢測到可疑行為時,管理人員會收到警報,并可以在小偷離開商店之前迅速做出反應(yīng)。

  以下是在您的業(yè)務(wù)中使用姿勢估計的一些方法:

  康復(fù)措施分析

  開發(fā)基于人工智能的健身教練應(yīng)用程序

  識別人體在空間中的位置以改進增強現(xiàn)實的應(yīng)用

  游戲角色動畫

  人在商店和購物中心的活動分析

  盡管姿態(tài)估計曾經(jīng)是一項巨大的計算挑戰(zhàn),但云計算和硬件的創(chuàng)新使更多公司能夠接觸到這項技術(shù)。

  一切都是可能的

  對象檢測、面部識別、場景重建、圖像恢復(fù)和人體姿態(tài)估計只是計算機視覺技術(shù)的幾種不同實現(xiàn)方式。由于下一代 AI 的強大功能,無論您的企業(yè)從事何種行業(yè),計算機視覺都可以提供獨特的優(yōu)勢,使您的公司在競爭中處于領(lǐng)先地位。從重建犯罪現(xiàn)場照片的全深度 3D 模型到識別工廠線上量產(chǎn)產(chǎn)品的缺陷,計算機視覺不斷改變每個人的業(yè)務(wù)方式。


中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.surachana.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0