機器人將在安防等領(lǐng)域展神威 動一動就認清你

時間:2017-11-13

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語: 近日,谷歌發(fā)布AVA(AtomicVisualActions)數(shù)據(jù)庫,由YouTube公開的視頻集組成,這些視頻可以用80個原子動作進行標注

 

華為從Mate10到企業(yè)智能,狂奔人工智能新賽道

近日,谷歌發(fā)布AVA(AtomicVisualActions)數(shù)據(jù)庫,由YouTube公開的視頻集組成,這些視頻可以用80個原子動作進行標注,例如走路、握手、踢東西等,所有動作具有時空定位,累計有5.76萬個視頻片段,9.6萬個人類動作,以及21萬個動作標簽。谷歌稱,此次發(fā)布的AVA技術(shù)將幫助谷歌分析多年的視頻,還能幫助廣告商更好地瞄準消費者。他們的最終目標是教計算機社交視覺智能化,即“理解人類在做什么,下一步該做什么,以及他們想要實現(xiàn)什么目標?!?/p>

目前,國內(nèi)一些科研院所和企業(yè)也已經(jīng)在行為識別相關(guān)領(lǐng)域進行重點投入,以解決視頻監(jiān)控數(shù)據(jù)理解這一瓶頸問題,但要達到讓機器通過行為“理解”人類這個最終目標,還需要很多努力。“目前,人體行為識別大多還處在動作識別階段,對于實際應(yīng)用而言,識別人的動作,還是一個巨大的挑戰(zhàn)。”11月8日,濟南大學(xué)模式識別與智能系統(tǒng)研究所所長李金屏教授告訴科技日報記者。動一動,機器就能發(fā)現(xiàn)你?有關(guān)專家表示,現(xiàn)階段,這是一件“可以有”的事。

應(yīng)用:

安防等領(lǐng)域大展神威

李金屏告訴記者,動作識別可以看成是特征提取和分類器設(shè)計相結(jié)合的過程。養(yǎng)老院中,如果出現(xiàn)老人摔倒,行為識別系統(tǒng)可以立刻向工作人員發(fā)出警報,甚至直接與醫(yī)院進行聯(lián)系;黑科技滿滿的《碟中諜5》,安保系統(tǒng)的最后一道防線是步態(tài)識別……盡管技術(shù)難點重重,行為識別目前仍然在相關(guān)領(lǐng)域獲得了應(yīng)用。

浙江大學(xué)人工智能研究所所長吳飛教授告訴記者,這項最早被蘋果和微軟應(yīng)用于游戲的技術(shù),還在公檢法(在押人員審訊看護)、電力(風(fēng)力發(fā)電、國家電網(wǎng)的安全生產(chǎn))、銀行(業(yè)務(wù)區(qū)域智能安防)、醫(yī)院(病人狀態(tài)監(jiān)護)等多個場景有更廣的應(yīng)用空間。尤其在安防等領(lǐng)域,以行為識別為基礎(chǔ)的應(yīng)用更廣泛。

比如通過人的走路方式來識別身份的步態(tài)識別,雖然屬于身份識別,但是也是行為識別和身份識別的一種有效交叉。步態(tài)識別是一種通過人們走路姿態(tài)進行的身份識別,分為人形檢測、分割、識別、跟蹤四個部分,而這些部分最具挑戰(zhàn)的環(huán)節(jié)都離不開以行為識別為基礎(chǔ)的研究。

在近年來尋找失蹤人口和嫌犯追逃的工作中,步態(tài)識別已經(jīng)發(fā)揮了不小的作用?!稒C智過人》節(jié)目中,銀河水滴科技成功通過步態(tài)識別現(xiàn)場“嫌疑人”,加大難度后,還靠步態(tài)識別出狗的剪影。

銀河水滴科技創(chuàng)始人兼CEO黃永禎說,通過步態(tài)識別來實現(xiàn)異常行為分析,這是步態(tài)識別相比于其他生物特征識別的重要優(yōu)勢之一。異常行為的應(yīng)有之義就包括可以通過視覺觀察目標體形和動作狀態(tài),來發(fā)現(xiàn)是否有異常行為,通常會涉及到目標檢測、分割、關(guān)鍵點定位、識別、跟蹤等技術(shù)環(huán)節(jié),而這些技術(shù)環(huán)節(jié)也是步態(tài)識別的核心底層技術(shù)。目前,他們已能很好地完成遠距離非受控模式識別。

難點:

定位、跟蹤、場景步步為艱

“行為識別的難點,首先表現(xiàn)為從連續(xù)視頻流中對人體運動的定位難、追蹤難?!眳秋w說,在視頻行為識別中,要找到一個連續(xù)動作的起點和終點,即將連貫動作從視頻流中定位出來,在視頻識別中是非常困難的。而在找到某個連貫動作的起點后,對這個動作進行魯棒跟蹤也比較困難。比如一個跳躍動作,要實現(xiàn)追蹤動作持續(xù)展開的過程就不容易,還要考慮場景的復(fù)雜性以及背景動態(tài)變化或者攝像頭晃動等因素。

不僅如此,場景識別也是一大難點。首先,即使是同一類動作,在不同時刻、不同場景也具有很大差異性。吳飛舉例說,比如不同的人在不同時刻行走,速度、姿態(tài)和場景遮擋等方面都有差異。不同類別動作之間更是如此。李金屏表示,“與靜態(tài)對象不同,動作會隨著時間的推移而展開,會有更多不確定因素?!北热缫环说摹芭懿健闭掌?,實際上有可能只是這個人在跳躍的動作,只有看到更多畫面,才有可能清楚地知道到底發(fā)生了什么??梢娙嗽趫鼍爸械膭討B(tài)是多么復(fù)雜。因此某一動作的識別方法很難直接用在另一動作的識別上?!耙粋€動作,人類辨識兩三遍就可以了,但要讓機器記住并識別,則需要大量的訓(xùn)練數(shù)據(jù)。”李金屏說。

此次谷歌發(fā)布的AVA與其他數(shù)據(jù)集相比,通過在相關(guān)場景中提供具有精細時空粒度的多個標簽,將極大推動人們對于相關(guān)模型的深入研究,最終不但能夠?qū)崿F(xiàn)人的復(fù)雜活動精確建模,還將進一步獲得實際應(yīng)用。

展望:

設(shè)備平臺、理論模型方興未艾

“在行為識別領(lǐng)域,中國未來五年、十年的發(fā)展后勁非常強,建議在設(shè)備和平臺方面進行攻關(guān),現(xiàn)在國內(nèi)好多團隊的設(shè)備還是采用微軟等國外企業(yè)的設(shè)備和平臺,希望國家在這方面給予一定的支持和政策引導(dǎo)?!崩罱鹌琳f。

 

在吳飛看來,中國的科研團隊和企業(yè)還應(yīng)該在理論模型、數(shù)據(jù)驅(qū)動等基礎(chǔ)理論方面進行深耕。“一個行為動作的過程要經(jīng)歷多個狀態(tài)(對應(yīng)很多時間幀),人體在每個時刻也呈現(xiàn)出不同的姿態(tài),那么,是不是每一幀在動作判別中的重要性都相同呢?對于行為動作的判別,是不是每個關(guān)節(jié)點在動作判別中都同等重要呢?這些都需要理論模型等基礎(chǔ)理論的完善。”吳飛說。

中傳動網(wǎng)版權(quán)與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.surachana.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0