国产日韩欧美专区,欧洲无码专区无码中文免费视频

華為從Mate10到企業(yè)智能，狂奔人工智能新賽道

近日，谷歌發(fā)布AVA（AtomicVisualActions）數(shù)據(jù)庫，由YouTube公開的視頻集組成，這些視頻可以用80個原子動作進行標(biāo)注，例如走路、握手、踢東西等，所有動作具有時空定位，累計有5.76萬個視頻片段，9.6萬個人類動作，以及21萬個動作標(biāo)簽。谷歌稱，此次發(fā)布的AVA技術(shù)將幫助谷歌分析多年的視頻，還能幫助廣告商更好地瞄準(zhǔn)消費者。他們的最終目標(biāo)是教計算機社交視覺智能化，即“理解人類在做什么，下一步該做什么，以及他們想要實現(xiàn)什么目標(biāo)。”

目前，國內(nèi)一些科研院所和企業(yè)也已經(jīng)在行為識別相關(guān)領(lǐng)域進行重點投入，以解決視頻監(jiān)控數(shù)據(jù)理解這一瓶頸問題，但要達到讓機器通過行為“理解”人類這個最終目標(biāo)，還需要很多努力?！澳壳?，人體行為識別大多還處在動作識別階段，對于實際應(yīng)用而言，識別人的動作，還是一個巨大的挑戰(zhàn)?！?1月8日，濟南大學(xué)模式識別與智能系統(tǒng)研究所所長李金屏教授告訴科技日報記者。動一動，機器就能發(fā)現(xiàn)你？有關(guān)專家表示，現(xiàn)階段，這是一件“可以有”的事。

應(yīng)用：

安防等領(lǐng)域大展神威

李金屏告訴記者，動作識別可以看成是特征提取和分類器設(shè)計相結(jié)合的過程。養(yǎng)老院中，如果出現(xiàn)老人摔倒，行為識別系統(tǒng)可以立刻向工作人員發(fā)出警報，甚至直接與醫(yī)院進行聯(lián)系；黑科技滿滿的《碟中諜5》，安保系統(tǒng)的最后一道防線是步態(tài)識別……盡管技術(shù)難點重重，行為識別目前仍然在相關(guān)領(lǐng)域獲得了應(yīng)用。

浙江大學(xué)人工智能研究所所長吳飛教授告訴記者，這項最早被蘋果和微軟應(yīng)用于游戲的技術(shù)，還在公檢法（在押人員審訊看護）、電力（風(fēng)力發(fā)電、國家電網(wǎng)的安全生產(chǎn)）、銀行（業(yè)務(wù)區(qū)域智能安防）、醫(yī)院（病人狀態(tài)監(jiān)護）等多個場景有更廣的應(yīng)用空間。尤其在安防等領(lǐng)域，以行為識別為基礎(chǔ)的應(yīng)用更廣泛。

比如通過人的走路方式來識別身份的步態(tài)識別，雖然屬于身份識別，但是也是行為識別和身份識別的一種有效交叉。步態(tài)識別是一種通過人們走路姿態(tài)進行的身份識別，分為人形檢測、分割、識別、跟蹤四個部分，而這些部分最具挑戰(zhàn)的環(huán)節(jié)都離不開以行為識別為基礎(chǔ)的研究。

在近年來尋找失蹤人口和嫌犯追逃的工作中，步態(tài)識別已經(jīng)發(fā)揮了不小的作用?！稒C智過人》節(jié)目中，銀河水滴科技成功通過步態(tài)識別現(xiàn)場“嫌疑人”，加大難度后，還靠步態(tài)識別出狗的剪影。

銀河水滴科技創(chuàng)始人兼CEO黃永禎說，通過步態(tài)識別來實現(xiàn)異常行為分析，這是步態(tài)識別相比于其他生物特征識別的重要優(yōu)勢之一。異常行為的應(yīng)有之義就包括可以通過視覺觀察目標(biāo)體形和動作狀態(tài)，來發(fā)現(xiàn)是否有異常行為，通常會涉及到目標(biāo)檢測、分割、關(guān)鍵點定位、識別、跟蹤等技術(shù)環(huán)節(jié)，而這些技術(shù)環(huán)節(jié)也是步態(tài)識別的核心底層技術(shù)。目前，他們已能很好地完成遠距離非受控模式識別。

難點：

定位、跟蹤、場景步步為艱

“行為識別的難點，首先表現(xiàn)為從連續(xù)視頻流中對人體運動的定位難、追蹤難。”吳飛說，在視頻行為識別中，要找到一個連續(xù)動作的起點和終點，即將連貫動作從視頻流中定位出來，在視頻識別中是非常困難的。而在找到某個連貫動作的起點后，對這個動作進行魯棒跟蹤也比較困難。比如一個跳躍動作，要實現(xiàn)追蹤動作持續(xù)展開的過程就不容易，還要考慮場景的復(fù)雜性以及背景動態(tài)變化或者攝像頭晃動等因素。

不僅如此，場景識別也是一大難點。首先，即使是同一類動作，在不同時刻、不同場景也具有很大差異性。吳飛舉例說，比如不同的人在不同時刻行走，速度、姿態(tài)和場景遮擋等方面都有差異。不同類別動作之間更是如此。李金屏表示，“與靜態(tài)對象不同，動作會隨著時間的推移而展開，會有更多不確定因素?！北热缫环说摹芭懿健闭掌?，實際上有可能只是這個人在跳躍的動作，只有看到更多畫面，才有可能清楚地知道到底發(fā)生了什么?？梢娙嗽趫鼍爸械膭討B(tài)是多么復(fù)雜。因此某一動作的識別方法很難直接用在另一動作的識別上?！耙粋€動作，人類辨識兩三遍就可以了，但要讓機器記住并識別，則需要大量的訓(xùn)練數(shù)據(jù)。”李金屏說。

此次谷歌發(fā)布的AVA與其他數(shù)據(jù)集相比，通過在相關(guān)場景中提供具有精細時空粒度的多個標(biāo)簽，將極大推動人們對于相關(guān)模型的深入研究，最終不但能夠?qū)崿F(xiàn)人的復(fù)雜活動精確建模，還將進一步獲得實際應(yīng)用。

展望：

設(shè)備平臺、理論模型方興未艾

“在行為識別領(lǐng)域，中國未來五年、十年的發(fā)展后勁非常強，建議在設(shè)備和平臺方面進行攻關(guān)，現(xiàn)在國內(nèi)好多團隊的設(shè)備還是采用微軟等國外企業(yè)的設(shè)備和平臺，希望國家在這方面給予一定的支持和政策引導(dǎo)?！崩罱鹌琳f。

在吳飛看來，中國的科研團隊和企業(yè)還應(yīng)該在理論模型、數(shù)據(jù)驅(qū)動等基礎(chǔ)理論方面進行深耕。“一個行為動作的過程要經(jīng)歷多個狀態(tài)（對應(yīng)很多時間幀），人體在每個時刻也呈現(xiàn)出不同的姿態(tài)，那么，是不是每一幀在動作判別中的重要性都相同呢？對于行為動作的判別，是不是每個關(guān)節(jié)點在動作判別中都同等重要呢？這些都需要理論模型等基礎(chǔ)理論的完善?！眳秋w說。