我們通常會(huì)把監(jiān)控?cái)z像頭想作是電子眼。對(duì)此,不同的人看法也大相徑庭,有人認(rèn)為電子眼是在監(jiān)控我們,有人認(rèn)為它在幫助我們密切注意環(huán)境。但實(shí)際上,它們更像是舷窗:當(dāng)有人通過(guò)舷窗看時(shí),它們才有用武之地。有時(shí)候這意味著人們會(huì)從磁盤錄像中查看現(xiàn)場(chǎng)畫面。但是大多數(shù)監(jiān)控?cái)z像頭都是被動(dòng)觀察者。它們只是用作震懾,或是在出現(xiàn)問(wèn)題時(shí)提供線索。你的汽車被偷了?那就去查看閉路電視監(jiān)控吧。
不過(guò)這一情況正在發(fā)生改變——且以一種很快的速度。人工智能為監(jiān)控?cái)z像頭配備了數(shù)字大腦來(lái)匹配“眼鏡”,并讓其無(wú)需人力參與就可自行分析現(xiàn)場(chǎng)視頻。這對(duì)公共安全來(lái)說(shuō)也許是好消息,它可以幫助警察以及第一目擊者更容易得發(fā)現(xiàn)犯罪或事故。此外,它還可以廣泛應(yīng)用于科學(xué)和工業(yè)。但是這卻會(huì)嚴(yán)重侵犯未來(lái)的隱私并對(duì)社會(huì)公平帶來(lái)新的風(fēng)險(xiǎn)。
如果政府通過(guò)閉路電視能夠追蹤到大量人群,那會(huì)發(fā)生什么情況呢?如果警察在數(shù)據(jù)庫(kù)中僅僅通過(guò)上傳側(cè)面照片,就能以這種“電子”方式在城市里跟蹤你呢?如果在當(dāng)?shù)刭?gòu)物中心,攝像頭運(yùn)行的是一個(gè)具有偏見(jiàn)的算法,它會(huì)因?yàn)椴幌矚g某一類型的年輕人就去通知警察嗎?
這些情況也許距離我們還很遙遠(yuǎn),但當(dāng)下我們已經(jīng)發(fā)現(xiàn)人工智能結(jié)合監(jiān)控會(huì)帶來(lái)什么樣的后果了。ICRealtime就是一個(gè)例子。去年十二月發(fā)布的旗艦產(chǎn)品被稱作是閉路電視界的Google。有一個(gè)叫做Ella的應(yīng)用及網(wǎng)頁(yè)平臺(tái)就是利用人工智能分析視頻中發(fā)生的事情并且使其提供及時(shí)搜索。Ella可以識(shí)別成千上萬(wàn)種自然語(yǔ)言查詢,用戶可以搜索鏡頭從而找到呈現(xiàn)特定動(dòng)物、穿著某種顏色衣物或是單個(gè)車型的片段。
在網(wǎng)頁(yè)演示中,ICRealtime的首席執(zhí)行官M(fèi)attSailor向我們展現(xiàn)了Ella與大約40個(gè)攝像頭連接起來(lái)對(duì)一個(gè)公園實(shí)施監(jiān)控。他輸入了各式各樣的搜索內(nèi)容——“紅衣服的男士”、“UPS火車”、“警車”——幾秒鐘時(shí)間內(nèi),所有關(guān)鍵詞都得到了相關(guān)的影像片段。之后,通過(guò)限定時(shí)間和地理位置,他將搜索結(jié)果的范圍縮小了并展示了用戶可以如何表達(dá)贊成或是反對(duì)從而優(yōu)化結(jié)果——就像Netflix一樣。
“舉個(gè)例子,某地發(fā)生了一起搶劫,但你不知道實(shí)際情況到底如何?!盨ailor說(shuō)道,“但搶劫發(fā)生之后,有一輛Jeep牧馬人向東加速駛?cè)?。所以我們就輸入‘Jeep牧馬人’,然后我們就可以獲得影像片段了?!逼聊簧祥_(kāi)始出現(xiàn)片段,顯示出鏡頭前滑過(guò)的多輛Jeep牧馬人。Sailor表示這是人工智能和閉路電視結(jié)合的第一大優(yōu)勢(shì):更容易去找到你要尋找的內(nèi)容?!皼](méi)有這項(xiàng)技術(shù),除了攝像頭,你什么都不知道。你需要連續(xù)數(shù)小時(shí)觀看影像從而進(jìn)行篩選?!彼忉尩馈?/p>
Ella在GoogleCloud上運(yùn)行,它可以從幾乎任何一個(gè)閉路電視視頻系統(tǒng)中搜索鏡頭。Sailor表示:“從單攝像頭系統(tǒng)——例如保姆攝像頭或?qū)櫸飻z像頭——到擁有成千上萬(wàn)攝像頭的企業(yè)系統(tǒng),Ella都能適用。”用戶每月支付費(fèi)用,起價(jià)為大約7美元,總價(jià)會(huì)根據(jù)攝像頭數(shù)量的增加而增長(zhǎng)。
ICRealtime的目標(biāo)受眾是各種規(guī)模的企業(yè),但它也認(rèn)為這一技術(shù)能夠吸引個(gè)人消費(fèi)者。新興市場(chǎng)上,亞馬遜、Logitech、Netgear以及谷歌旗下的Nest智能家居已經(jīng)讓這些顧客開(kāi)始廣泛使用安防攝像頭。但是Sailor表示這一技術(shù)要比ICRealtime簡(jiǎn)陋得多。這些攝像頭連接到家庭WiFi上,通過(guò)應(yīng)用程序提供實(shí)時(shí)視頻流。當(dāng)它們發(fā)現(xiàn)有東西在移動(dòng)的時(shí)候,它們就會(huì)自動(dòng)記錄影像。但是Sailor表示它們無(wú)法區(qū)分闖入者和鳥(niǎo)類的區(qū)別,這就會(huì)導(dǎo)致很多誤報(bào)?!斑@是非?;A(chǔ)的技術(shù),已經(jīng)存在很多年時(shí)間了?!彼f(shuō)道,“這不含人工智能,也不包括深度學(xué)習(xí)?!?/p>
這種情況不會(huì)持續(xù)太長(zhǎng)時(shí)間了。雖然ICRealtime提供的云分析工具可以升級(jí)現(xiàn)有傻瓜式的攝像頭,其他公司則是直接將人工智能嵌入在硬件里。BoulderAI就是這樣一家初創(chuàng)企業(yè),公司利用自己獨(dú)立的人工智能攝像頭推出“視覺(jué)即服務(wù)”。在設(shè)備中結(jié)合人工智能帶來(lái)的優(yōu)勢(shì)在于,它們無(wú)需互聯(lián)網(wǎng)連接就能工作。BoulderAI向各行各業(yè)出售產(chǎn)品,為每位客戶量身定制機(jī)器視覺(jué)系統(tǒng)。
“這些應(yīng)用已經(jīng)遍布各行各業(yè)了。”創(chuàng)始人DarrenOdom在采訪中這樣說(shuō)道,“我們的平臺(tái)出售給了銀行業(yè)、能源業(yè)的公司。我們甚至有一個(gè)應(yīng)用是去觀察披薩,決定它們的形狀和大小是否合適?!?/p>
Odom還舉了一個(gè)在愛(ài)達(dá)荷州建造水壩的客戶例子。為了符合環(huán)保規(guī)定,他們正在監(jiān)控設(shè)施頂部的魚(yú)類數(shù)量。Odom表示:“他們過(guò)去是安排了一個(gè)人坐在窗口看著魚(yú)梯,數(shù)有多少條鮭魚(yú)游過(guò)。(顧名思義,魚(yú)梯就是一條階梯式的航道,魚(yú)類可以借此向上游。)之后,他們轉(zhuǎn)而使用視頻技術(shù),有人(遠(yuǎn)程)進(jìn)行監(jiān)控?!弊罱K,他們聯(lián)系到了Boulder公司,后者為其打造了一個(gè)定制化的人工智能閉路電視系統(tǒng),從而識(shí)別通過(guò)魚(yú)梯向上游的魚(yú)的種類。“我們真的可以通過(guò)計(jì)算機(jī)視覺(jué)來(lái)識(shí)別魚(yú)的種類。我們現(xiàn)在能夠100%的識(shí)別愛(ài)達(dá)荷州的鮭魚(yú)?!眔dom驕傲地說(shuō)道。
如果ICRealtime代表的是市場(chǎng)的通用端,那么Boulder則呈現(xiàn)了精品承包商可以在這個(gè)市場(chǎng)上做些什么。這兩種情況下,這些公司現(xiàn)在提供的服務(wù)不過(guò)也只是冰山一角。就像機(jī)器學(xué)習(xí)在識(shí)別物體能力方面取得迅速進(jìn)步一樣,它分析場(chǎng)景、活動(dòng)和動(dòng)作的能力也有望快速提升。一切準(zhǔn)備工作都已經(jīng)完成,包括基礎(chǔ)研究、計(jì)算能力和訓(xùn)練數(shù)據(jù)集——這是創(chuàng)建出色人工智能的關(guān)鍵要素。視頻分析的兩個(gè)最大數(shù)據(jù)集來(lái)自YouTube和Facebook,兩家公司都希望人工智能幫助它們控制平臺(tái)上的內(nèi)容(不過(guò)兩家公司也都承認(rèn)現(xiàn)在還沒(méi)有做好準(zhǔn)備)。例如說(shuō),YouTube的數(shù)據(jù)集包含超過(guò)45萬(wàn)小時(shí)帶標(biāo)簽的視頻,公司希望這能夠激發(fā)“視頻理解的創(chuàng)新和進(jìn)步”。參與構(gòu)建此類數(shù)據(jù)集的機(jī)構(gòu)有很多,這也讓我們對(duì)該領(lǐng)域的重要性有了一些了解。谷歌、麻省理工學(xué)院(MIT)、IBM和DeepMind都參與進(jìn)來(lái)并創(chuàng)建了類似的項(xiàng)目。
ICRealtime已經(jīng)在致力于開(kāi)發(fā)面部識(shí)別等高級(jí)工具了。之后,它想要分析屏幕上發(fā)生的情況。Sailor表示他已經(jīng)和教育行業(yè)的未來(lái)顧客進(jìn)行過(guò)交談,對(duì)方希望當(dāng)學(xué)生在學(xué)校遇到麻煩的時(shí)候,監(jiān)控能夠識(shí)別出來(lái)?!氨热缯f(shuō),他們對(duì)于發(fā)生打架的預(yù)先通知這一功能很感興趣?!彼f(shuō)道。所有的系統(tǒng)都需要注意聚集在一起的學(xué)生,之后提醒某個(gè)人,他就可以查看視頻內(nèi)容來(lái)看看發(fā)生了什么或是親自去調(diào)查。
Boulder也在探索這類高級(jí)分析。公司正在開(kāi)發(fā)的一個(gè)原型系統(tǒng)就是分析銀行內(nèi)人們的行為。“我們專門尋找壞人,并且區(qū)分正常人的行為和越界者行為之間的區(qū)別?!監(jiān)dom說(shuō)道。為了做到這一點(diǎn),他們使用舊的安全攝像頭拍攝的影像來(lái)訓(xùn)練系統(tǒng)來(lái)發(fā)現(xiàn)異常行為。但是這種視頻大多低質(zhì),因此他們也會(huì)找一些演員來(lái)拍攝訓(xùn)練視頻片段。Odom沒(méi)有講述具體細(xì)節(jié),但表示這個(gè)系統(tǒng)會(huì)尋找特定的面部表情和行為。“我們的演員會(huì)做一些類似蹲伏、推擠以及回頭撇的動(dòng)作?!彼f(shuō)道。
對(duì)于監(jiān)控和人工智能的專家來(lái)說(shuō),這些功能的引入也面臨潛在的困難(技術(shù)層面和道德層面都有)。和人工智能通常遇到的問(wèn)題一樣,這兩個(gè)類別的問(wèn)題也是緊密相連。這是一個(gè)技術(shù)難題,畢竟機(jī)器始終無(wú)法像人類一樣理解這個(gè)世界。但如果我們假設(shè)它們能夠做到這一點(diǎn)并讓它們?yōu)槲覀冏鰶Q定時(shí),這又成為了一個(gè)道德難題。
卡內(nèi)基。梅隆大學(xué)的教授AlexHauptmann專門從事這類計(jì)算機(jī)分析。他表示盡管人工智能在近些年推動(dòng)了這一領(lǐng)域的快速發(fā)展,但讓計(jì)算機(jī)理解視頻,這依然存在根本性的難題。其中最大的一個(gè)問(wèn)題就是我們通常不會(huì)考慮到的:攝像頭的分辨率。
舉個(gè)例子,一個(gè)神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)訓(xùn)練可以分析視頻內(nèi)人們的行為。這是通過(guò)細(xì)分人類身體——胳膊、腿、肩膀、頭部等,之后觀察這些畫中小人在視頻中從一幀到另一幀的變化。據(jù)此,人工智能可以告知你是否有人在跑步或是梳頭發(fā)?!暗沁@取決于你的視頻分辨率?!盚auptmann在采訪中說(shuō)道,“假設(shè)我看的是停車場(chǎng)盡頭的攝像頭,如果我能分辨出有人是否打開(kāi)車門,那真是萬(wàn)幸了。如果你就站在攝像頭前面彈吉他,那它可以追蹤你的每一根手指?!?/p>
對(duì)閉路電視監(jiān)控來(lái)說(shuō),這也是一個(gè)大問(wèn)題。攝像頭往往會(huì)有顆粒感,角度通常也非常奇怪。Hauptmann舉了一個(gè)便利店內(nèi)要對(duì)準(zhǔn)收銀臺(tái)的攝像頭為例,它也可以俯瞰到面向街道的窗戶。如果外面發(fā)生了搶劫,那么攝像鏡頭就會(huì)被部分擋住,之后人工智能就會(huì)卡住?!暗俏覀冏鳛槿祟悾梢韵胂蟮秸诎l(fā)生的情況并將信息拼湊在一起。計(jì)算機(jī)就做不到這一點(diǎn)?!彼f(shuō)道。
與之類似,盡管人工智能能夠出色識(shí)別視頻中發(fā)生的事情(比如說(shuō)有人在刷牙、看手機(jī)或是踢足球),但它尚不能提取重要背景。拿可以分析人類動(dòng)作的神經(jīng)網(wǎng)絡(luò)為例。它也許能夠在看到鏡頭時(shí)表示出“這個(gè)人在跑步”,但它不能識(shí)別這個(gè)人是否是因?yàn)榭煲s不上汽車或是偷了別人手機(jī)才要跑步。
這些準(zhǔn)確率問(wèn)題讓我們需要認(rèn)真考量一下人工智能初創(chuàng)企業(yè)的聲明。我們還遠(yuǎn)遠(yuǎn)達(dá)不到一種情況——即電腦能夠在看視頻時(shí)獲得和人類一樣的見(jiàn)解。(研究人員會(huì)告訴你這非常困難,相當(dāng)于是“解決”智能難題。)但事情的發(fā)展速度非??臁?/p>
Hauptmann表示車牌跟蹤功能已經(jīng)被采用,而受控設(shè)置下的面部識(shí)別也同樣如此。(使用低質(zhì)閉路電視影像進(jìn)行面部識(shí)別是另一碼事。)識(shí)別像汽車、衣物這類的東西非??孔V,系統(tǒng)也能自動(dòng)追蹤多個(gè)攝像頭內(nèi)的同一個(gè)人,但這也要取決于實(shí)際情況?!霸谝粋€(gè)不擁擠的環(huán)境中追蹤一個(gè)人還是非??孔V的,但在擁擠的環(huán)境中就別想了?!盚auptmann說(shuō)道。他表示如果一個(gè)人穿的是不太顯眼的衣服,那么追蹤起來(lái)也非常困難。
但是,即便是這些非?;A(chǔ)的工具也會(huì)帶來(lái)很大的影響。中國(guó)就發(fā)生了這樣一個(gè)情況。在新疆,傳統(tǒng)的監(jiān)控和民事控制會(huì)結(jié)合面部識(shí)別、車牌掃描儀、虹膜掃描儀以及普遍的閉路電視監(jiān)控來(lái)創(chuàng)造出一個(gè)“全面監(jiān)控的狀態(tài)”。在莫斯科,類似的基礎(chǔ)設(shè)施也正在組建,面部識(shí)別軟件會(huì)被嵌入在一個(gè)集成式系統(tǒng)中,該系統(tǒng)配備了超過(guò)10萬(wàn)臺(tái)高分辨率的攝像頭,覆蓋了整個(gè)城市90%以上的公寓入口。
在這些情況下,可能會(huì)出現(xiàn)一個(gè)良性循環(huán)。隨著軟件變得愈加完善,系統(tǒng)就可以收集到更多的數(shù)據(jù),相應(yīng)地這也會(huì)幫助軟件變得更加出色。“我想這一切都會(huì)進(jìn)步。這一情況也正在發(fā)生?!盚auptmann說(shuō)道。
如果這些系統(tǒng)已經(jīng)在工作了,那么我們就會(huì)碰到類似算法偏見(jiàn)的問(wèn)題。這并不是一個(gè)假設(shè)性的挑戰(zhàn)。研究表明機(jī)器學(xué)習(xí)系統(tǒng)吸收了為其編寫程序的社會(huì)中存在的種族和性別偏見(jiàn)——從總是將女性放置在廚房里的圖像識(shí)別軟件到總是宣傳黑人更可能再次犯罪的司法系統(tǒng)。如果我們使用舊的影像片段去訓(xùn)練人工智能監(jiān)控系統(tǒng),比如說(shuō)閉路電視或是警察佩戴的攝像頭,那么這些存在于社會(huì)之中的偏見(jiàn)就很有可能會(huì)滲透進(jìn)算法內(nèi)。
紐約大學(xué)專攻道德“AINow”研究所的聯(lián)席主任MeredithWhittaker表示執(zhí)法過(guò)程中已經(jīng)出現(xiàn)這一情況了,這也將延伸至私有行業(yè)。Whittaker拿Axon(之前被稱為Taser)為例。該公司收購(gòu)了幾家人工智能企業(yè)來(lái)將視頻分析嵌入到其產(chǎn)品中?!八麄兊玫降臄?shù)據(jù)來(lái)源于警察佩戴的攝像頭,這些數(shù)據(jù)闡明了單個(gè)警察會(huì)關(guān)注哪些人的情況,但它并沒(méi)有告訴我們?nèi)康那闆r?!盬hittaker說(shuō)道,“這就會(huì)帶來(lái)真正的危險(xiǎn),我們正在普及帶有偏見(jiàn)的罪犯圖片?!?/p>
ACLU高級(jí)政策分析師JayStanley表示即便我們可以解決自動(dòng)系統(tǒng)中存在的偏見(jiàn)問(wèn)題,這也不能使得它們就變成良性的。他表示將閉路電視監(jiān)控從消極的觀察者轉(zhuǎn)變?yōu)橹鲃?dòng)觀察者,這給公民社會(huì)會(huì)帶來(lái)巨大的負(fù)面影響。
“我們希望人們不僅僅是獲得自由,還能感受到自由。這意味著它們不需要擔(dān)心一個(gè)未知、看不見(jiàn)的觀眾會(huì)如何解釋或曲解他們的每一個(gè)動(dòng)作和話語(yǔ)。”Stanley說(shuō)道,“要擔(dān)心的問(wèn)題是,人們會(huì)開(kāi)始不斷自我監(jiān)控,擔(dān)心自己做的所有事情都會(huì)被曲解,從而給他們的生活帶來(lái)負(fù)面影響?!?/p>
Stanley也表示不準(zhǔn)確的人工智能監(jiān)控引發(fā)的誤報(bào)會(huì)導(dǎo)致執(zhí)法部門以及公眾之間發(fā)生更危險(xiǎn)的對(duì)抗。想想DanielShaver的槍擊事件吧。Shaver被人看見(jiàn)拿著槍之后,有人打電話報(bào)警,警察來(lái)到旅店。當(dāng)Shaver按照要求趴在地面上時(shí),警長(zhǎng)CharlesLangley槍殺了他。而Shaver被發(fā)現(xiàn)持有的槍其實(shí)是他除蟲(chóng)工作所需要的粒丸槍。
如果人類都可以犯下這樣的錯(cuò)誤,那么計(jì)算機(jī)呢?如果監(jiān)控系統(tǒng)變成了半自動(dòng)化的,那么這樣的錯(cuò)誤是會(huì)更頻繁還是更少見(jiàn)呢?“如果技術(shù)被采用了,那么一定會(huì)有一些警察被迫需要照看這些情況。”Stanley說(shuō)道。
Whittaker表示我們?cè)谶@個(gè)領(lǐng)域看到的情況只是人工智能大趨勢(shì)的一部分。我們使用這些相對(duì)粗糙的工具,試圖基于圖像來(lái)對(duì)人們進(jìn)行分類。她提到了去年發(fā)表的一項(xiàng)具有爭(zhēng)議的研究,該研究聲稱可以通過(guò)面部識(shí)別來(lái)確定性別。人工智能結(jié)果的準(zhǔn)確性值得質(zhì)疑,但是評(píng)論家也指出它是否可行并不重要,重要的是人們是否相信它有用以及是否會(huì)用此數(shù)據(jù)進(jìn)行判斷。
“有一點(diǎn)很困擾我,沒(méi)有任何民主程序讓我們質(zhì)疑它的有效性或是通知大家將會(huì)部署系統(tǒng),許多系統(tǒng)就已經(jīng)被安裝在我們的核心基礎(chǔ)設(shè)施里?!盬hittaker說(shuō)道,“這不過(guò)是算法系統(tǒng)的又一個(gè)例子——算法系統(tǒng)是基于內(nèi)在文化和歷史偏見(jiàn)的數(shù)據(jù)來(lái)識(shí)別特征,據(jù)以分類并確定個(gè)體類型。”
當(dāng)我們向ICRealtime詢問(wèn)關(guān)于人工智能監(jiān)控可能會(huì)如何被濫用的問(wèn)題時(shí),他們給出了一個(gè)在科技行業(yè)常見(jiàn)的回答:這些技術(shù)是價(jià)值中立的,它們被誰(shuí)如何使用決定了技術(shù)的好壞?!叭魏涡录夹g(shù)落入不法分子之手都有可能帶來(lái)危險(xiǎn)。”Sailor說(shuō)道,“任何技術(shù)都是如此…我認(rèn)為在這個(gè)問(wèn)題上,利遠(yuǎn)大于弊?!?/p>