大數(shù)據(jù)滲透人類生活 人工智能時代漸行漸近
文:中國傳動網(wǎng)2018年第一期
21世紀(jì)資源爭奪將由過去的對權(quán)利、房子、人才快速切換到對數(shù)據(jù)的爭奪,誰手頭上掌握了足夠多的有價值的數(shù)據(jù),誰將站在階層分級的金字塔頂端。最近,此種論調(diào)得到了愈來愈多人的認(rèn)可。那么,數(shù)據(jù)是如何服務(wù)于用戶并最終由無序的符號變?yōu)閺?qiáng)勁的生產(chǎn)力的呢?近日,本刊有幸采訪到美國羅切斯特大學(xué)(UniversityofRochester,USA)計(jì)算機(jī)科學(xué)系的羅杰波教授,讓我們一起來了解人工智能與數(shù)據(jù)的關(guān)系及它們最終如何影響著我們的生活。
美國羅切斯特大學(xué)計(jì)算機(jī)科學(xué)系羅杰波教授
大數(shù)據(jù)分析實(shí)例網(wǎng)絡(luò)空間中的用戶移動規(guī)律
首先,用戶行為習(xí)慣分為兩大類,一類是有跡可循的實(shí)際發(fā)生的數(shù)據(jù),比如衣食住行等行為習(xí)慣,而“行”又作為一切行為的引發(fā)點(diǎn),在物理空間中是可以通過分析人流習(xí)慣來規(guī)劃城市,設(shè)計(jì)CBD,策劃商業(yè)模式及行為等等。另一類是網(wǎng)絡(luò)空間的數(shù)據(jù)生活,隨著網(wǎng)絡(luò)生活占據(jù)人類越來越多的時間,商業(yè)行為更多的轉(zhuǎn)移到網(wǎng)絡(luò)世界來已經(jīng)是個不可逆的趨勢,那么如何在網(wǎng)絡(luò)世界中尋找用戶的移動規(guī)律并更好地為用戶提供服務(wù)?這是我們最近在做的一個工作:
研究物理空間中的人的行為、移動規(guī)律,通過手機(jī)及一些記錄地理位置信息的東西可以來研究。比如滴滴,有打車的記錄,可以看看早上人群是怎么流動,然后晚上人群是怎么流動。另外一個例子是春運(yùn),可以通過火車票、飛機(jī)票等來看這個人流的走向,能看出來有很多人是從外地來的,來到比如說深圳、北上廣等城市打工的,那么春節(jié)他們都要回去,然后這些就能看出比如說廣州的人都是哪兒的。這些數(shù)據(jù)對國家的交通、市政規(guī)劃都是有影響的。
網(wǎng)絡(luò)空間中人是怎么流動的呢?從類比的角度去看,我們的地點(diǎn)對象就是各種社交平臺。真實(shí)世界的地點(diǎn)也有公共場所和私密空間,在網(wǎng)絡(luò)空間這個形態(tài)里也能找到同樣的東西。比如微博,就相當(dāng)于一個公共場所,誰都可以去看。再看微信,可能就比較私密。有的東西是開放給所有人的,而有的人就拉個小群,就只開放給某幾個人,講一些比較私密的事情。
我們可以看出一個規(guī)律,發(fā)現(xiàn)一個有意思的事情:網(wǎng)絡(luò)空間的這些模式,跟物理空間很相像。就像物理空間吃飯的地方或者是鍛煉的地方、家在哪里,當(dāng)然你也可以去旅游的地方等等。那么網(wǎng)絡(luò)空間里也有同樣的東西,人每天去那么幾個地方,你可以想象微信是你家似的,你可能去“今日”、“頭條”看看新聞等??梢栽谟邢薜倪@么幾個常去的地方。人在物理空間都會回歸到某個地方,我們發(fā)現(xiàn)人在網(wǎng)絡(luò)空間也是一樣。當(dāng)然你偶然也會出差,或者旅游去其他地方。
所以我們在做的事情就是,把對物理空間的研究方法搬到網(wǎng)絡(luò)空間來,同樣挖掘網(wǎng)絡(luò)空間里人的移動規(guī)律。我們還發(fā)現(xiàn)在網(wǎng)絡(luò)空間里有一個現(xiàn)象,有的人喜歡探索,就會在網(wǎng)上到處看。而網(wǎng)絡(luò)空間比較“宅”的人看的東西比較少,或者很長時間不改變。喜歡探索的人,有兩種,一種是先到處亂看,然后最后選擇幾個點(diǎn);還有一種就是開始不怎么看,然后越看越多,這兩種模式都很有意思。
但一個有趣的地方是:物理空間中,你不可能同時在兩個地方?,F(xiàn)在多了個網(wǎng)絡(luò)空間后,常規(guī)來說你也不能同時在兩個地方。比如說你在網(wǎng)絡(luò)空間里花很多時間,那你在物理空間多半是沒動的。唯一一個特例呢,想象是你在公交車上或是地鐵,這個時候你人也在動,網(wǎng)絡(luò)空間也在動。也可以想象你是一個點(diǎn),你沒動,是公交車在動。這個中間有個矛盾,就是這兩個空間是互補(bǔ)的。我們想知道這些規(guī)律是不是一樣,我們也在研究兩個空間之間的關(guān)聯(lián)性:知道在這個空間人的行為是不是就能預(yù)測到人在另外一個空間的行為?;蛘咧浪F(xiàn)在在這個地方干什么,然后可能在那邊就不可能干什么。隨著研究的深入,成果將對如何去給用戶提供更好的服務(wù)帶來幫助,用途也非常廣泛。
大數(shù)據(jù)分析手段及工具
大數(shù)據(jù)獲取后,需要經(jīng)過分析并從中得出規(guī)律才會轉(zhuǎn)化為有價值的數(shù)據(jù),大數(shù)據(jù)處理常用的方法有統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘方法等。
大數(shù)據(jù)分析傳統(tǒng)的手段是統(tǒng)計(jì),但是統(tǒng)計(jì)不是大數(shù)據(jù)分析,也就是說統(tǒng)計(jì)這個東西存在很多年了,但是從研究開發(fā)的經(jīng)驗(yàn)來看,大數(shù)據(jù)分析光靠統(tǒng)計(jì)是不行的?,F(xiàn)在的通常手段或者我們喜歡用的手段是機(jī)器學(xué)習(xí),或者叫數(shù)據(jù)挖掘,機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘其實(shí)是差不多的,是和統(tǒng)計(jì)不同的一種方法,它基本上是一種學(xué)習(xí)手段,包括有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)等在內(nèi),而且具體要根據(jù)不同的問題采用不同的手段。
大數(shù)據(jù)最常用的機(jī)器分析語言有Python、JAVA。Matlab也會少量應(yīng)用于計(jì)算機(jī)視覺信息挖掘。我個人認(rèn)為Python是一種針對大數(shù)據(jù)分析較好的語言,這是因?yàn)槠涮幚砦淖直容^強(qiáng)。其實(shí)現(xiàn)在大數(shù)據(jù)主要是文字和數(shù)字,當(dāng)然很多大數(shù)據(jù)也有圖像,但是圖像的問題可以通過深度學(xué)習(xí)的方法變成結(jié)構(gòu)化文字或者數(shù)字。深度學(xué)習(xí)大多數(shù)的軟件都是Python寫的。也就是說現(xiàn)在這個階段,做什么樣的大數(shù)據(jù)分析,用Python基本都可以搞定,所以常用的編程語言就是Python。
常用的大數(shù)據(jù)分析軟件不多,目前有一些統(tǒng)計(jì)軟件比如機(jī)器學(xué)習(xí)、深度學(xué)習(xí),五花八門,有的軟件是民間開發(fā)的,有的是一些大企業(yè)開發(fā)的,像谷歌、百度、阿里巴巴等等,而且有不少是開源的。
大數(shù)據(jù)對現(xiàn)有行業(yè)的影響及用戶普遍關(guān)注的安全及隱私問題
社交、消費(fèi)和金融這些都是比較早應(yīng)用大數(shù)據(jù)的行業(yè),不乏成功的案例。我覺得下一步大幅應(yīng)用大數(shù)據(jù)技術(shù)的是安防行業(yè),就是跟維穩(wěn)有關(guān)系的東西,如果你有充足的大數(shù)據(jù),實(shí)際上人的行為是很清楚的。反恐、各種犯罪活動,包括金融犯罪,不一定是刑事犯罪,這些東西都可以去捕捉,這個是從社會安全這個角度來說。另外一個行業(yè)就是醫(yī)療,有人開玩笑說有幾個東西是不靠譜的,比如百度看病,微信養(yǎng)生。但是這個只是說明現(xiàn)在我們的信息很雜,但不是說明這些平臺本身不對,比如說微信,沒準(zhǔn)它真的能夠發(fā)展成為跟養(yǎng)生、健康有關(guān)系的東西。是可以推動的,只是現(xiàn)在沒有做到而已。現(xiàn)在不靠譜是因?yàn)楦鞣N人在里邊把不可靠的消息轉(zhuǎn)來轉(zhuǎn)去。這個是屬于“無政府”的狀態(tài),如果微信或者別的平臺,利用大數(shù)據(jù)來做這個東西是完全有可能的。想像一下,有了大數(shù)據(jù),不僅對一個個體,甚至是對一個群體都有一個更深的了解。凡是想對一個個體或者群體想做的事情都可以做得更好。所以從這點(diǎn)來說大數(shù)據(jù)對現(xiàn)有行業(yè)的影響是顛覆性的。
拿社交方面的典型應(yīng)用微信來說,微信我覺得他做的很成功的就是,它變成一個像家的地方,你可以通過微信去干很多事情,比如說通過微信去打游戲,去支付,去發(fā)紅包甚至像我們做學(xué)術(shù),有人做生意也是這樣做的。微信這個平臺,之所以現(xiàn)在這么熱,主要它是一個提供便利的信息交換的一個平臺。人們可以發(fā)現(xiàn)用這個平臺可以做生活中很多的事情。那么這個平臺所謂的聯(lián)系就很大,很多人都在上面。這個平臺下一步可以做的事情就是,人在微信這個平臺有各種各樣的活動,那么我們可以收集到各種各樣的數(shù)據(jù),可以研究每一個用戶的信息,進(jìn)行用戶畫像,微信就可以推薦各種各樣的產(chǎn)品、服務(wù)、或者社交機(jī)會、甚至是職業(yè)機(jī)會。它實(shí)際上掌握了大量個人的數(shù)據(jù),把越來越多的東西都集成到這個系統(tǒng)中,那么最后基于微信平臺的殺手級應(yīng)用是肯定會出來的。
至于隱私和安全,這是個大問題,但是這個事情我是這樣看的。有的事情你不是說擔(dān)心隱私你就不去做。我覺得很好的例子就是移動支付。很多人一開始包括我都持懷疑態(tài)度。但是現(xiàn)在不是到處都在用嘛,大家好像也沒有覺得這個少了錢多了錢或者是怎樣。你在做的過程中這些供應(yīng)商會想盡辦法去解決隱私保護(hù)和信息保護(hù)這些東西。要不然就不會有用戶。就是說這個需要會推動這個問題的解決方案。所以說不能是因?yàn)楹ε逻@個負(fù)面的東西就不去做這個事情。而是說邊做邊改善。自然會找到隱私保護(hù)和安全保護(hù)的措施。所以說從技術(shù)的角度上,我不擔(dān)心??赡墁F(xiàn)在沒有一些方案,但是這些方案是可以去開發(fā)的。
大數(shù)據(jù)分析正全面影響我們的衣食住行
我們的研究還涉及到多媒體,就是用一些人工智能的手段,用一些大數(shù)據(jù)處理的手段來分析社交多媒體的一些數(shù)據(jù)語言。最后我們就可以改進(jìn)人生活的方方面面。社交多媒體是人工智能的一個很重要、很豐富的一個數(shù)據(jù)語言。
我覺得人在物理空間,他的關(guān)系就是跟別人的關(guān)系、跟物的關(guān)系,當(dāng)然也有跟地點(diǎn)的關(guān)系。如果對一個人的興趣、行為這些方式有越深入了解的話,那就可以提供更好的服務(wù)。物聯(lián)網(wǎng)其實(shí)就是這樣一個概念,生活中的這些器件可以通過網(wǎng)絡(luò)聯(lián)系起來,但這些器件最后都是跟人發(fā)生關(guān)系的,所以對人了解得越多,就越知道這些關(guān)系怎么去安排、怎么樣給人提供最好的產(chǎn)品和服務(wù)。
我們團(tuán)隊(duì)的研究成果觸及了人生活的所有方面,人的生活方面最基本的就是衣食住行,這個我們有涉及,我們更高級的需要除了衣食住行可能就是醫(yī)療,教育,娛樂等。包括可能有些人投資也是一種生活的需要。這些方面的研究其實(shí)我們都在做。
我就一個個說吧,比如說“衣”,我們做過大數(shù)據(jù),從淘寶的大數(shù)據(jù)里面可以用計(jì)算機(jī)視覺和大數(shù)據(jù)分析的方法,分析為什么有的衣服很暢銷,是因?yàn)轭I(lǐng)好,還是扣子好,還是說是顏色,還是花紋。這個我們目前都是自動的。這個在傳統(tǒng)的時裝行業(yè)是人做的。有人不斷的看照片,然后找用戶去問。這些都是非常低效的辦法。網(wǎng)上的衣服五花八門,人的口味和趣味也是五花八門。不用大數(shù)據(jù)的手段,用人去做這個事情基本上是不能應(yīng)付的。
“食”我們也做過。美國超市大都是連鎖式。連鎖店都有會員,會員每次刷卡其實(shí)購物的記錄全部都在上面。那么這點(diǎn)中國也可以,比如以網(wǎng)購的方式來買菜,我們知道你買什么就會吃什么,這樣的話就可以把你的飲食和健康,比如你肥胖、心臟病、糖尿病、眼睛不好等這些點(diǎn)關(guān)聯(lián)起來。最后可以做成你手機(jī)的一個APP,也可以跟超市一起合作,根據(jù)觀察你的飲食情況,我認(rèn)為你缺這個東西,或者你有可能吃太多某種食物,你應(yīng)該改善,你應(yīng)該買這個,這個等于就是把人的飲食健康水平提高。
“住”的話其實(shí)我們也做過。我們通過大數(shù)據(jù)看人住過什么樣的酒店,再看這些住的人都是什么收入,什么文化,什么時候去等。這個時候就可以做一些推薦系統(tǒng),比如說從另外一個地方到深圳來,根據(jù)他的消費(fèi)習(xí)慣,承受能力,推薦一些住店建議。反過來呢,店家知道常來的客人是這樣的,是不是可以提高服務(wù)、設(shè)施、盡量去滿足這類人的需要,或者說這類人不是我想服務(wù)的人,那我可能要進(jìn)行改進(jìn)去吸引另外一類人。
“行”就是酒店可以考慮到季節(jié)性,很多人可能節(jié)后來觀光,可以看出租車,公交車怎么去調(diào)派。這些其實(shí)我們都做過。
醫(yī)療我們做過很多事情,這里時間問題我就不講了。社會教育方面我們也做過,就是把每個學(xué)生和導(dǎo)師進(jìn)行一個關(guān)聯(lián),推薦最適合的導(dǎo)師??偟膩碚f,就是說人的生活的每個方面都可以運(yùn)用大數(shù)據(jù),就是說如果我們對每個人的興趣愛好、性格、情緒情感了解得越多,那么我們就可以提供更好的服務(wù),對社會也能提供更好的幫助。
展望未來“智”生活
十年后的生活跟現(xiàn)在肯定不一樣,二十年后更不一樣。其實(shí)我認(rèn)為都不需要十年,再過五年,我們看來就跟現(xiàn)在不一樣。就拿移動支付來說,當(dāng)然這個移動支付,不是人工智能的問題,他是一個技術(shù)的問題,這個技術(shù)改變了人們的生活習(xí)慣,現(xiàn)在的人大多時候都不用帶現(xiàn)錢了。很容易大家就可以交換服務(wù),交換付費(fèi)這個事情。人工智能也是這樣的,比如機(jī)器人,現(xiàn)在可能還不會做太多的事情,那以后,不僅可以帶你小孩子出去遛彎,而且替你遛狗這件事情在不遠(yuǎn)的將來都能做到。但是這個機(jī)器人遛狗實(shí)際上是需要人工智能的,它要知道怎么走這個路,去到哪,怎么回來,如果這個狗亂跑怎么辦,然后比如狗咬人了或者其他意外發(fā)生時它要怎么辦,所以機(jī)器人要有視覺,要能定位,要能觀察這個狗有什么行為,這個狗和周圍的人有什么交互,這些都是人工智能。為了實(shí)現(xiàn)機(jī)器人遛狗這個事,需要很多的人工智能。我認(rèn)為未來五年內(nèi),就可以實(shí)現(xiàn)機(jī)器人遛狗這個事情。如果我們五年內(nèi)做到這件事,你可以想象很多別的事情,比如說醫(yī)院護(hù)理病人,護(hù)士辛苦是一方面,還有就是如果說病人他不能動了,有的護(hù)士沒這個力氣去搬動,還有搬的時候可能力氣不夠,高度不對,那可能造成對病人的損傷。但是機(jī)器人的話,如果能實(shí)現(xiàn)這些,可以實(shí)現(xiàn)把癱瘓的病人,或者需要我們扶的病人安全地搬來搬去,或者從一個房間走到另一個房間,現(xiàn)在其實(shí)美國已經(jīng)有了這類機(jī)器,這個機(jī)器可以走到床邊。這兩個例子,我認(rèn)為都是可以發(fā)生的,至于發(fā)生的形式是不是跟我們想象的一致倒不見得。比如說這個遛狗的機(jī)器人,是長得像個人,還是有輪子的,有腳的,這些都不重要。重要的是這個機(jī)器人可以遛狗,它具體的形態(tài)我們不容易判斷,但是它的功能是可以預(yù)見的。
未來五年、十年、二十年,我們生活將會很不一樣。人工智能會是很大的因素。正如移動支付這項(xiàng)技術(shù)正在改變著人類的生活,人工智能也會如此,包括機(jī)器人與環(huán)境、人機(jī)之間實(shí)現(xiàn)交互等更為智能化應(yīng)用場景的實(shí)現(xiàn),這些都是需要人工智能技術(shù)來推動。
羅杰波教授簡介
羅杰波教授是IEEE、SPIE和IAPR等國際著名學(xué)會會士(Fellow)。研究涉及圖像處理、計(jì)算機(jī)視覺、自然語言理解,機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘,社交媒體、醫(yī)療影像、輿情分析,用戶畫像,推薦系統(tǒng),智慧城市,普適性計(jì)算等多個前沿領(lǐng)域。羅杰波教授曾于“柯達(dá)實(shí)驗(yàn)室”從事研究長達(dá)十五年,并擔(dān)任該實(shí)驗(yàn)室首席科學(xué)家。羅杰波教授是國際頂級會議ACMMultimedia2010/2018,CVPR2012大會共同主席,并擔(dān)任IEEETransactionsonPAMI、IEEETransactionsonTMM、IEEETransactionsonCSVT、ACMTransactionsonTIST、PatternRecognition等國際頂尖學(xué)術(shù)期刊編委會成員,發(fā)表超過350篇學(xué)術(shù)論文,持有超過90項(xiàng)美國專利。近年來,羅杰波教授在社交多媒體研究及其社會應(yīng)用中做出了開創(chuàng)性貢獻(xiàn)。
中傳動網(wǎng)版權(quán)與免責(zé)聲明:
凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.surachana.com)獨(dú)家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

掃碼關(guān)注小程序
時刻關(guān)注行業(yè)動態(tài)

- 1新年寄語

填寫郵件地址,訂閱更多資訊:
撥打電話咨詢:13751143319 余女士
郵箱:chuandong@chuandong.cn
- 運(yùn)動控制
- 伺服系統(tǒng)
- 機(jī)器視覺
- 機(jī)械傳動
- 編碼器
- 直驅(qū)系統(tǒng)
- 工業(yè)電源
- 電力電子
- 工業(yè)互聯(lián)
- 高壓變頻器
- 中低壓變頻器
- 傳感器
- 人機(jī)界面
- PLC
- 電氣聯(lián)接
- 工業(yè)機(jī)器人
- 低壓電器
- 機(jī)柜