【深度】iPhone7大揭秘:“人工智能大腦”竟藏在蘋果iPhone里

時(shí)間:2016-09-08

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:本文全文編譯自Backchannel編輯StevenLevy的相關(guān)文章《TheiBrainisHere:andit’salreadyinsideyourphone》,在最大程度保留文章原貌的基礎(chǔ)上進(jìn)行了極少數(shù)刪減。本文也是蘋果科技“軟實(shí)力”的一次大匯總,非常有閱讀的價(jià)值。

本文全文編譯自Backchannel編輯StevenLevy的相關(guān)文章《TheiBrainisHere:andit’salreadyinsideyourphone》,在最大程度保留文章原貌的基礎(chǔ)上進(jìn)行了極少數(shù)刪減。本文也是蘋果科技“軟實(shí)力”的一次大匯總,非常有閱讀的價(jià)值。

獨(dú)家內(nèi)部視角看人工智能和機(jī)器學(xué)習(xí)如何改變蘋果

2014年7月30日,Siri做了一次“腦部移植手術(shù)”。

三年前的那個(gè)日子,蘋果成為第一家將智能助手移植到自己系統(tǒng)的主流科技企業(yè)。在更早的日子里,Siri這款在2010年通過收購納入囊中的產(chǎn)品一直以獨(dú)立應(yīng)用程序的形式存在。

剛推出之時(shí),大家對Siri都欣喜若狂,但隨著時(shí)間流逝,用戶卻愈發(fā)對其缺點(diǎn)變得不耐煩,因?yàn)樗?jīng)常性地誤解命令,產(chǎn)品微調(diào)之后也不見提升。

于是,蘋果在那個(gè)7月30日做了一個(gè)重要決定:把美國用戶的Siri語音識別遷移到以“神經(jīng)網(wǎng)絡(luò)”為基礎(chǔ)的新系統(tǒng)中,隨后在8月15日推廣到全世界用戶。

在新系統(tǒng)中,“隱性馬爾可夫模型”等一系列“老”技術(shù)仍在使用,但是更重要的是引入機(jī)器學(xué)習(xí)技術(shù),包括“深度神經(jīng)網(wǎng)絡(luò)(DNN)”、“卷積神經(jīng)網(wǎng)絡(luò)”、“長短期記憶單元”、“門控性電源(gatedrecurrentunits)”、以及“n-grams”。

經(jīng)過這次升級,Siri雖然看起來仍然一樣,但是卻得到了深度學(xué)習(xí)的強(qiáng)力buff。

為了不讓自己的競爭對手從Siri上獲得啟發(fā),蘋果再次采取了高度保密的策略。而用戶最多也只能體會(huì)到Siri犯的錯(cuò)越來越少了。直到最近的揭秘,蘋果才公開談?wù)撈甬?dāng)時(shí)的效果——準(zhǔn)確率的提升幅度是驚人的。

蘋果高級互聯(lián)網(wǎng)軟件及服務(wù)副總裁EddyCue

EddyCue表示:“這次提升非常明顯,以至于有人專門核對了一次準(zhǔn)確率的數(shù)字,以免不小心漏掉了小數(shù)點(diǎn)。(提升了至少一位數(shù))”

Siri這次的“華麗變身”,也讓人工智能業(yè)界“驚訝”,但不是因?yàn)樗麄兊某煽?,更多的是因?yàn)樘O果如此低調(diào),但又能如此出色的完成這個(gè)任務(wù)。

即便蘋果最近在人工智能領(lǐng)域加大了人才的招聘力度,也做了一些高調(diào)的創(chuàng)業(yè)公司收購,大多數(shù)人還是將蘋果視為這個(gè)火熱領(lǐng)域的落后者。同時(shí)又因?yàn)樘O果的高度保密,讓人工智能相應(yīng)的專家也不清楚他們在機(jī)器學(xué)習(xí)相關(guān)進(jìn)展。正如斯坦福人工智能歷史課程講師JerryKaplan所說:

蘋果并沒有在人工智能社區(qū)中出現(xiàn),有點(diǎn)像人工智能領(lǐng)域的NSA(美國國家安全局)。

相比之下,其他硅谷獨(dú)角獸Google和Facebook在人工智能領(lǐng)域的努力,則更容易為外界所捕獲,并且傳播開來。

當(dāng)然也有人會(huì)持有反對意見,來自AllenAI研究所的OrenEtzioni算一個(gè):

Google、Facebook、微軟里都有頂尖的機(jī)器學(xué)習(xí)人才。而蘋果的確也聘用了一些人工智能方面的人才,但是公認(rèn)的機(jī)器學(xué)習(xí)5位領(lǐng)袖都不在內(nèi)。

而且即便蘋果已經(jīng)用人工智能實(shí)現(xiàn)了語音的識別能力,但是接下來蘋果會(huì)將機(jī)器學(xué)習(xí)加入到什么功能之中?這仍然是個(gè)謎。

不過這個(gè)也不怪OrenEtzioni,這個(gè)月早些時(shí)候,蘋果秘密地展示了他們產(chǎn)品應(yīng)用機(jī)器學(xué)習(xí)技術(shù)的進(jìn)展,可惜對象不是他,而是我。

在好幾位蘋果高管(包括上文提到的EddyCue、高級全球市場副總裁PhilSchiller、高級軟件工程副總裁CraigFederighi,后兩者一直也被視為蘋果人工智能方面的關(guān)鍵性科學(xué)家)的陪同下,我在蘋果庫比提諾的飛船總部里面花了幾乎一整天,完整地了解機(jī)器學(xué)習(xí)在蘋果應(yīng)用中目前以及未來的應(yīng)用情況。

當(dāng)我們坐下之后,他們就遞給我了一份兩頁而且“滿滿當(dāng)當(dāng)”的日程列表,上面全是機(jī)器學(xué)習(xí)在蘋果產(chǎn)品和服務(wù)中的應(yīng)用,除了已經(jīng)實(shí)現(xiàn)、甚至還包括了他們即將討論的項(xiàng)目。

從這份列表中,你還能比較容易地提取出一個(gè)核心信息:

蘋果已經(jīng)進(jìn)入了人工智能領(lǐng)域,而且絕不甘心成為“第二”這樣的角色,還將會(huì)采用一條不同于別人的路徑。

擁有iPhone的人看起來都是蘋果人工智能技術(shù)的直接受益者,但實(shí)際上不僅僅是因?yàn)镾iri能夠很準(zhǔn)確的理解你在問它什么。哪怕有人最近只是郵件了你,他都會(huì)出現(xiàn)在“最近聯(lián)系人”之列;側(cè)滑之后出現(xiàn)的“你接下來最可能打開的應(yīng)用”列表;提醒你在“提醒事項(xiàng)”中標(biāo)記了、但又沒有放進(jìn)日程表的約會(huì);在你輸入全名之前將你已經(jīng)預(yù)定了的酒店地點(diǎn)推送出來;甚至是在你沒有詢問的情況下直接把停車地點(diǎn)指示給你。

以上這些例子都跟深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)有關(guān)系,有些是因此變得可能,其他至少也得到了大幅度的增強(qiáng)。

沒錯(cuò),一顆真正的“蘋果大腦”——就藏在你的手機(jī)里。

臉部識別?蘋果借助其神經(jīng)網(wǎng)絡(luò)技術(shù),加入了混戰(zhàn)

根據(jù)我拿到的簡介來看,機(jī)器學(xué)習(xí)已經(jīng)滲透到蘋果產(chǎn)品和服務(wù)的每個(gè)角落。比如蘋果使用深度學(xué)習(xí)來檢測AppStore騙保行為,延長所有設(shè)備的電池壽命,從成千上萬份beta版報(bào)告中發(fā)現(xiàn)最有價(jià)值的用戶反饋。

而機(jī)器學(xué)習(xí)則讓蘋果能夠選擇適合你的新聞;也能讓AppleWatch分辨出你究竟是在鍛煉還是在閑逛;它能變成出你圖片中的面孔和地點(diǎn);在Wi-Fi信號比較弱的情況下是否要轉(zhuǎn)換到移動(dòng)網(wǎng)絡(luò);它甚至能化身為一名優(yōu)秀“電影制作人”,輕輕點(diǎn)擊一下就能快速地把你的照片還有影像片段拼合到一起。

蘋果的競爭者也在做著類似的東西,但是可以確定的是,在保護(hù)隱私這件事蘋果絕對是把人工智能技術(shù)用到了“極致”(這里指的是差分隱私技術(shù),點(diǎn)擊查看愛范兒相關(guān)報(bào)道)。當(dāng)然,他們也并沒有打造出像蘋果的產(chǎn)品。

而且人工智能對于蘋果來說不算“新東西”,早在1990年代,蘋果已經(jīng)開始使用機(jī)器學(xué)習(xí)技術(shù)開發(fā)筆記識別程序(Newton平板)。這個(gè)研究成果在目前的蘋果產(chǎn)品上依舊有用,這也是為什么蘋果能很好地識別你的“狂草”。這跟蘋果一直都設(shè)有專門的機(jī)器學(xué)習(xí)團(tuán)隊(duì)也有關(guān)系。

早期的機(jī)器學(xué)習(xí)非常原始,深度學(xué)習(xí)更一直被視為一個(gè)夢想,與現(xiàn)在成為“潮流”的情況相差甚遠(yuǎn)。但是蘋果被套上了“落后者”形象這件事直接導(dǎo)致了TimCook最近專門站出來發(fā)話,表示蘋果其實(shí)一直都在人工智能領(lǐng)域,只不過沒有專門去宣傳而已。連帶著讓一大批蘋果高層最近也開展了宣傳攻勢。

AppleWatch上面的減肥應(yīng)用,也有機(jī)器學(xué)習(xí)技術(shù)的加成

在蘋果高級全球市場副總裁PhilSchiller看來:

人工智能最近5年為蘋果帶來的增長大家有目共睹,我們設(shè)備智能化的速度變得更快,特別是在蘋果自己設(shè)計(jì)的一系列芯片幫助下。我們的設(shè)備變得更智能、更快,而我們所做的每一件事情,實(shí)際上都是為了讓事物能夠更好的鏈接到一起。

而更強(qiáng)大的硬件也讓我們能夠運(yùn)用越來越多的機(jī)器學(xué)習(xí)技巧,因?yàn)樗麄兲峁┝朔浅6嗟臇|西給我們進(jìn)行學(xué)習(xí)。

雖然蘋果已經(jīng)選擇了“擁抱”機(jī)器學(xué)習(xí),但是他們并沒有放棄基礎(chǔ)原則。在這群庫比提諾的先鋒者們眼里,深度學(xué)習(xí)和機(jī)器學(xué)習(xí)只是不斷出現(xiàn)的新技術(shù)之流中最新的那幾個(gè)。

它們擁有改變事物的能力,但并不一定超過一些其他技術(shù)優(yōu)勢,比如觸屏、平板電腦、面向?qū)ο蟮木幊碳夹g(shù)等。在蘋果眼里,機(jī)器并非其他公司口中的“人機(jī)交互終極目標(biāo)”。EddyCue對此就曾表示:

這并不會(huì)摧毀這么多年以來建立的人機(jī)交互方式。

除此之外,我們還談?wù)摰搅艘恍┐蠹曳浅jP(guān)心的話題:蘋果對于機(jī)器是否將取代人類沒有興趣;不確認(rèn)蘋果是否會(huì)制造無人駕駛汽車;甚至是打造蘋果自己版本的Netflix;承諾蘋果不會(huì)打造終結(jié)人類的“天網(wǎng)”等等。

PhilSchiller還單獨(dú)做了一個(gè)小總結(jié):

我們將利用這些技術(shù),從而比之前更好地做我們想要做的東西,或者完成一些我們之前無法做到的事。最終以非常蘋果的方式打造我們的產(chǎn)品。

他們隨后還拓展解釋了一下上述觀點(diǎn),內(nèi)容主要集中在兩個(gè)方面,一個(gè)是人工智能究竟從何種程度改變了蘋果目前的生態(tài)系統(tǒng)。

第二個(gè)是蘋果為什么出于用戶隱私保護(hù)的目的,干掉普通的信息收集引擎(要知道,大量的數(shù)據(jù)可以會(huì)極大的改善神經(jīng)網(wǎng)絡(luò)的能力),從而確保用戶的數(shù)據(jù)不會(huì)被其他人濫用。很明顯,蘋果已經(jīng)有了跨越這兩個(gè)“障礙”的方法。

那么這個(gè)“蘋果大腦”究竟有多大呢?怎樣才能驅(qū)動(dòng)iPhone之上的機(jī)器學(xué)習(xí)能力呢?而蘋果官方透露出來的大小是200MB左右,這個(gè)大小會(huì)隨著用戶保存的個(gè)人信息的多少而改變。這其中包括了應(yīng)用使用頻率、跟別人的交互、神經(jīng)網(wǎng)絡(luò)處理、語音識別模型、以及“自然語言模型”。

當(dāng)然,它還包括了用神經(jīng)網(wǎng)絡(luò)加成的對象識別,臉部識別以及場景分辨。

因?yàn)樗行聭?yīng)用的大前提,都是用戶的偏好以及經(jīng)歷等隱私不被公開。

盡管蘋果沒有把他們在AI方面的努力攤開來講,但我設(shè)法弄明白了他們怎么在組織里分配機(jī)器學(xué)習(xí)的專業(yè)知識。公司可以共享這些機(jī)器學(xué)習(xí)方面的人才,提供給那些用機(jī)器學(xué)習(xí)來解決問題并且開發(fā)個(gè)人方面產(chǎn)品的產(chǎn)品團(tuán)隊(duì)。CraigFederighi對此解釋到:

機(jī)器學(xué)習(xí)的最高境界就是不要有一個(gè)集中的組織。我們試著把它和需要用來交付正確用戶體驗(yàn)的團(tuán)隊(duì)拉近距離。

那么蘋果有多少人在做機(jī)器學(xué)習(xí)方面工作?Federighi在再三催促下給出的答案只是兩個(gè)字“很多”。(如果你以為他可能會(huì)給我那個(gè)數(shù)字,那就是你不了解蘋果了。)有意思的是,蘋果很多從事機(jī)器學(xué)習(xí)的員工在加入之前都沒有受過人工智能的教學(xué)?!拔覀児蛡虻倪@些人在數(shù)學(xué)、統(tǒng)計(jì)數(shù)據(jù)、編程語言、密碼學(xué)這些基礎(chǔ)領(lǐng)域有特長。”Federighi接下來也解釋了這種現(xiàn)象的原因:這些其他方向的核心天才可以完美的轉(zhuǎn)換到機(jī)器學(xué)習(xí)領(lǐng)域,雖然我們當(dāng)下還在繼續(xù)招聘機(jī)器學(xué)習(xí)的專業(yè)人才,但是我們一直在繼續(xù)尋找有核心能力和天賦的人。

我們并沒有設(shè)立一個(gè)單獨(dú)、中心化的組織,來充當(dāng)蘋果機(jī)器學(xué)習(xí)“殿堂”。

左前方的蘋果高級軟件工程副總裁CraigFederighi正在聽Siri項(xiàng)目資深指導(dǎo)AlexAcero在蘋果總部談?wù)撜Z音識別軟件。盡管Federighi沒有說,但是我覺得這種說法的確存在:蘋果一直強(qiáng)調(diào)保密,而行業(yè)內(nèi)的其他公司卻鼓勵(lì)自己的工程師向外界分享研究成果,這種模式不利于蘋果保持競爭優(yōu)勢。Federighi對于蘋果和別的公司的做法還做了一個(gè)“分類”:

我們的做法也讓程序員間的自然選擇被強(qiáng)化——一種喜歡通過團(tuán)隊(duì)合作,從而打造出一個(gè)偉大的產(chǎn)品;另外一種只是打算將自己的技術(shù)展示出來。

如果科學(xué)家在提升蘋果產(chǎn)品的過程中能夠發(fā)現(xiàn)突破,這自然很好?!暗覀儗?shí)際上是抱著對最終目標(biāo)的幻想在前行”Cue補(bǔ)充了一句。

蘋果人工智能領(lǐng)域里的人才很多都是通過收購的方式進(jìn)來的。Cue給出了一個(gè)比較“夸張”的數(shù)據(jù):

我們最近收購了二三十家相對較小的公司,同時(shí)雇傭了這些員工。

Federighi還補(bǔ)充了一個(gè)非常重要的“收購思路”:當(dāng)蘋果收購AI公司的時(shí)候,并不是說“嘿,這兒有很多機(jī)器學(xué)習(xí)的研究人員,我們來設(shè)立一個(gè)部門吧!我們要的是那些有天賦并且真正專注于提供卓越經(jīng)驗(yàn)的人。

蘋果最近以2億美元的報(bào)價(jià)收購了西雅圖的Turi公司。這家公司開發(fā)了一個(gè)可以和GoogleTensorFlow一較高下的工具包,這次收購引發(fā)業(yè)界猜測——蘋果有可能會(huì)在系統(tǒng)內(nèi)部和開發(fā)者方面提供與Google相似的目的,在場的幾位高管均對這件事不予置評。Cue則表示:

無論從科技的視角還是個(gè)人觀點(diǎn)來看,Turi都有很多和蘋果相符的地方。也許一兩年后,我們就可以弄清楚到底發(fā)生了什么,就像當(dāng)初Cue(蘋果在2013年收購的小型初創(chuàng)公司,非上文提到的EddyCue)在Siri上展示的預(yù)測能力。

無論人才從哪兒來的,蘋果的人工智能基礎(chǔ)已經(jīng)能夠讓之前那些產(chǎn)品和技術(shù)上的不可能,重新變?yōu)榭赡?。進(jìn)而改變了公司的發(fā)展藍(lán)圖。Schiller的話就算一個(gè)小小的透露:

在蘋果,每天都有很酷的點(diǎn)子。機(jī)器學(xué)習(xí)讓我們能夠解決之前“不可能”的問題,并且已經(jīng)規(guī)劃進(jìn)了我們接下來打算做的事情當(dāng)中。

其中一個(gè)例子就是在iPadPro上使用的蘋果觸控筆。為了讓蘋果把高科技觸控筆列入產(chǎn)品中,不得不解決掉人們在電子設(shè)備上寫字,手會(huì)不小心觸碰到屏幕,從而導(dǎo)致各種字符混亂的問題。

使用機(jī)器學(xué)習(xí)模型“手掌誤觸”,可以有效的提高屏幕傳感器區(qū)別擦碰、觸摸和筆尖的精確度。

“如果它不能穩(wěn)定的運(yùn)行,那這就不是一張可供書寫的紙,觸控筆也沒啥用。”Federighi說道。

如果你喜歡蘋果觸控筆,那就感謝機(jī)器學(xué)習(xí)吧。

也許蘋果到現(xiàn)在為止,機(jī)器學(xué)習(xí)方面最好的進(jìn)步方法,就是從它最重要的人工智能產(chǎn)品——Siri那里獲得的。

Siri起源于一個(gè)雄心勃勃的項(xiàng)目DARPA的智能助手,不久后,就有幾個(gè)科學(xué)家組建了一個(gè)公司,打算用這種技術(shù)來打造一個(gè)app。

在2010年SteveJobs親自說服了創(chuàng)始人把它賣給了蘋果。Siri直接被構(gòu)建進(jìn)了操作系統(tǒng)中,并成為了2011年10月iPhone4S發(fā)布會(huì)的重頭戲。而現(xiàn)在,它完完全全可以應(yīng)用在實(shí)際中。當(dāng)用戶長按Home鍵或是簡單的說一句“Hey,Siri。”就可以使用(iPhone有個(gè)特性,能讓其中一個(gè)收音器始終打開又不會(huì)費(fèi)電)。Siri無論在它工作時(shí)還是沉默時(shí)都和AppleBrain是一個(gè)整體。就核心產(chǎn)品而言,Cue用了產(chǎn)品的四個(gè)組件來說明:語音識別(理解你在和它說話),自然語言理解能力(掌握并理解你所說的話),執(zhí)行(實(shí)現(xiàn)你的詢問和要求),回答(回應(yīng)你)?!皺C(jī)器學(xué)習(xí)影響了這些極其重要的方面”。Cue說道。

Siri高級研發(fā)負(fù)責(zé)人TomGruber(上)、以及Siri語音大師AlexAcero(下)TomGruber在2011年其中一個(gè)創(chuàng)始人離開后加入了蘋果,提到在蘋果給Siri使用應(yīng)用神經(jīng)網(wǎng)絡(luò)之前,其用戶群就提供了大量數(shù)據(jù),這對于鍛煉這個(gè)神經(jīng)網(wǎng)絡(luò)很重要。

Steve曾說過,你會(huì)一夜之間從一個(gè)不知名的app一躍擁有一億用戶,并且無需公測。用戶會(huì)告訴你他們是怎么和你的app對話,這就是第一次革命,接著,應(yīng)用神經(jīng)網(wǎng)絡(luò)就來了。Siri從最初的應(yīng)用神經(jīng)網(wǎng)絡(luò)到現(xiàn)在能夠應(yīng)對用戶的各種要求,全靠語音識別團(tuán)隊(duì)的高管AlexAcero等幾位AI專家。90年代早期,Acero就開始了在蘋果語音識別團(tuán)隊(duì)的生涯,然后又去了微軟研究院。

“我喜歡那里的日子,我還發(fā)表了很多論文,”他說道“但是當(dāng)Siri面世的時(shí)候,我覺得這就是一個(gè)把應(yīng)用神經(jīng)網(wǎng)絡(luò)得以實(shí)現(xiàn)的好機(jī)會(huì)??!不是僅僅讓一百個(gè)人知道,而是要讓一百萬個(gè)人用到?!睋Q句話來說,這就是蘋果一直需要的科學(xué)家,熱衷于研發(fā)產(chǎn)品而不是發(fā)表論文。

機(jī)器學(xué)習(xí)非常顯著的、從多個(gè)方面對Siri造成了沖擊

在Acero三年前加入蘋果那時(shí),Siri的語音技術(shù)實(shí)際上還主要是來自第三方的協(xié)議授權(quán),這注定要做出改變。Federighi還注意到這實(shí)際上是蘋果不斷重復(fù)的模式:

當(dāng)這個(gè)技術(shù)成為決定我們能否做出好產(chǎn)品的關(guān)鍵技術(shù),我們就會(huì)建立自己的內(nèi)嵌功能然后實(shí)現(xiàn)我們想要的效果。但如果想要讓它變得完美,我們必須自己擁有技術(shù)并且不斷創(chuàng)新,語音技術(shù)就是我們采納一個(gè)東西,并且最終實(shí)現(xiàn)落地的最好例子。

蘋果團(tuán)隊(duì)第一步選擇了用神經(jīng)網(wǎng)絡(luò)代替Siri原有的底層,“我們有一個(gè)不停運(yùn)轉(zhuǎn)的大型GPU集群,最終我們得到了大量的數(shù)據(jù)”Acero透露到。2014年7月的發(fā)布證明這些循環(huán)性學(xué)習(xí)并沒有白費(fèi)。

“在絕大多數(shù)語言中,錯(cuò)誤率都實(shí)現(xiàn)了減半,有些情況下效果還會(huì)更好。這主要是因?yàn)樯疃葘W(xué)習(xí)技術(shù)以及我們的優(yōu)化方式——不僅僅是算法本身,最重要是整個(gè)系統(tǒng)中內(nèi)容的傳遞。”

這種內(nèi)容的上傳通常意味著泄密。蘋果也不是第一家將DNN技術(shù)使用在語音識別上的公司,但是蘋果證明了它在控制整個(gè)傳輸系統(tǒng)這件事上,有著先天的優(yōu)勢。

這首先就是因?yàn)樘O果一直自己生產(chǎn)自己的硬件芯片,Acero甚至表示這讓他能夠直接和芯片設(shè)計(jì)團(tuán)隊(duì)以及芯片固件工程師進(jìn)行編程,讓神經(jīng)網(wǎng)絡(luò)的效能最大化。Siri團(tuán)隊(duì)的需求甚至還影響了iPhone設(shè)計(jì)中的其他很多方面。

“當(dāng)然,這不僅僅是芯片。設(shè)備上設(shè)置多少個(gè)麥克風(fēng)、麥克風(fēng)應(yīng)該如何放置、如何調(diào)整硬件、處理音頻的底層軟件,這些組件都需要進(jìn)行協(xié)調(diào)。對比一些只是開發(fā)軟件的公司,這個(gè)優(yōu)勢實(shí)在領(lǐng)先太多?!?/p>

另外一方面:當(dāng)蘋果的神經(jīng)網(wǎng)絡(luò)能夠在一款產(chǎn)品中運(yùn)行起來,它還能夠作為其他用途中的核心技術(shù)。最終結(jié)果是,機(jī)器學(xué)習(xí)讓Siri理解你,并且將輸入方式從鍵入變成了聽寫。

比如在你寫信息和郵件的時(shí)候,點(diǎn)擊麥克風(fēng)按鈕、然后直接說,的確比跟軟鍵盤較勁容易得多。

另外一個(gè)Cue提到的SIri組成是自然語言理解。2014年11月起,Siri開始使用機(jī)器學(xué)習(xí)來理解用戶輸入的內(nèi)容,而更進(jìn)一步基于深度學(xué)習(xí)的版本也在一年之后推出。

就像之前在語音識別上做的那樣,機(jī)器學(xué)習(xí)也提升了用戶的體驗(yàn),尤其是在更靈活地理解用戶命令。

Cue為此專門拿出了自己的iPhone現(xiàn)場演示了一個(gè)例子,在調(diào)用Siri之后,他分別發(fā)出了“用Square現(xiàn)金給Jane發(fā)20美元(SendJanetwentydollarswithSquareCash)”、“直接給我妻子發(fā)20美元(Shoottwentybuckstomywife)”,最終的得到的結(jié)果完全一樣。

蘋果最近還表示,如果沒有Siri帶來的這些而便利,它們不太可能迭代出現(xiàn)有這個(gè)在語音控制方面如此復(fù)雜的AppleTV。

盡管早期的Siri強(qiáng)迫你使用一個(gè)相對固定的方式說話,但是被深度學(xué)習(xí)加成之后的超級版本不僅能夠區(qū)分一堆電影和音樂中的特殊選項(xiàng)。甚至還能處理一些模糊的概念:“我想看TomHanks主演的驚悚片(如果Siri足夠聰明,它最終推薦的應(yīng)該是《達(dá)芬奇密碼》)”,在深度學(xué)習(xí)技術(shù)誕生之前,想要實(shí)現(xiàn)這樣的效果就是做白日夢。

借助今年秋天即將發(fā)布的iOS10系統(tǒng),Siri的聲音成為了機(jī)器學(xué)習(xí)改良的最后一個(gè)部分。同樣的,這個(gè)改變也是用神經(jīng)網(wǎng)絡(luò)直接代替了之前的第三方授權(quán)技術(shù)。

本質(zhì)上來說,Siri的發(fā)聲還是依靠一個(gè)采集了很多聲音的大數(shù)據(jù)庫,通過把句子打散成詞匯,再將詞匯的語音像堆積木一樣拼在一起。而機(jī)器學(xué)習(xí)所扮演的角色,則是讓單詞之間更加流暢,從而讓Siri的聲音更加像真人。

Acero同樣也做了一個(gè)演示——分別讓Siri閱讀兩段一致的內(nèi)容,第一個(gè)有著我們非常熟悉的“機(jī)器感”,而另外一個(gè)則非常流暢。而他所說的原因也非常簡單:“深度學(xué)習(xí)”。

雖然看起來這是一個(gè)很小的不起眼的細(xì)節(jié),但Siri有一副更加自然的嗓音實(shí)際上能夠催生出大變化。Gruber說了下其中的差別:

音頻只要更加高質(zhì)量一點(diǎn),用戶們就會(huì)更加信任它。同時(shí)更好的語音也會(huì)引入用戶,并且讓用戶對Siri的使用率更高。

當(dāng)蘋果最終將Siri對開發(fā)者開放,人們使用Siri的意愿,以及機(jī)器學(xué)習(xí)所帶來的提升就變得更加重要了。對蘋果批評者的意見進(jìn)行處理是一個(gè)非常長期的過程。

也有很多人指出,蘋果的第三方伙伴數(shù)量停留在了兩位數(shù),與亞馬遜類似的Alexa擁有的、由外部開發(fā)者提供的超過1000種“技巧”相比,數(shù)量相差甚遠(yuǎn)。

蘋果的回復(fù)則指出這樣的對比并沒有意義,因?yàn)樵趤嗰R遜產(chǎn)品上用戶必須使用特定的語言去使用功能。而諸如SquareCash、Uber這樣應(yīng)用通過Siri來使用也更加自然。

與此同時(shí),Siri的改變也給蘋果產(chǎn)品以及用戶帶來了一些改變:用戶得到的是新功能以及完成相同任務(wù)的更多方式;而Siri服務(wù)的請求次數(shù)也在不斷上漲。

對于不斷拓展機(jī)器學(xué)習(xí)的蘋果來說,最大的問題在于如何在成功的同時(shí)堅(jiān)持其原有的隱私證詞。蘋果加密了用戶的信息,這樣沒有任何人、哪怕是蘋果自己的律師也不能查看用戶數(shù)據(jù)(記得之前吃癟的FBI嘛?)蘋果還專門表示:不會(huì)將收集的用戶數(shù)據(jù)用于廣告目的。

在用戶的角度這也許是值得尊敬的,但這對于吸引頂尖的人工智能人才沒有幫助。

所有機(jī)器學(xué)習(xí)的專家,都希望能夠擁有一大堆數(shù)據(jù)。但是因?yàn)殡[私政策,蘋果一直不愿使用這些數(shù)據(jù)。這種做法是否合理仍需進(jìn)一步討論,但這確實(shí)讓蘋果一直被人看做人工智能世界中的局外人。

這種有普遍代表性的觀點(diǎn),換回來的卻是蘋果高層的激烈抗議。他們認(rèn)為在不保存用戶存檔的前提下,為機(jī)器學(xué)習(xí)提供所有所需文件,甚至將用戶行為的實(shí)例保存下來訓(xùn)練神經(jīng)網(wǎng)絡(luò)都是可能的。Federighi補(bǔ)充到:

這一塊一直存在錯(cuò)誤的敘述和權(quán)衡,大家認(rèn)為我們是保護(hù)用戶隱私的異類其實(shí)是一件好事,但是為了讓絕大多數(shù)用戶的利益,我們愿意給行業(yè)中的其他人指出一條發(fā)展之路。

我們已經(jīng)找到了獲取我們需要的數(shù)據(jù),同時(shí)又能保護(hù)用戶隱私的方法。

這里有兩個(gè)關(guān)鍵問題,第一個(gè)涉及個(gè)人信息在機(jī)器學(xué)習(xí)基礎(chǔ)系統(tǒng)中的處理,當(dāng)用戶的詳細(xì)信息被神經(jīng)網(wǎng)絡(luò)所收集,那么最終我們能得到什么資料呢?

第二個(gè)問題涉及到為了訓(xùn)練神經(jīng)網(wǎng)絡(luò)和識別規(guī)律之時(shí)的信息聚集分類,你怎樣在保證群體數(shù)據(jù)的同時(shí)剔除個(gè)人信息?蘋果其實(shí)有同時(shí)解決兩者的方法,Cue表示:

有的人認(rèn)為我們不能用人工智能來做這些數(shù)據(jù)分析,因?yàn)槲覀儾⒉粨碛羞@些數(shù)據(jù),但是我們已經(jīng)找到了方法,在獲取信息的同時(shí)保持隱私屬性。這也是我們的底線。

首先是第一個(gè)問題——保護(hù)被神經(jīng)網(wǎng)絡(luò)識別的個(gè)人喜好和信息,解決方法在于用更加獨(dú)特的方法來控制軟硬件。簡單一點(diǎn)的解釋就是,最為私人的東西會(huì)停留在蘋果大腦之內(nèi),“我們將最敏感的信息保存在能夠執(zhí)行ML的本地”。

舉個(gè)例子來說,右滑之后出現(xiàn)的應(yīng)用列表。在設(shè)計(jì)中,這個(gè)位置需要顯示你接下來最可能打開的幾個(gè)應(yīng)用。這些預(yù)測基于一系列因素,很多都涉及到用戶行為本身,這對于其他用戶來說并沒有意義,蘋果的處理方法就是直接在手機(jī)本地處理需求。

最終功能的效果也非常明顯,預(yù)測用戶接下來用什么應(yīng)用基本能夠達(dá)到90%的準(zhǔn)確率。

蘋果在設(shè)備上保存的其他個(gè)人信息主要是——用戶使用iPhone輸入法鍵入的內(nèi)容。通過利用神經(jīng)網(wǎng)絡(luò)系統(tǒng)分析你的輸入,蘋果可以能夠發(fā)現(xiàn)關(guān)鍵性的時(shí)間和物品,比如航班信息,聯(lián)系方式,甚至是約會(huì)——但是信息本身只會(huì)停留在你自己的手機(jī)當(dāng)中。

即便部分信息會(huì)存儲(chǔ)在蘋果的云中,也會(huì)通過特定處理,讓這些存儲(chǔ)的信息無法反向還原“蘋果公司不需要知道你的愛好,或者你什么時(shí)候打算去哪里玩”。

蘋果也在盡量減少保存的信息量,對此Federighi也提到了一個(gè)例子:如果你的一段對話中有一部分需要進(jìn)行搜索,其他公司必須將整段對話上傳到云端進(jìn)行分析,而蘋果設(shè)備能夠在數(shù)據(jù)不離開設(shè)備的條件下檢測出關(guān)鍵信息——這是因?yàn)槭謾C(jī)會(huì)將這些信息與手機(jī)內(nèi)的“知識庫”進(jìn)行匹配。

它很精簡,但是是一個(gè)綜合性知識庫,包括了成千上萬的定位和對象。我們之所以采用本地化的策略,是因?yàn)槲覀冎滥阍谀睦铩?/p>

Federighi還透露,這個(gè)知識庫其實(shí)與所有的蘋果應(yīng)用都有相連,包括我們用的搜索欄、地圖、甚至是瀏覽器,可以幫助用戶實(shí)現(xiàn)自動(dòng)糾錯(cuò)。

它其實(shí)一直在iPhone后臺(tái),保持著工作狀態(tài)。

接下來的問題就是機(jī)器學(xué)習(xí)的循環(huán)問題:究竟蘋果的隱私政策是否真的影響到了它的神經(jīng)網(wǎng)絡(luò)算法?因?yàn)橥ǔ碚f,神經(jīng)網(wǎng)絡(luò)都需要大量的數(shù)據(jù)來高效訓(xùn)練網(wǎng)絡(luò)的準(zhǔn)確度,但是蘋果并沒有放開使用所有用戶的行為,那他們又怎么能夠了解用戶呢?

就像很多其他公司一樣,蘋果也是有利用一些公開的信息庫來訓(xùn)練他們的神經(jīng)網(wǎng)絡(luò),但是有些時(shí)候的確需要更加及時(shí)、更加特定的信息,這些智能從用戶的數(shù)據(jù)中來。

而蘋果的做法是——從用戶那里拿數(shù)據(jù),但是又確保自己不知道這些數(shù)據(jù)對應(yīng)的用戶是誰。之前的做法是,完全讓數(shù)據(jù)匿名,然后以完全獨(dú)立于AppleID的另外一套系統(tǒng)來標(biāo)識他們。(另外一套系統(tǒng)和AppleID之間的關(guān)系只有蘋果知道)

進(jìn)入iOS10時(shí)代之后,蘋果更采用了一種全新的技術(shù):差分隱私。能夠在向大眾收集數(shù)據(jù)的同時(shí)完全不去辨識區(qū)分個(gè)體。

這方面的應(yīng)用例子就好像蘋果向你展示最近的時(shí)髦詞匯,但是他們并不在之前所提到的知識庫甚至是輸入法的詞典當(dāng)中;還有突然因?yàn)樵絹碓蕉嘣儐柖案〕霰砻妗钡逆溄?;或者單個(gè)emoji表情的使用頻率增加。

完成這些事的傳統(tǒng)方式是把所有信息,比如你輸入的所有字詞,上傳到服務(wù)器短,然后由他們來發(fā)現(xiàn)其中有意思的東西。我們也有做端到端的加密,所以我們選擇不這樣做。

雖然差分隱私現(xiàn)在聽起來更像一個(gè)學(xué)術(shù)詞匯,但是蘋果正在嘗試將這項(xiàng)技術(shù)普及出去。我們正在將它從研究所內(nèi)轉(zhuǎn)移到數(shù)以十億記的用戶面前。

Federighi緊接著又補(bǔ)充了一些相關(guān)的細(xì)節(jié):

我們在很多年前就開始做這件事,并且已經(jīng)在大規(guī)模應(yīng)用中獲得了有趣的成果。而且,你會(huì)為它的隱私程度感到意外。

他緊接著描述了一個(gè)系統(tǒng)其中包括了虛擬的隨機(jī)和加密機(jī)制,即便我專門寫過一本關(guān)于加密的書,也很難跟隨他的思維。但是總結(jié)一點(diǎn)來說,它實(shí)際上是把數(shù)學(xué)噪聲加到蘋果收集的用戶信息碎片當(dāng)中去。

在他看來蘋果的貢獻(xiàn)也是非常顯著的,同時(shí)也非常罕見的成為了蘋果對外公開的技術(shù),因?yàn)樘O果授權(quán)相應(yīng)的科學(xué)家將工作細(xì)節(jié)和研究成果公制于眾。

對于機(jī)器學(xué)習(xí)如何改變蘋果的產(chǎn)品,這一點(diǎn)我們是可以肯定的。但是機(jī)器學(xué)習(xí)將如何改變蘋果自身這并不明確。按照其中一種思維來說,機(jī)器學(xué)習(xí)似乎與蘋果本身的氣質(zhì)不符。蘋果一直都是一家能夠全方位控制用戶體驗(yàn)的公司。所有東西都被預(yù)先設(shè)計(jì)好,并且以最謹(jǐn)慎的方式寫好代碼。

但是當(dāng)工程師開始應(yīng)用及其學(xué)習(xí),他們實(shí)際上是在讓軟件自身不斷去發(fā)現(xiàn)解決方案。蘋果是否能夠適應(yīng)當(dāng)下的機(jī)器學(xué)習(xí)系統(tǒng)?機(jī)器學(xué)習(xí)的結(jié)果是否最終會(huì)影響實(shí)際產(chǎn)品的設(shè)計(jì)?這都還是變數(shù)。Federighi對此表示:

這件事在內(nèi)部其實(shí)也引起了很多爭議,我們之前其實(shí)進(jìn)行過非常長遠(yuǎn)的思考。之前我們都是根據(jù)自己的經(jīng)驗(yàn),從多個(gè)維度去控制人機(jī)交互的細(xì)節(jié),最終達(dá)到最佳的用戶體驗(yàn)。

但如果你嘗試通過大量數(shù)據(jù)訓(xùn)練機(jī)器,從而模擬出用戶的行為,結(jié)果蘋果設(shè)計(jì)師的經(jīng)驗(yàn)就不再占據(jù)領(lǐng)導(dǎo)地位,一切都是數(shù)據(jù)說了算。

蘋果的典型用戶將在自己的日常使用中體會(huì)到深度學(xué)習(xí)帶來的改變

但是蘋果沒有因此而退縮,Schiller表示:

這些新技術(shù)的確在影響著我們設(shè)計(jì)產(chǎn)品的思路,最終有一天我們也會(huì)因?yàn)樗麄兡軌蜃屛覀兇蛟斐龈玫漠a(chǎn)品而是用他們。

這也許就是蘋果最終的解決方案:蘋果接下來依舊不會(huì)對采用的人工智能技術(shù)過多標(biāo)榜,而是一如既往的利用它們來提升產(chǎn)品質(zhì)量,你iPhone里面的那個(gè)“大腦”就是最好的例子。

典型的蘋果用戶,將在體驗(yàn)深度學(xué)習(xí)過程中愈發(fā)熱愛蘋果產(chǎn)品。而最令人激動(dòng)的是這一切是那么難以察覺,以至于當(dāng)你回過頭看差別的時(shí)候不僅發(fā)出感嘆:“這一切是怎么發(fā)生的?”

至于天網(wǎng)嘛,也許還要等等。

更多資訊請關(guān)注3C制造頻道。

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動(dòng)網(wǎng)(www.surachana.com)獨(dú)家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號獲取更多資訊

關(guān)注中國傳動(dòng)網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0