“橫看成嶺側(cè)成峰,遠近高低各不同?!?/p>
用這句詩來形容當(dāng)前人們對人工智能的理解最合適不過了。
人工智能浪潮起來以后,在醫(yī)療領(lǐng)域各種各樣的“人工智能”冒了出來,在一些醫(yī)學(xué)會議上,可穿戴設(shè)備、自動化系統(tǒng)、專家系統(tǒng)、智能化設(shè)備、最新輔助診斷系統(tǒng)、傳統(tǒng)的CAD技術(shù)都被企業(yè)或者醫(yī)生稱為人工智能。
究竟什么是人工智能?或者說什么是新時代的人工智能,與十幾年前出現(xiàn)的人工智能有什么區(qū)別?在醫(yī)療方面,研究又處于怎樣的階段?這波浪潮又能持續(xù)多久?這是最近經(jīng)常聽到的問題。
帶著這些問題,記者查閱了一些資料并采訪了斯坦福大學(xué)AI教授、百度深度學(xué)習(xí)研究院專家、醫(yī)療AI企業(yè)的首席科學(xué)家、創(chuàng)業(yè)者、吉林大學(xué)智慧醫(yī)療的負責(zé)AI的教授以及在醫(yī)療AI投入上億元的投資人,希望從他們那里得到答案。
鸚鵡智能與烏鴉智能
加州大學(xué)洛杉磯分校UCLA、統(tǒng)計學(xué)和計算機科學(xué)教授、視覺、認知、學(xué)習(xí)與自主機器人中心主任朱松純曾在視覺求索的一篇文章《淺談人工智能:現(xiàn)狀、任務(wù)、構(gòu)架與統(tǒng)一|正本清源》中做了兩個比喻,很有意思:“鸚鵡智能”和“烏鴉智能”。
鸚鵡有很強的語言模仿能力,人多教育幾次,鸚鵡就可以重復(fù)人類一些短語,這就類似于當(dāng)前的由數(shù)據(jù)驅(qū)動的聊天機器人。
二者都可以說話,但鸚鵡和聊天機器人都不明白說話的語境和語義,也不能把說的話對應(yīng)到物理世界和社會的物體、場景、人物,不符合因果與邏輯。
烏鴉要遠比鸚鵡聰明,他會利用工具,懂得物理常識和人類簡單的社會常識。
上圖是日本的研究人員跟蹤拍攝的,烏鴉是野生的。它必須靠自己的觀察、感知、認知、學(xué)習(xí)、推理、執(zhí)行,完全自主生活。
為了獲取堅果里面的食物,經(jīng)過各種嘗試以后,它發(fā)現(xiàn)把果實放在馬路上,讓車子軋過去就可以得到食物(圖b),但是馬路上車水馬龍,容易丟掉性命。
然后它就站在馬路上方的電線桿上觀察,這之前他沒有經(jīng)過大數(shù)據(jù)學(xué)習(xí)。它發(fā)現(xiàn)在靠近紅綠路燈的路口,車子和人有時候停下了。
這時,它必須進一步領(lǐng)悟出紅綠燈、斑馬線、行人指示燈、車子停、人流停這之間復(fù)雜的因果鏈(圖c、d、e)。最后它發(fā)現(xiàn)規(guī)律,最終吃到了食物。
在這個過程中,烏鴉是完全自主的智能,完全自主感知、認知、推理、學(xué)習(xí)、和執(zhí)行。也沒有幾百萬訓(xùn)練數(shù)據(jù)供他學(xué)習(xí)。在這個過程中他學(xué)習(xí)耗能也很低(人腦功耗大約是10-25瓦,烏鴉大腦約為人類1%,它就只有0.1-0.2瓦)。
鸚鵡智能屬于現(xiàn)在在應(yīng)用方面流行的數(shù)據(jù)驅(qū)動型智能,雖然與烏鴉智能有差距,但是在醫(yī)療這個垂直領(lǐng)域是有前景的。烏鴉智能屬于人們希望的人工智能。
具體來講什么研究和應(yīng)用屬于人工智能范疇,朱松純給了一個系統(tǒng)的歸納,它涵蓋了六個領(lǐng)域:
(1)計算機視覺(暫且把模式識別,圖像處理等問題歸入其中)。
(2)自然語言理解與交流(暫且把語音識別、合成歸入其中,包括對話)。
(3)認知與推理(包含各種物理和社會常識)。
(4)機器人學(xué)(機械、控制、設(shè)計、運動規(guī)劃、任務(wù)規(guī)劃等)。
(5)博弈與倫理(多代理人agents的交互、對抗與合作,機器人與社會融合等議題)。
(6)機器學(xué)習(xí)(各種統(tǒng)計的建模、分析工具和計算的方法)。
由于學(xué)科比較分散,從事相關(guān)研究的大多數(shù)博士、教授等專業(yè)人員,往往也只是涉及以上某個學(xué)科,甚至長期專注于某個學(xué)科中的具體問題。
比如,人臉識別是計算機視覺這個學(xué)科里面的一個很小的問題;深度學(xué)習(xí)屬于機器學(xué)習(xí)這個學(xué)科的一個當(dāng)紅的流派。
在醫(yī)學(xué)應(yīng)用層面,據(jù)動脈網(wǎng)了解目前市場上見到的醫(yī)學(xué)人工智能產(chǎn)品如輔助診斷系統(tǒng)、影像輔助診斷系統(tǒng)都是多領(lǐng)域交叉合作,并結(jié)合臨床實踐得到的成果,僅憑在一個領(lǐng)域內(nèi)的研究是很難取得成績。
三個問題教你識別人工智能公司
全球著名的計算機博弈專家吳韌認為,這一輪人工智能能夠取得前所未有的進步主要有三個方面的原因:
第一,大數(shù)據(jù)的積累。在醫(yī)學(xué)方面,隨著電子病歷和數(shù)字膠片的積累,大量可以用于研究的結(jié)構(gòu)化病例保存起來。而這個大數(shù)據(jù)至少是以10萬份為起點,并且可直接用于模型訓(xùn)練的數(shù)據(jù)。
第二,計算能力的提升。這幾年,云計算、GPU等一些計算能力的提升為處理大數(shù)據(jù)提供基礎(chǔ),縮短了訓(xùn)練模型所用的時間,將訓(xùn)練周期縮短為幾天。
第三,大數(shù)據(jù)與計算力的結(jié)合,是研究人員可以快速得到并訓(xùn)練出可以應(yīng)用在時間中的算法模型。而現(xiàn)代的可以稱之為人工智能的產(chǎn)品,必須有深度學(xué)習(xí)技術(shù)的參與。之前的人工智能技術(shù)并沒有很好的解決問題,而深度學(xué)習(xí)技術(shù)的出現(xiàn)才推動了這波浪潮。
吳韌表示,正是由于這波人工智能興起的原因,決定了這次浪潮將是持續(xù)的,而不是間歇性的。從目前取得成績來看,也在驗證這種說法。
基于這三方面常識,我們可以用以下幾個問題來鑒別新時代的人工智能公司。
1、公司數(shù)據(jù)從何而來,是網(wǎng)上下載還是從醫(yī)院獲取高質(zhì)量標注數(shù)據(jù)?
2、公司算法模型從何而來,是從網(wǎng)上下載別人訓(xùn)練好的,還是自己訓(xùn)練模型。如果是自己訓(xùn)練的模型,那么訓(xùn)練軟件是哪一款,計算能力有多強?
3、自己訓(xùn)練的模型又與別人開源的模型有什么區(qū)別?訓(xùn)練的計算機里面有幾塊GPU?
通俗易懂的3條判斷標準
除了從技術(shù)上做鑒別,圖瑪深維創(chuàng)始人及CEO鐘昕也給出了通俗易懂的判斷醫(yī)療AI公司方法。
1、擁有長期從事醫(yī)療背景人工智能技術(shù)研究的核心技術(shù)團隊。
比如說圖瑪深維的首席科學(xué)家陳韻強博士,大學(xué)是清華大學(xué)生物醫(yī)學(xué)工程專業(yè),畢業(yè)后進入中國自然科學(xué)最高學(xué)術(shù)機構(gòu)-中國科學(xué)院自動化研究所,專攻人工智能專業(yè)。
1998年赴美國伊利諾伊大學(xué)厄巴納-香檳分校電子與計算機工程系攻讀博士學(xué)位,師從“計算機視覺之父”黃煦濤教授。
長期在西門子研發(fā)全球研發(fā)中心從事醫(yī)療圖像計算機視覺和人工智能研發(fā),這類醫(yī)療和人工智能都具有深厚背景的復(fù)合型人才是非常稀缺的。能夠吸引這樣頂尖的專家加入公司,代表圖瑪深維核心競爭力之一。
2、參與國內(nèi)外與醫(yī)療人工智能相關(guān)的學(xué)術(shù)會議和展會,交流成果。
在參會的過程中,企業(yè)會參與學(xué)術(shù)和科研的討論,在交流中自會展示自己的公司以及產(chǎn)品的情況。
比如在此次北美放射年會上,圖瑪深維亮相了6大產(chǎn)品體系,與國內(nèi)外的行業(yè)人士進行了深入的交流。
在此次展會上,有很多友商也參與了展覽和學(xué)術(shù)交流,也許現(xiàn)在和將來我們會存在競爭關(guān)系,但是我們非常尊重友商的研究成果。如果一個公司長期脫離人工智能的圈子,只是做一些包裝宣傳,那就值得懷疑。
3、公司需要擁有落地醫(yī)院的產(chǎn)品,以及醫(yī)生對產(chǎn)品的認可度。
圖瑪深維已經(jīng)分析過的胸部CT掃描病例超過5萬病例,獲得了醫(yī)生的廣泛認可。
如果僅僅是在公司網(wǎng)站上寫一句自己屬于人工智能公司,沒有實際產(chǎn)品,那么最后很難獲得最終落地客戶認可,這樣公司是難以獲得長期生存機會。
鐘昕總結(jié)道,那些真正掌握了核心技術(shù),踏實做事情,并把醫(yī)生的需求轉(zhuǎn)化為落地產(chǎn)品的公司都有很好的發(fā)展前景。
人工智能智能必須理解物理世界及其因果鏈條
有專家表示,人工智能可以發(fā)現(xiàn)人類未知的一些聯(lián)系,而不是簡單的專家職能的復(fù)制。在不同的環(huán)境條件下,智能的形式會是不一樣的。
任何智能的機器必須理解物理世界及其因果鏈條,適應(yīng)這個世界。
希氏異構(gòu)宋捷表示,醫(yī)學(xué)AI發(fā)展方向一定不是僅僅依靠人類對疾病的關(guān)聯(lián)、特征的認識去讓計算機對疾病做出判斷,醫(yī)學(xué)是不能完美的結(jié)構(gòu)化的,要知道人類對于自然的認識或許只有自然界本質(zhì)的百分之幾,倘若我們用這百分之幾的‘經(jīng)驗’去‘規(guī)范’AI對自然的認識標準,那么AI的未來一定不會有突破,發(fā)展瓶頸不會超過人類醫(yī)生的認知。我們更希望AI能幫我們找到我們尚未認識到的疾病的更多的關(guān)聯(lián)和最佳的治療途徑。
各種現(xiàn)代技術(shù),在醫(yī)療方面或許都會有不錯的應(yīng)用可能。
但是,AI解決的問題,就是人類認識疾病的效率問題,AI能把人類需要若干年才能發(fā)現(xiàn)的疾病關(guān)聯(lián)、特征,用很短的時間,找出來,這個過程可能是幾天,未來可能是幾個小時,這就是AI的真實能力!
反過來說,現(xiàn)階段AI要依賴人類已有的大數(shù)據(jù)的支持,凡事號稱基于很有限的數(shù)據(jù)“研究”出很好的模型的說法,可以說都不是真正的AI。
各種技術(shù)可能都會有醫(yī)療的應(yīng)用前景,但不見得非得要搭車AI。
有人則認為,醫(yī)療人工智能就是可以自動半自動的對疾病進行診斷。
系統(tǒng)通過閱讀海量的電子病歷或者醫(yī)學(xué)知識,然后自己形成一套知識圖譜,并具備邏輯推理的能力,根據(jù)輸入的患者疾病特征推理做出診斷,并給出診斷依據(jù)。
核心是系統(tǒng)自己找尋疾病的特征和規(guī)律,自己創(chuàng)造規(guī)則,而不是研究人員告訴系統(tǒng)疾病的特征。
而那些將規(guī)則“寫死”的系統(tǒng)不算人工智能。比如說系統(tǒng)將疾病的10個特征全部寫進去,只有滿足這個這10個特征才可以診斷疾病,這些顯然不是人工智能系統(tǒng)。
深度學(xué)習(xí)是新時代人工智能的標志
朱松純表示,在概率統(tǒng)計的框架下,當(dāng)前的很多深度學(xué)習(xí)方法,屬于一個被我稱作“大數(shù)據(jù)、小任務(wù)范式(bigdataforsmalltask)”。
針對某個特定的任務(wù),如人臉識別和物體識別,設(shè)計一個簡單的價值函數(shù)Loss
這種方法在某些問題上也很有效。但是,造成的結(jié)果是,這個模型不能泛化和解釋。
達泰資本創(chuàng)始人葉衛(wèi)剛表示,新時代的人工智能必須有深度學(xué)習(xí)能力??v觀中美的醫(yī)療人工智能創(chuàng)業(yè)公司,他們大多是計算機背景的企業(yè),通常拿一些基本數(shù)據(jù)直接做數(shù)學(xué)模型,然后計算模型跟醫(yī)療流程的結(jié)合是非常需要行業(yè)融入能力的。
作為資本方,達泰既關(guān)注具備底層研發(fā)技術(shù)的公司,也關(guān)注應(yīng)用類人工智能企業(yè)。
應(yīng)用類人工智能企業(yè)在本地化做好的前提下,可以很好的解決行業(yè)痛點。
比如達泰投資的匯醫(yī)慧影,這家公司在通用深度學(xué)習(xí)算法框架的基礎(chǔ)上,針對影像的三維,大尺度,高灰階以及小數(shù)據(jù)量等影像特殊問題,做了針對性的開發(fā)以及優(yōu)化了底層框架,使得人工智能能在醫(yī)學(xué)影像有很強的識別度,并且建立醫(yī)學(xué)影像應(yīng)用的行業(yè)壁壘。
結(jié)果更重要
最后,一名長期從事人工智能研究的醫(yī)生還給出了不同的結(jié)論,醫(yī)生認為只要能夠提高效率,減少重復(fù)性的工作,提供更好的診斷準確率,不管它是用什么底層技術(shù),都可以稱之為人工智能系統(tǒng),沒有必要非得糾結(jié)于技術(shù)的來源和名稱。