在AI大熱的2018年,ISSCC的人工智能芯片僅僅只有一個session,然而在2019年,除了machinelearning的session7,還帶了兩個半session:session14Machinelearning&DigitalLDO,和session24SRAM&Computation-in-Memory,并且一只腳邁進從來只有Intel/AMD等的超大司才能占據(jù)最大session2Processor(session1是全場報告PlenaryTalk)。
講到PlenaryTalk,ISSCC2019的第一演講嘉賓是——YannLeCun!第二嘉賓也是AI芯片發(fā)到手軟的Hoi-JunYoo。
毫不夸張的說,ISSCC2019中最大的明星就是AI,沒有之一。
從目前的已經(jīng)發(fā)布的ISSCC2019的文章列表,我們可以看出新一年的AI芯片的三大主旨——
存內(nèi)計算的競技場
自今年ISSCC上存內(nèi)計算首次出現(xiàn)后,明年的ISSCC上的存內(nèi)計算可謂大爆發(fā)。所謂存內(nèi)計算,就是在馮諾依曼瓶頸出現(xiàn)的今天,將處理器和存儲器融合在一起,有效地避免受制于通信帶寬而導(dǎo)致的系統(tǒng)性能的下降。
今年的ISSCC后,小編還一度吐槽了一下存內(nèi)計算(不以非馮為目的AI存儲器都是耍流氓?)。然而歷史的潮流總不會因為某些人的表演而停下。這不,ISSCC2019首次出現(xiàn)了超過1Mb容量的RRAM存內(nèi)計算(神馬是RRAM,請點擊RAM的前世,今生,與未來),并可以實現(xiàn)多比特的CNN。相比于去年的單比特SRAM為主的設(shè)計,可以說該設(shè)計才是真正為突破馮諾伊曼瓶頸帶來了曙光。
另外,本次入圍ISSCC的大陸文章中,有兩篇皆為面向人工智能應(yīng)用的存內(nèi)計算設(shè)計,分別是來自清華大學(xué)的可變精度超高能效加速器。
以及來自東南大學(xué)與清華大學(xué)合作的“三明治”RAM,如果小編沒有猜錯BWN指的是BinaryWeightNetwork,即weight是2進制的架構(gòu)。
值得指出的是,存內(nèi)計算不僅出現(xiàn)在machinelearning領(lǐng)域,在處理器的其他應(yīng)用領(lǐng)域被應(yīng)用了起來,比如圖論(離散數(shù)學(xué)處理器?)等場合。
機器人帶來的新機遇
除去存內(nèi)計算,ISSCC2019還給AI芯片指了一條新路??v觀幾個AI芯片session,一個過去不曾出現(xiàn)但是今年開始不斷被重復(fù)的詞——Robot/Robotics。在Session17開篇就是有日本Sony公司帶來的invitedtalk。
在具體的科研成果展示中,Intel帶來了面向多機器人協(xié)同系統(tǒng)中,小型機器人的通用芯片。
而佐治亞理工帶來了面向群體機器人(swarmrobotics)高能效計算計算平臺。
這里可以科普一下,群體機器人就是一群機器人。
密西根大學(xué)還帶來了一個SLAM(simultaneouslocalizationandmapping,即時定位和地圖構(gòu)建)處理器。SLAM作為視覺機器人/VR-AR的核心功能,典型使用方式是讓機器人在某個空間內(nèi)走一走,然后就能構(gòu)建出空間,如下圖所示。(電影版《盜墓筆記》中,裘德考就是用了幾十個小型無人機,遠程構(gòu)建了蛇母陵的3D結(jié)構(gòu),理論上這就是SLAM)。
傳統(tǒng)的SLAM是依靠ARM+IPU實現(xiàn),但是隨著與CNN結(jié)合,智能化的SLAM對于處理器的要求不斷提高,GPU已經(jīng)逐漸進入SLAM的硬件需求。
此次出現(xiàn)的即是CNN和SLAM專用結(jié)合的模式。
先定一個小目標(biāo),10TOPS還是TOPS/W
除了聚焦新技術(shù)之外,唯性能至上的ISSCC也不斷在尋求數(shù)字系統(tǒng)上的性能突破。在ISSCC2019上,若要靠性能可以一展風(fēng)采,在性能上幾乎都得看齊10TOPS甚至是10TOPS/W的數(shù)量級。芯片性能的提升手段可以是令人乍舌的新工藝,或者是善用矩陣的稀疏性等等。
值得指出的是,其實上述在存內(nèi)計算或者是智能機器人芯片中的許多設(shè)計都滿足了這個小目標(biāo)。