【法國技術研究機構Leti:實現(xiàn)高效率的邊緣計算需解決“內存墻”的瓶頸】為快速成長的人工智能(artificialintelligence;AI)應用實現(xiàn)高效率的運算性能,必須解決“內存墻”(memorywall)的瓶頸,并推動新的架構解決方案;這是法國CEATech旗下技術研究機構Leti關注的重點領域。
Leti執(zhí)行長EmmanuelSabonnadiere在Leti年度創(chuàng)新會議上接受《EETimes》訪問時表示,業(yè)界需要一種高度整合的整體途徑,將AI從軟件和云端移至邊緣(edge)的嵌入式芯片。
Sabonnadiere說:“邊緣確實需要一些創(chuàng)新,采用除了CMOS以外的不同架構,從結構上整合至系統(tǒng),并從云端實現(xiàn)自主性——例如針對自動駕駛車,您需要云端盡可能地獨立作業(yè)?!?/p>
他認為恩智浦(NXP)可望成為驅動在邊緣實現(xiàn)更多運算的一項關鍵指標,因而針對高通(Qualcomm)并購恩智浦一案發(fā)表評論:“你覺得高通為什么要買下恩智浦?它是為了(邊緣運算)的感測,而將數(shù)位置于感測之后?!?/p>
為了解決運算架構典范,Sabonnadiere期望能在Let與史丹佛大學(StanfordUniversity)電氣工程和計算機科學系教授SubhasishMitra帶領的團隊合作中取得一些突破。Mitra的研究已經進展一段時間了,專注于為龐大資料和密集互連應用探索內存內處理(processing-in-memory)的新架構。這項研究獲得了美國國防部先進研究計劃局(DARPA)、國家科學基金會(NSF)、SemiconductorResearch、STARnetSONIC和史丹佛大學SystemX聯(lián)盟的成員公司共同資助。
Sabonnadiere談到芯片驗證時說:“我們深信這是解決『超越摩爾定律』(more-than-Moore)挑戰(zhàn)的前進方向,并且已經要求Mitra教授打造這一研究展示了?!?/p>
在會議上,Mitra表示,龐大的資料超級風暴正襲卷而來,而其運算需求遠超過處理能力,因此必須使用支持先進3D整合的運算奈米系統(tǒng)架構。
Mitra說:“數(shù)據(jù)必須經過處理才能創(chuàng)造決策,但目前還有太多我們無法處理的『暗黑』數(shù)據(jù)。以Facebook為例,它必須采用256個TeslaP100GPU,才能在1小時訓練好ImageNet,這在以前大約需要幾天的時間?!?/p>
提高運算性能的選擇
那么目前提高運算性能的選擇是什么?Mitra說,其一是要有一個更好的邏輯開關——但這方面的實驗展示并不多。第二種是使用設計“技巧”,例如多核心、加速器或電源管理技巧。但他也補充說,可用的技巧并不多,而且當實施這些技巧而使設計變得更復雜,甚至會使驗證變得更困難。另一個挑戰(zhàn)則是Mitra所謂的“內存墻”。
Mitra說:“各種類型的龐大數(shù)據(jù)應用中,一個共同點就在于內存墻——系統(tǒng)需要更有力地存取內存?!盡itra說,這就是專注于內存的運算概念所在,也是與Leti合作的關注重點——Sabonnadiere希望將在這方面取得突破。它使用先進3D整合使得運算更接近于數(shù)據(jù)。該芯片采用碳奈米管(CNT),因為Mitra表示它們是唯一可以超越CMOS和電阻式隨機存取內存(RRAM)的技術。
RRAM和碳奈米管彼此垂直建構,形成具有邏輯層和內存層交錯的密集3D計算機架構。在這些分層之間插入超密走線,應該就能以這種3D架構解決通訊的瓶頸。
Mitra將這個問題比喻為從舊金山(SanFrancisco)到加州柏克萊(Berkeley)之間的交通挑戰(zhàn)——由于只有三座橋梁可以穿越兩個都市,因而造成了交通堵塞。然而,如果打造更多的橋梁——或者在他提出的3D架構情況下,就能夠解決多奈米級交錯層間過孔的瓶頸。
內存和軟件2.0的突破
Leti首席科學家BarbaraDeSalvo表示,業(yè)界并未充份重視新興內存技術,這些技術通常仍被視為利基技術。
DeSalvo說:“在內存領域,業(yè)界仍持續(xù)采用傳統(tǒng)技術。而像電阻式RAM、磁阻式RAM和相變內存等新興技術仍未被充份利用。但它可望在實現(xiàn)新型架構方面帶來巨大突破?!盌eSalvo并補充說,在未來幾年,在軟件中使用深度學習和AI也可能中在運算方面取得重大突破。
她說:“我指的是一個使用深度學習和機器學習來開發(fā)軟件的新概念。軟件是一個系統(tǒng)中最昂貴的部份之一。透過使用深度學習產生軟件,以前需要花六個月的一些任務現(xiàn)在可以只需要幾天的時間?!?/p>