自計算機誕生以來,網(wǎng)絡技術一直都是IT產(chǎn)業(yè)的核心,它至關重要,連接大型主機,實現(xiàn)數(shù)據(jù)共享。在半導體領域,網(wǎng)絡技術幾乎滲透到技術棧的各個層面——從芯片內部晶體管互連到芯片盒和機架之間的外部連接,全都有網(wǎng)絡技術的身影。
在網(wǎng)絡領域,華為、英偉達、博通、邁威(Marvell)擁有扎實技術?,F(xiàn)在AI時代來臨,企業(yè)開始推出新的網(wǎng)絡解決方案,目標是加快數(shù)據(jù)傳輸速度。所以最近幾年,我們看到Lightmatter、Celestial AI、PsiQuantum等新銳公司開始占據(jù)一席之地,它們借助光學技術提高計算效率。
光學技術(又稱光子學)已經(jīng)走到了發(fā)展的關鍵節(jié)點。PsiQuantum聯(lián)合創(chuàng)始人兼首席科學官皮特·沙德博爾特(Pete Shadbolt)表示,25年來,人們一直認為光學技術枯燥乏味、昂貴、缺少實際用途,但AI照亮了光子學的前進道路。
一些風險投資家認為,傳統(tǒng)電子互連技術無法滿足AI高帶寬要求,所以他們積極尋找可以提高數(shù)據(jù)吞吐量的創(chuàng)新方案。
英偉達提前布局,初創(chuàng)企業(yè)各展所長
Creative Strategies首席執(zhí)行官本·巴賈林(Ben Bajarin)表示:“回顧歷史,網(wǎng)絡領域的報道一直非常枯燥,因為它的核心就是數(shù)據(jù)包交換;受到AI的驅動,網(wǎng)絡需要承載相當龐大的工作負載,這也是最近速度相關創(chuàng)新層出不窮的原因。”
巴賈林認為,英偉達有先見之明,多年前它就完成了兩筆關鍵收購,開始布局網(wǎng)絡領域。
2020年,英偉達以70億美元收購以色列邁絡思科技(Mellanox Technologies),該公司專為服務器、數(shù)據(jù)中心提供高速網(wǎng)絡解決方案。不久之后,英偉達又收購Cumulus Networks,該公司為Linux計算機網(wǎng)絡軟件系統(tǒng)提供支持。當時英偉達已經(jīng)感知到,當GPU憑借其并行計算能力與其他GPU結合,部署于數(shù)據(jù)中心,它的性能會更上層樓。
Lightmatter致力于研究光子芯片技術,公司首席執(zhí)行官尼克·哈里斯(Nick Harris)指出,AI需要的算力每三個月翻一番,計算機芯片尺寸在不斷擴大,當芯片發(fā)展到一定程度,如果想繼續(xù)提升性能,必然依賴芯片之間的連接技術。
硅光子學技術是一條可行路徑,Lightmatter宣稱自己打造了全球最快的AI芯片光子引擎,從本質上講,就是通過光互聯(lián)技術連接的3D硅堆疊結構。目前Lightmatter已經(jīng)獲得5億美元投資,估值達44億美元。
哈里斯(Nick Harris)認為:“計算的未來確實與光息息相關,電子技術肯定會繼續(xù)存在,軟件也是不可或缺的關鍵部分,但在當前的計算規(guī)模下,我們需要新思路,光技術正是計算機新前沿的重要組成部分?!?/p>
初創(chuàng)公司Celestial AI主攻光學互聯(lián)技術,它于今年早些時候融資2.5億美元;光量子計算機開發(fā)商PsiQuantum今年9月融資10億美元,估值達70億美元。
目前光學網(wǎng)絡技術仍面臨挑戰(zhàn),比如成本過高,需要高度專業(yè)的設備,而且產(chǎn)業(yè)還要求它必須兼容電子系統(tǒng)。
不論未來是電子技術取勝,還是光子技術占據(jù)上風,或者二者兼而有之,網(wǎng)絡都會是核心。
中外企業(yè)競逐網(wǎng)絡技術創(chuàng)新
在AI發(fā)展過程中,英偉達成為GPU技術垂直整合商,博通則提供定制芯片、加速器及高速網(wǎng)絡技術。博通目前的市值高達1.7萬億美元,與谷歌、Meta、OpenAI都有合作,它向合作伙伴提供數(shù)據(jù)中心芯片。
在光子學領域,博通也處于前沿位置。上個月,有報道稱博通準備推出名為Thor Ultra的新型網(wǎng)絡芯片,它可以讓AI系統(tǒng)與數(shù)據(jù)中心其他部分實現(xiàn)高速連接。
還有很多企業(yè)也在向網(wǎng)絡技術下注。例如,安謀(ARM)以2.65億美元收購網(wǎng)絡公司DreamBig。在財報會議上,安謀首席執(zhí)行官勒內·哈斯(Rene Haas)宣稱DreamBig對橫向擴展和縱向擴展網(wǎng)絡至關重要,也就是說它的技術可以讓單個芯片集群在內部實現(xiàn)連接、高速傳輸數(shù)據(jù),這與芯片機架之間的連接有所不同。
在國內,華為推出的大規(guī)模超節(jié)點互聯(lián)技術走的也是相同路徑。當AI集群規(guī)模達到數(shù)萬乃至數(shù)十萬張卡時,節(jié)點間的通信效率會急劇下降,華為“超節(jié)點”技術可以解決這一問題。
諾基亞前數(shù)據(jù)中心副總裁邁克·布什翁(Mike Bushong)認為:“更強大、更先進的AI離不開計算能力,而且是海量的計算能力。如今,每部署1兆瓦數(shù)據(jù)中心容量,網(wǎng)絡相關支出的成本排在第二位,僅次于AI系統(tǒng)本身?!?/p>
生成式AI模型依賴跨節(jié)點、跨機架的實時信息共享,如果說GPU是腦細胞,網(wǎng)絡就是神經(jīng)系統(tǒng),它通過信號傳遞將所有腦細胞連接起來。
存儲即服務提供商Zadara的首席執(zhí)行官約拉姆·諾維克(Yoram Novick)警告稱:“如果不能確保擁有充足的互連帶寬,僅僅簡單增強GPU性能,可能會導致收益遞減?!?/p>
目前的AI網(wǎng)絡主要圍繞以太網(wǎng)(Ethernet)、無限帶寬技術(InfiniBand)、NVLink和超加速器鏈路(UALink)展開。以太網(wǎng)和無限帶寬技術用于連接多臺服務器,后者因為擁有超低延遲和更高帶寬,是AI訓練場景的首選方案。但在不久的將來,預計以太網(wǎng)技術將成為主導。
























網(wǎng)站客服
粵公網(wǎng)安備 44030402000946號