8 月 26 日消息,科技媒體 WccfTech 昨日(8 月 25 日)發(fā)布博文,報道稱在 Hot Chips 2025 大會上,谷歌詳細披露第七代 TPU 架構(gòu)“Ironwood”超級計算平臺。
援引博文介紹,谷歌于今年 4 月官宣第 7 代 TPU 架構(gòu),代號為 Ironwood,號稱其性能是當(dāng)前最強大超級計算機的 24 倍。
本次披露主要聚焦單個 Superpod 的硬件構(gòu)成與架構(gòu)設(shè)計。相比 2022 年的 TPU v4(4096 芯片、32GB HBM、275 TFLOPs)和 2023 年的 TPU v5p(8960 芯片、95GB HBM、459 TFLOPs),Ironwood 在核心規(guī)格上大幅躍升。
單個 Ironwood Superpod 集成 9216 枚芯片,每片配備 192GB、帶寬 7.4TB/s 的高帶寬存儲,峰值算力高達 4614 TFLOPs,意味著其單芯片性能較 TPU v4 提升超過 16 倍。
每四顆芯片組成一塊 PCBA 主板,16 塊主板構(gòu)成一個機架,共 64 芯片節(jié)點,谷歌采用 InterChip Interconnect(ICI)技術(shù),將多達 43 個 64 芯片模塊互連,構(gòu)建出擁有 1.8PB/s 網(wǎng)絡(luò)帶寬的集群。
在物理布局上,Ironwood 沿用過去三代的 3D Torus(立方環(huán)網(wǎng))拓撲,每個邏輯單元為 4×4×4 節(jié)點陣列,即 64 芯片,封裝于單個機架。
一個 Superpod 包含 144 個機架,還配備光學(xué)交換機機箱以實現(xiàn)跨模塊互連,以及用于液冷的冷卻分配單元(CBU)機架,互連方面為提高靈活性與可擴展性,采用 PCB 走線、銅纜和光纖的混合方式。
在機架設(shè)計上,頂部設(shè)有泄漏檢測盤以監(jiān)控液冷系統(tǒng),下方是供電模塊,具備兩路電源域,將 416V 交流電經(jīng)整流轉(zhuǎn)換為直流電。整套系統(tǒng)支持液冷散熱,滿載運行功率可超過 100kW。
注:
· TPU(Tensor Processing Unit)張量處理單元:谷歌專為機器學(xué)習(xí)任務(wù)設(shè)計的專用芯片,優(yōu)化矩陣運算性能。
· Superpod,就是一組連續(xù)的 TPU,通過專用網(wǎng)絡(luò)組合在一起。
· HBM(High Bandwidth Memory)高帶寬存儲:一種集成在芯片附近的高速顯存,顯著提升數(shù)據(jù)傳輸速率。
· TFLOPs(Tera Floating Point Operations per Second)萬億次浮點運算 / 秒:衡量芯片浮點運算性能的指標(biāo)。