英偉達(dá)AI芯片故障引發(fā)微軟等客戶砍單

時間:2025-01-14

來源:電子技術(shù)應(yīng)用

導(dǎo)語:美東時間1月13日周一,據(jù)《The Information》報道,英偉達(dá)最新一代人工智能芯片Blackwell在部署至數(shù)據(jù)中心時遇到了技術(shù)問題,主要包括服務(wù)器機(jī)架過熱和芯片連接異常。

  美東時間1月13日周一,據(jù)《The Information》報道,英偉達(dá)最新一代人工智能芯片Blackwell在部署至數(shù)據(jù)中心時遇到了技術(shù)問題,主要包括服務(wù)器機(jī)架過熱和芯片連接異常。

  這些問題對數(shù)據(jù)中心的部署進(jìn)程造成阻礙,英偉達(dá)多家客戶(包括微軟、亞馬遜旗下AWS、谷歌、Meta)最近砍掉了部分Blackwell GB200機(jī)架的訂單。

  因延遲交付,微軟原本計劃安裝大量GB200的鳳凰城數(shù)據(jù)中心現(xiàn)在已經(jīng)裝滿了H200芯片。有消息人士透露,如果英偉達(dá)無法解決這些問題,其性能可能會低于公司承諾的水平。

  消息公布后,英偉達(dá)美股早盤一度跌超4.7%。

  主要客戶削減訂單,尋求替代方案

  Blackwell芯片以其卓越性能和高能效廣受期待。與上一代產(chǎn)品Hopper相比,Blackwell的能源效率提高了四倍,吸引了微軟、亞馬遜、谷歌和Meta等科技巨頭。每家公司為此下達(dá)了價值逾100億美元的訂單。

  然而,將多個高功耗芯片集成到一個服務(wù)器機(jī)架中比預(yù)期更具挑戰(zhàn)。每個Blackwell機(jī)架比家用冰箱還高,重量接近一輛本田思域汽車。由于計算密度極高,機(jī)架必須采用水冷系統(tǒng),而非傳統(tǒng)的風(fēng)冷系統(tǒng)。對于多數(shù)AI開發(fā)商和數(shù)據(jù)中心運(yùn)營商而言,部署這種特殊機(jī)架是全新且復(fù)雜的任務(wù)。此外,并非所有數(shù)據(jù)中心都能滿足這些機(jī)架的環(huán)境需求,客戶必須重新規(guī)劃部署方案。

  因過熱和連接問題,部分客戶削減了Blackwell GB200機(jī)架的訂單。例如,有客戶選擇等待可能在今年下半年推出的改進(jìn)版本,另一些則計劃采購英偉達(dá)的舊款A(yù)I芯片作為替代方案。雖然英偉達(dá)推薦整機(jī)架方案,但部分客戶可能改為單獨(dú)購買Blackwell芯片以便自行組裝。

  盡管面臨挑戰(zhàn),英偉達(dá)仍有機(jī)會挽回局面。如果能夠及時解決這些技術(shù)問題,客戶或許會重新增加訂單。此外,盡管機(jī)架存在問題,Blackwell芯片的性能仍然優(yōu)于上一代產(chǎn)品,英偉達(dá)可能會為問題機(jī)架找到其他買家。

  英偉達(dá)去年11月曾預(yù)測,新一代AI芯片Blackwell將在今年第一季度為公司帶來數(shù)十億美元的收入,并助推其全年數(shù)據(jù)中心芯片收入從475億美元增長至1500億美元。Blackwell芯片的高能效本是吸引云服務(wù)提供商的關(guān)鍵因素,這些供應(yīng)商希望在固定能源條件下實現(xiàn)更高的計算效率。

  芯片延遲影響數(shù)據(jù)中心部署計劃

  據(jù)知情人士透露,作為OpenAI的服務(wù)器提供商,微軟原計劃在其鳳凰城的一個設(shè)施中安裝至少包含5萬枚Blackwell芯片的GB200機(jī)架。然而,由于Blackwell芯片從去年開始延遲交付,OpenAI要求微軟盡早為其提供上一代英偉達(dá)H200芯片。這一變化導(dǎo)致原本計劃安裝大量GB200的鳳凰城數(shù)據(jù)中心現(xiàn)在已經(jīng)裝滿了H200芯片。

  據(jù)知情人士透露,微軟現(xiàn)在計劃在今年3月在鳳凰城的一個設(shè)施中安裝包含12000枚Blackwell芯片的GB200機(jī)架,這一數(shù)量約為最初計劃的四分之一。另一位與微軟合作的人士表示,該公司還計劃在今年晚些時候GB300 Blackwell機(jī)架上市時進(jìn)行采購。

  英偉達(dá)原本計劃在去年年底開始向客戶交付Blackwell機(jī)架,但由于芯片設(shè)計缺陷導(dǎo)致初期延遲了三個月。盡管英偉達(dá)已經(jīng)修復(fù)了這一問題,但到11月份時,客戶開始擔(dān)心機(jī)架的過熱問題。為此,英偉達(dá)多次要求供應(yīng)商更改設(shè)計。

  然而,問題并未得到完全解決。據(jù)參與機(jī)架測試的三位人士透露,客戶還發(fā)現(xiàn)芯片之間數(shù)據(jù)傳輸(即網(wǎng)絡(luò))存在不一致的情況。這些問題可能導(dǎo)致Blackwell機(jī)架的設(shè)置時間比預(yù)期更長,如果英偉達(dá)無法解決這些問題,其性能可能會低于公司承諾的水平。


中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.surachana.com)獨(dú)家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運(yùn)動控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點贊 0
取消 0