英偉達(dá)Blackwell高耗能推動(dòng)AI服務(wù)器水冷方案發(fā)展
2024-08-01
來源:集邦咨詢
集邦咨詢 TrendForce 昨日(7 月 30 日)發(fā)布博文,表示英偉達(dá) Blackwell 高耗能推動(dòng)散熱需求,預(yù)估到 2024 年年底水冷散熱方案滲透率將達(dá) 10%。功耗不斷攀升
英偉達(dá) Blackwell 平臺(tái)將于 2025 年正式放量,取代既有的 Hopper 平臺(tái)、成為英偉達(dá)高端 GPU(圖形處理器)主力方案,占整體高端產(chǎn)品近 83%。
在 B200 和 GB200 等追求高效能的 AI Server 機(jī)種,單顆 GPU 功耗可達(dá) 1,000W 以上。HGX 機(jī)種每臺(tái)裝載 8 顆 GPU,NVL 機(jī)種每柜達(dá) 36 顆或 72 顆 GPU,能耗上漲將促進(jìn) AI Server 水冷散熱供應(yīng)鏈的發(fā)展。
TrendForce 集邦咨詢表示,服務(wù)器芯片的熱設(shè)計(jì)功耗(Thermal Design Power, TDP)持續(xù)提高,如 B200 芯片的 TDP 將達(dá) 1000W,傳統(tǒng)風(fēng)冷散熱方案不足以滿足需求;GB200 NVL36 及 NVL72 整機(jī)柜的 TDP 甚至將高達(dá) 70kW 及近 140kW,需要搭配水冷方案以有效解決散熱問題。
水冷供應(yīng)鏈
GB200 NVL36 架構(gòu)初期將以風(fēng)冷、水冷并行方案為主;NVL72 因有更高散熱能力需求,原則上優(yōu)先使用水冷方案。
援引報(bào)道 GB200 機(jī)柜系統(tǒng)水冷散熱供應(yīng)鏈,主要包括 5大零部件:
水冷板(Cold Plate)
冷卻分配系統(tǒng)(Coolant Distribution Unit, CDU)
分歧管(Manifold)
快接頭(Quick Disconnect, QD)
風(fēng)扇背門(Rear Door Heat Exchanger, RDHx)
CDU 為其中的關(guān)鍵系統(tǒng),負(fù)責(zé)調(diào)節(jié)冷卻劑的流量至整個(gè)系統(tǒng),確保機(jī)柜溫度控制在預(yù)設(shè)的 TDP 范圍內(nèi)。
TrendForce 集邦咨詢觀察,目前針對(duì) NVIDIA AI 方案,以 Vertiv(維諦技術(shù))為主力 CDU 供應(yīng)商,奇鋐、雙鴻、臺(tái)達(dá)電和 CoolIT 等持續(xù)測(cè)試驗(yàn)證中。
在 NVIDIA 大力擴(kuò)展 CSPs 客群的情況下,預(yù)估 2025 年 GB200 折算 NVL36 合計(jì)出貨數(shù)量可望達(dá) 6 萬柜,而 GB200 的 Blackwell GPU 用量可望達(dá) 210-220 萬顆。