4月3日消息,據(jù)媒體報(bào)道,新年以來,隨著Anthropic、字節(jié)跳動等AI巨頭接連推出爆款應(yīng)用,疊加“龍蝦”熱潮帶動開源大模型調(diào)用量激增,英偉達(dá)H100芯片在租賃市場上迎來身價(jià)反轉(zhuǎn)。
隨著新年以來Anthropic、字節(jié)跳動等AI巨頭不斷發(fā)布爆款應(yīng)用,疊加“龍蝦”熱潮推動開源大模型的調(diào)用激增,英偉達(dá)的H100芯片在租賃市場迎來身價(jià)“V型”反轉(zhuǎn)的高光時(shí)刻。
要知道,這款芯片是黃仁勛在2022年3月GTC上發(fā)布,同年秋季開始出貨的產(chǎn)品。
據(jù)半導(dǎo)體研究機(jī)構(gòu)SemiAnalysis周四推出的“H100一年期租賃合約價(jià)格指數(shù)”,這款“老芯片”的租賃合約價(jià)格從2025年10月觸及每小時(shí)1.7美元后,已經(jīng)在今年3月飆升至每小時(shí)每塊GPU 2.35美元,飆升近40%。要知道,H100芯片是黃仁勛在2022年3月GTC大會上發(fā)布、同年秋季開始出貨的產(chǎn)品。
據(jù)半導(dǎo)體研究機(jī)構(gòu)SemiAnalysis最新發(fā)布的“H100一年期租賃合約價(jià)格指數(shù)”,該“老芯片”的租賃價(jià)格自2025年10月觸及每小時(shí)1.7美元的低點(diǎn)后,于今年3月飆升至每塊GPU每小時(shí)2.35美元,漲幅接近40%。
該指數(shù)基于對100多家云服務(wù)提供商及算力買賣雙方的直接調(diào)查,每月采集一次數(shù)據(jù)。
報(bào)告指出,按需租用的GPU算力已在所有類型的GPU中售罄——即便近期價(jià)格上漲,已鎖定按需實(shí)例的客戶也不愿將算力釋放回資源池。
至于架構(gòu)更先進(jìn)的Blackwell芯片?研究人員表示,由于對開放權(quán)重模型的需求強(qiáng)勁,疊加推理需求持續(xù)激增,新部署B(yǎng)lackwell的交付周期已延長至6到7個(gè)月。
2025年晚些時(shí)候,市場一度預(yù)期,隨著性能更強(qiáng)、算力成本更低的Blackwell芯片加速部署,Hopper系列(H100、H200)的租賃價(jià)格將大幅下降。然而最新情況恰恰相反:H100的需求不僅保持堅(jiān)挺,在許多場景下甚至進(jìn)一步增強(qiáng)。
SemiAnalysis在報(bào)告中指出,今年年初算力需求的重要驅(qū)動之一來自原生媒體生成。例如,字節(jié)跳動的Seedance(即夢)和谷歌Nano Banana推動用戶大量生成與優(yōu)化視頻、圖像,帶動詞元(token)吞吐量大幅上升。而更顯著的需求來源是多智能體(multi-agent)工作負(fù)載的興起,使得詞元使用量和算力消耗呈現(xiàn)拋物線式增長。
SemiAnalysis透露,僅其自身“在過去一周里就消耗了數(shù)十億詞元”,每百萬詞元成本約5美元。不過公司也表示,由此節(jié)省的時(shí)間以及工作流程與能力的擴(kuò)展,帶來的回報(bào)遠(yuǎn)超算力成本。

