隨著谷歌(Google)母公司Alphabet 的TPU(Tensor Processing Unit)業(yè)務(wù)的持續(xù)壯大,加上Google DeepMind 專注AI 研究,投資銀行D.A. Davidson 分析師最新發(fā)布的報告稱,如果谷歌TPU業(yè)務(wù)獨立出來,整體價值可能高達9,000億美元,相較今年稍早估計的7,170億美元大幅提升。
谷歌專為機器學習和AI 工作負載打造的加速器TPU,受到AI 研究人員與工程師的廣泛關(guān)注。谷歌第六代Trillium TPU 自2024年12月大規(guī)模推出后,需求相當強勁。專為推論設(shè)計的第七代Ironwood TPU 在今年Google Cloud Next 25 大會上推出,預期也將獲得客戶大量采用。
從此前公布的信息來看,Ironwood TPU 每顆芯片可提供4,614TFLOPS 的峰值算力,驅(qū)動思考型和推論型模型。Ironwood TPU 還大幅增加了高頻寬內(nèi)存(HBM)容量,每顆芯片提供192GB 容量,是Trillium TPU 的6倍,以處理更大型的模型和數(shù)據(jù)集運算;同時Ironwood TPU 每顆芯片帶寬可達7.2Tbps ,是Trillium TPU 的4.5倍。不只如此,Ironwood TPU 性能功耗比是Trillium TPU 的2倍,為客戶的AI 工作負載提供每瓦更多的運算能力。
雖然很多小型云端業(yè)者依舊偏好英偉達 GPU。 對他們而言,GPU不僅能即刻滿足市場需求,且CUDA生態(tài)完整、開發(fā)者接受度高,整體成本反而更低。不過,谷歌似乎成功說服了一家總部位于倫敦的小型云端公司 Fluidstack。
據(jù)了解, Fluidstack公司主要提供 Nvidia GPU 給 AI 新創(chuàng)企業(yè)租用,近期正計劃在紐約興建新數(shù)據(jù)中心。 據(jù)知情人士透露,若Fluidstack無法支付新設(shè)數(shù)據(jù)中心的租金,Google將提供高達32億美元做為“后盾”,藉此換取該公司在數(shù)據(jù)中心部署TPU。
此外,谷歌也曾嘗試與其他專注英偉達芯片的云服務(wù)商達成類似協(xié)議,比如正為OpenAI打造一個部署大量英偉達芯片數(shù)據(jù)中心的Crusoe,以及向微軟和OpenAI租賃英偉達芯片的CoreWeave。
在此之前,谷歌基本不對外出售自研TPU。Capvision此前數(shù)據(jù)顯示,谷歌TPU此前約70%-80%的算力用于內(nèi)部業(yè)務(wù)場景使用,剩余20%-30%以自建租賃方式供外部使用。
至于目前為何谷歌改變心意,開始首次選擇在其他云服務(wù)商的數(shù)據(jù)中心部署TPU,外界認為這可能是谷歌向推動TPU業(yè)務(wù)獨立,與英偉達進行競爭。
在合作伙伴方面,Alphabet目前僅與博通合作TPU,但傳出與聯(lián)發(fā)科也在探索合作機會,由聯(lián)發(fā)科為即將推出的Ironwood TPU提供后端設(shè)計服務(wù)。與此同時,多家AI 公司加速采用TPU,如Anthropic 開始招聘TPU 核心工程師,可能平衡對AWS Trainium 芯片的依賴,馬斯克(Elon Musk)旗下xAI 受到JAX-TPU 工具改進下,對TPU 展現(xiàn)興趣。
D.A. Davidson 分析師認為Alphabet 在AI 硬件領(lǐng)域的價值未被充分估價,但要將TPU 業(yè)務(wù)拆分出來,不過在目前的環(huán)境不太可能發(fā)生,TPU 將會結(jié)合Google DeepMind 研究實力繼續(xù)融入更多Google 產(chǎn)品組合。