Arm 借助融合型 AI 數(shù)據(jù)中心,重塑計(jì)算格局
2025-12-10
作者:Arm 云 AI 事業(yè)部產(chǎn)品解決方案副總裁 Dermot O’Driscoll
來源:Arm
2025 年初,Arm 曾預(yù)測:Arm 架構(gòu)將占據(jù)近半數(shù) 2025 年出貨到頭部云服務(wù)提供商的算力。
根據(jù)今年前三個(gè)季度的實(shí)際出貨數(shù)據(jù),市場正向著這一預(yù)測目標(biāo)穩(wěn)步邁進(jìn)。這些搭載 Arm 架構(gòu)的服務(wù)器的意義遠(yuǎn)不止于一個(gè)統(tǒng)計(jì)數(shù)字,更重要的是它們構(gòu)成了融合型人工智能 (AI) 數(shù)據(jù)中心這一新型基礎(chǔ)設(shè)施的計(jì)算核心。從云原生服務(wù)到最具挑戰(zhàn)性的 AI 工作負(fù)載,超大規(guī)模云服務(wù)提供商正逐步將基于 Arm 的定制化計(jì)算作為標(biāo)準(zhǔn)路徑,以此實(shí)現(xiàn)性能、功耗與規(guī)模的平衡。
近期發(fā)布的 Amazon Graviton5 正是這一新模式的典范。作為該系列的第五代產(chǎn)品,Graviton5 凝結(jié)了 Arm 架構(gòu)多年積累的能效優(yōu)勢,專為現(xiàn)代數(shù)據(jù)中心需求打造,適用于從高密度 AI 推理到橫向擴(kuò)展的云原生工作負(fù)載。Graviton 已連續(xù)三年在亞馬遜云科技新增 CPU 算力部署中占比超半數(shù);如今,在 Amazon EC2 排名前 1000 的客戶中,已有 98% 在生產(chǎn)環(huán)境中采用 Graviton 系列處理器。
Graviton 也是亞馬遜云科技自研芯片戰(zhàn)略的關(guān)鍵一環(huán),在全新推出的 Amazon Trainium3 UltraServers 中,亞馬遜云科技三款定制芯片均部署于統(tǒng)一的計(jì)算底座中。在該架構(gòu)設(shè)計(jì)中,基于 Arm 架構(gòu)的 Amazon Graviton 和 Amazon Nitro 分別負(fù)責(zé)通用 CPU 計(jì)算及高性能網(wǎng)絡(luò)處理任務(wù),為 Amazon Trainium3 UltraServers 提供核心技術(shù)支撐。
隨著 Arm 架構(gòu)正逐步成為驅(qū)動(dòng) AI 時(shí)代核心平臺(tái)的算力基石,Graviton5 的推出成為行業(yè)變革的又一例證。 · Google Axion:搭載 Arm Neoverse 計(jì)算核心的 Axion 家族處理器現(xiàn)已提供更多的云實(shí)例配置項(xiàng),為云和 AI 工作負(fù)載帶來前所未有的性能表現(xiàn)。 · Microsoft Cobalt 100 及全新發(fā)布的 Cobalt 200:這兩款處理器專為 Microsoft Azure 的 AI 優(yōu)化型數(shù)據(jù)中心的云原生工作負(fù)載打造,為微軟內(nèi)部服務(wù)及 Azure 客戶提供算力支持。 · NVIDIA Grace Blackwell:將 Arm 架構(gòu)的 CPU 與 NVIDIA 的 AI 加速器相結(jié)合,打造出迄今最先進(jìn)的 AI 計(jì)算平臺(tái)。
全球領(lǐng)先的超大規(guī)模云服務(wù)提供商、芯片制造商及系統(tǒng)集成商,早已跨越對定制化計(jì)算的探索期,正將其納入自身基礎(chǔ)設(shè)施戰(zhàn)略核心。Arm 平臺(tái)正是實(shí)現(xiàn)這一產(chǎn)業(yè)融合趨勢的可靠技術(shù)基石。
融合型 AI 數(shù)據(jù)中心的崛起
綜合來看,這些平臺(tái)共同彰顯了數(shù)據(jù)中心的快速演進(jìn)。AI 正在打破基礎(chǔ)設(shè)施內(nèi)部的傳統(tǒng)邊界,將昔日由通用服務(wù)器與設(shè)備構(gòu)成的松散架構(gòu),演變?yōu)橐惶赘叨日?、面?AI 優(yōu)化的環(huán)境,實(shí)現(xiàn)計(jì)算、加速、網(wǎng)絡(luò)、內(nèi)存、存儲(chǔ)及軟件的協(xié)同設(shè)計(jì)與一體化運(yùn)行。
在融合型 AI 數(shù)據(jù)中心中,性能和能效的提升來源于全棧協(xié)同,而非某個(gè)單一組件。Arm 提供連接全棧各層的通用架構(gòu),使云服務(wù)提供商在保持靈活性與效率的同時(shí),能夠進(jìn)行全局優(yōu)化,以滿足現(xiàn)代大規(guī)模工作負(fù)載的嚴(yán)苛要求。
系統(tǒng)各層級對 AI 性能的貢獻(xiàn)各不相同,而 Arm 架構(gòu)貫穿始終:
· CPU 為 AI 系統(tǒng)提供控制平面,包括協(xié)調(diào)調(diào)度、數(shù)據(jù)遷移、內(nèi)存管理以及各類服務(wù)等,同時(shí)執(zhí)行關(guān)鍵模型邏輯,將詞元 (token) 轉(zhuǎn)化為有效操作。
· 加速器可在模型運(yùn)算最密集處提供高密度算力,助力訓(xùn)練與推理在數(shù)千個(gè)節(jié)點(diǎn)上實(shí)現(xiàn)高效規(guī)?;渴?。
· 智能網(wǎng)卡 (SmartNIC)、DPU 及智能網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)可卸載包括安全防護(hù)、網(wǎng)絡(luò)連接和數(shù)據(jù)訪問在內(nèi)的關(guān)鍵服務(wù),并進(jìn)行加速。不論是亞馬遜云科技的 Nitro、NVIDIA 的 BlueField,還是英特爾的 IPU,均可看出這些平臺(tái)正越來越多地采用Arm 架構(gòu)芯片進(jìn)行構(gòu)建,確保數(shù)據(jù)在 AI 計(jì)算的每個(gè)環(huán)節(jié)之間安全高效地傳輸。
由此構(gòu)建的基礎(chǔ)設(shè)施全面提升了每瓦智能 (intelligence-per-watt)——單位能耗下能夠輸出的有效 AI 算力——在保持軟件兼容性和生態(tài)系統(tǒng)一致性的前提下,進(jìn)一步加速創(chuàng)新進(jìn)程。得益于與亞馬遜云科技、Google Cloud、Microsoft Azure 和 NVIDIA 等合作伙伴的深度協(xié)作,基于 Arm 架構(gòu)的定制化計(jì)算方案不僅勢頭漸勁,更進(jìn)入了加速發(fā)展階段。

Graviton5 與計(jì)算性能新拐點(diǎn)
Graviton5 配備 192 個(gè)核心,緩存容量較上一代提升五倍,針對亞馬遜云科技客戶的核心負(fù)載場景,可實(shí)現(xiàn)高達(dá) 25% 的性能躍升。這一提升既彰顯了定制化設(shè)計(jì)的變革性成效,同時(shí)也重新定義了云計(jì)算的經(jīng)濟(jì)效益。當(dāng)性能增速超過功耗和成本的增幅時(shí),行業(yè)格局便會(huì)被改寫,而 Arm 生態(tài)正引領(lǐng)這一關(guān)鍵轉(zhuǎn)折點(diǎn)的到來。
這一發(fā)展勢頭早已突破了超大規(guī)模云服務(wù)的應(yīng)用范疇。如今,企業(yè)端正在將同樣的定制化設(shè)計(jì)原則應(yīng)用于 AI 推理、自動(dòng)駕駛、邊緣計(jì)算、智能網(wǎng)絡(luò)等多元化場景,而驅(qū)動(dòng)這些應(yīng)用場景的,正是同樣支撐著云服務(wù)的 Arm 架構(gòu)。
展望未來:打造普惠的計(jì)算基石
在 Arm 平臺(tái)上共筑未來的,不止是全球企業(yè)巨頭。借助 Arm 全面設(shè)計(jì) (Arm Total Design) 等生態(tài)項(xiàng)目,依托 Arm Neoverse 計(jì)算子系統(tǒng) (CSS) 平臺(tái),Arm 正在賦能更廣泛的生態(tài)合作伙伴,以媲美超大規(guī)模云服務(wù)提供商的效率和速度來打造定制化芯片。同時(shí),Arm 云遷移等項(xiàng)目也在為各種規(guī)模的企業(yè)降低 Arm 架構(gòu)計(jì)算平臺(tái)的部署門檻,助力其充分釋放性能和能效優(yōu)勢。
隨著定制化計(jì)算逐步贏得市場認(rèn)可,全行業(yè)正在積極擁抱這一趨勢。而 Arm 作為這一變革的核心計(jì)算平臺(tái),正引領(lǐng)著未來的無限可能。

