8月26月消息,英特爾近日公布了有關(guān)其新一代基于 Intel 18A 工藝節(jié)點(diǎn)的代號(hào)為Clearwater Forest 服務(wù)器CPU,曝光的首款產(chǎn)品為288核的E-Core Xeon(至強(qiáng))系列。
就像Xeon 6系列被分為P-Core和E-Core兩種口味一樣,比如Granite Rapids和Sierra Forest,我們將看到新一代Xeon家族出現(xiàn)在僅P-Core的“Diamond Rapids”和僅E-Core的“Clear Water Forest”系列中。其中,P-Core系列針對(duì)性能進(jìn)行了優(yōu)化,可處理更多計(jì)算密集型和人工智能工作負(fù)載,而E-Core的系列則針對(duì)效率和處理高密度/橫向擴(kuò)展工作負(fù)載進(jìn)行了優(yōu)化。
英特爾在其 Hot Chips 2025 演示中概述了 Clearwater Forest Xeon CPU 將在該公司最新、最好的 18A 工藝節(jié)點(diǎn)上制造,Panther Lake 也在客戶端使用該節(jié)點(diǎn),將于今年晚些時(shí)候上市。
代號(hào)為Clearwater Forest 的 E-Core Xeon CPU 的一些主要亮點(diǎn)包括:
英特爾最新的工藝節(jié)點(diǎn) 18A: 提高性能和能效;
英特爾最新的效率核心架構(gòu):針對(duì) 18A 工藝調(diào)整的 IPC 性能提升;
英特爾 Foveros Direct 3D 封裝: 更短的節(jié)能路線,更大的LLC(末級(jí)緩存);
增加內(nèi)存帶寬:12 通道 DDR5-8000。
具體來說,英特爾的 Clearwater Forest 基于18A 節(jié)點(diǎn),利用背面供電與全環(huán)繞柵極技術(shù)相結(jié)合,提供 FET Z 擴(kuò)展之外的眾多優(yōu)勢(shì)。18A 帶來了更低的柵極電容,從而提高了核心邏輯電源效率,更高的電池密度和超過 90% 的電池利用率,改進(jìn)的信號(hào)路由,有助于減少 RC 延遲并進(jìn)一步提高效率。最后,提供低損耗功率傳輸,損耗降低 4-5%。
在核心架構(gòu)方面,英特爾正在利用其針對(duì) Clearwater Forest 的 Darkmont E-Core 設(shè)計(jì),這是對(duì) Sierra Forest 使用的 Sierra Glen E-Core 的更新。這些內(nèi)核提供:
更智能的前端;
更深層次的無序引擎;
更大的標(biāo)量和矢量執(zhí)行;
增強(qiáng)型內(nèi)存子系統(tǒng)。
全新的 Clearwater Forest E-Core 前端具有一個(gè) 64kB 指令緩存、三個(gè) 3 寬指令解碼器,每個(gè)周期有 9 次解碼,可提供 50% 以上的指令帶寬,以及一個(gè)更準(zhǔn)確的分支預(yù)測(cè)器,可能使用深層分支歷史記錄和更大的結(jié)構(gòu)大小。
OOE(無序引擎)也進(jìn)行了升級(jí),具有 8 個(gè)寬分配(增加 60%),以及 16 個(gè)寬停用(增加 2 倍)以實(shí)現(xiàn)執(zhí)行并行性。入門無序窗口大小增加了 60%,有 416 個(gè)單位,而 26 個(gè)執(zhí)行端口比上一代增加了 50%。
執(zhí)行引擎有 26 個(gè)執(zhí)行端口來處理一系列工作負(fù)載,而專用硬件則提高了效率。整數(shù)和矢量執(zhí)行單元增加了 2 倍,而負(fù)載地址生成增加了 1.5 倍,存儲(chǔ)地址生成提高了 2 倍。
核心內(nèi)存子系統(tǒng)增加50%,達(dá)到Three Load,而Two Store保持不變。提前發(fā)布負(fù)載可能有助于減少延遲。深度緩沖最多支持128個(gè)未解決的L2未命中(增加2倍)。Clearwater Forest上還有先進(jìn)的預(yù)取器,而Xeon E-Core的特定功能列表包括:
L1 數(shù)據(jù)緩存 ECC;
數(shù)據(jù)中毒支持;
可恢復(fù)的機(jī)器檢查;
本地計(jì)算機(jī)檢查;
52 個(gè)物理地址位;
核心鎖步。
英特爾還利用帶有 Clearwater Forest“E-Core”Xeon CPU 的新模塊化架構(gòu)。這包括 4 MB 的統(tǒng)一 L2 緩存,每個(gè)四核集群有 17 個(gè)延遲周期,最多可提供 288 MB 的 L2。L2 緩存還提供更高的帶寬,最高可達(dá) 2 倍或 400 GB/s。除此之外,基礎(chǔ)Tile還包括一個(gè)更大的 LLC,額定大小高達(dá) 576 MB。
根據(jù) SpecIntRate'17 中進(jìn)行的測(cè)量,IPC 增長(zhǎng)了 17%。每個(gè)內(nèi)核與 L2 緩存共享 200 GB/s 的帶寬,而 35 GB/s 的結(jié)構(gòu)互連將集群連接在一起。
英特爾在構(gòu)建 Clearwater Forest 時(shí)采用了全 3D集成,共有 12 個(gè) CPU 小芯片,這些小芯片是在 18A 工藝節(jié)點(diǎn)上制造的。它們位于三個(gè)單獨(dú)的基礎(chǔ)Tile上,其中包括 Fabric、LLC、內(nèi)存控制器和 I/O,并且基于 Intel 3 進(jìn)程節(jié)點(diǎn)。該轉(zhuǎn)接器包含兩個(gè)基于 Intel 7 的 I/O 小芯片,并具有高速 I/O、結(jié)構(gòu)和加速器。通信由英特爾的 EMIB 互連解決方案處理。所以總共:
12 個(gè) E 核 CPU 小芯片(Intel 18A);
3 個(gè)基本Tile (Intel 3);
2 個(gè) I/O 小芯片(Intel 7)。
Clearwater Forest還使用了一種單片網(wǎng)狀相干結(jié)構(gòu),該結(jié)構(gòu)使用更短的路線、更多的金屬資源和高密度互連來提高能效。
最后,英特爾分享了2S Clearwater E-Core Xeon解決方案的一些性能方面。CPU支持雙插槽服務(wù)器中高達(dá)3 TB容量的12通道DDR5-8000內(nèi)存,以及高達(dá)1300 GB/s的內(nèi)存帶寬。相比之下,英特爾的Sierra Forest在12個(gè)通道上支持高達(dá)DDR5-6400的DRAM。該平臺(tái)支持2 x 96 PCIe Gen5和64個(gè)CXL通道,144個(gè)UPI(576 GB/s),使用576核+1152 MB LLC解決方案,您可以達(dá)到59 TF/s,即5000 GB/s的原始帶寬。
英特爾的Clearwater Forest Xeon系列預(yù)計(jì)將在今年年底推出,因此請(qǐng)繼續(xù)關(guān)注即將推出的P-core版本。