2 月 28 日消息,當(dāng)?shù)貢r(shí)間 2 月 27 日,據(jù)《The Information》援引知情人士消息稱,Meta 在自研 AI 芯片方面遭遇重大挫折,已放棄其最先進(jìn)的訓(xùn)練芯片項(xiàng)目,并將開發(fā)重點(diǎn)轉(zhuǎn)向結(jié)構(gòu)更簡(jiǎn)單的替代方案。
由于芯片設(shè)計(jì)難度超出預(yù)期,Meta 上周決定取消正在開發(fā)的高端 AI 訓(xùn)練芯片,并已向 AI 基礎(chǔ)設(shè)施部門員工通報(bào)這一調(diào)整。
Meta 調(diào)整芯片戰(zhàn)略的同時(shí),也在加強(qiáng)與現(xiàn)有芯片供應(yīng)商的合作。據(jù)報(bào)道,Meta 已簽署價(jià)值數(shù)十億美元的協(xié)議,從谷歌租用 AI 芯片。AMD 本周表示,將與 Meta 合作部署最多 6GW 的 Instinct AI 芯片,以支持 Meta 下一代 AI 基礎(chǔ)設(shè)施。此外,Meta 本月還宣布與英偉達(dá)建立跨多代合作關(guān)系,將繼續(xù)在數(shù)據(jù)中心部署英偉達(dá)芯片。
Meta 自研芯片屬于“Meta 訓(xùn)練和推理加速器”(MTIA)項(xiàng)目,目標(biāo)是降低對(duì)外部供應(yīng)商的依賴,同時(shí)減少數(shù)據(jù)中心運(yùn)營(yíng)成本并增強(qiáng)基礎(chǔ)設(shè)施控制能力。
Meta 已放棄其第二代訓(xùn)練芯片 Iris 的一個(gè)版本,并隨后啟動(dòng)更先進(jìn)芯片 Olympus 的開發(fā),但該項(xiàng)目同樣遭到了夭折的命運(yùn)。一名參與芯片開發(fā)的人員表示,公司內(nèi)部對(duì)能否開發(fā)出可與英偉達(dá)性能匹敵的芯片持懷疑態(tài)度,原因包括開發(fā)周期長(zhǎng)、設(shè)計(jì)復(fù)雜以及功耗控制難度高。如果功耗無(wú)法有效控制,將削弱芯片相對(duì)于英偉達(dá)產(chǎn)品的競(jìng)爭(zhēng)力。
在技術(shù)架構(gòu)方面,Iris 采用單指令多數(shù)據(jù)(SIMD)架構(gòu),這種架構(gòu)更易于硬件設(shè)計(jì),但軟件開發(fā)難度較高。Olympus 則采用單指令多線程(SIMT)架構(gòu),與英偉達(dá)芯片類似。這種架構(gòu)更適合 AI 訓(xùn)練軟件,但硬件實(shí)現(xiàn)復(fù)雜度更高。
Meta 原計(jì)劃最早于 2026 年第四季度完成 Olympus 設(shè)計(jì),而芯片設(shè)計(jì)完成后通常仍需至少 9 個(gè)月才能實(shí)現(xiàn)量產(chǎn)。Olympus 的 GPU 原計(jì)劃采用 Meta 去年收購(gòu)的 Rivos 的技術(shù),該技術(shù)可兼容英偉達(dá)的 Cuda 軟件生態(tài),而 Cuda 是當(dāng)前 AI 訓(xùn)練的行業(yè)標(biāo)準(zhǔn)。
Meta 最初計(jì)劃基于 Olympus 構(gòu)建大規(guī)模 AI 訓(xùn)練服務(wù)器集群,但管理層認(rèn)為,這一方案存在風(fēng)險(xiǎn),可能影響公司在與 OpenAI 和谷歌競(jìng)爭(zhēng)過程中訓(xùn)練新模型的進(jìn)度。此外,軟件成熟度可能不及英偉達(dá)生態(tài),而復(fù)雜設(shè)計(jì)也可能增加量產(chǎn)難度。
因此,Meta 目前計(jì)劃繼續(xù)依賴外部供應(yīng)商提供的 AI 訓(xùn)練芯片,因?yàn)檫@些芯片的軟件生態(tài)更加成熟,風(fēng)險(xiǎn)更低。

