123,123,123

华为发布全新AI数据基础设施

加速全场景推理体验升级

日期： 2026-03-18

來(lái)源：C114通信网

關(guān)鍵詞： 华为 AI推理 AI数据存储

3月17日，在2026華為數(shù)據(jù)存儲(chǔ)新春發(fā)布會(huì)上，華為正式發(fā)布針對(duì)AI推理場(chǎng)景的全新AI數(shù)據(jù)基礎(chǔ)設(shè)施，包含面向中心推理場(chǎng)景的AI數(shù)據(jù)平臺(tái)，和面向分支邊緣推理場(chǎng)景的FusionCube A1000 AI超融合一體機(jī)，旨在推動(dòng)AI推理體驗(yàn)全面升級(jí)，并顯著降低推理部署門檻，加速AI商業(yè)正循環(huán)。

過(guò)去幾年，AI歷經(jīng)多輪演進(jìn)，已邁入了以推理為核心的全新階段。當(dāng)下，企業(yè)正面臨兩大變化：一是數(shù)據(jù)類型與規(guī)模持續(xù)擴(kuò)展，從文本為主轉(zhuǎn)向多模態(tài)格式混合，體量從TB級(jí)躍升至EB級(jí)；二是企業(yè)核心資產(chǎn)從“數(shù)據(jù)”轉(zhuǎn)變?yōu)椤爸R(shí)”與“記憶”，被實(shí)時(shí)調(diào)用以支撐智能體自主決策。這些正全面重塑AI數(shù)據(jù)基礎(chǔ)設(shè)施，成為AI行業(yè)化落地的關(guān)鍵。

面向中心推理場(chǎng)景，華為推出AI數(shù)據(jù)平臺(tái)

為解決推理業(yè)務(wù)中知識(shí)質(zhì)量不足、長(zhǎng)序列推理體驗(yàn)差以及推理記憶缺失的三大瓶頸，華為發(fā)布AI數(shù)據(jù)平臺(tái)，整合知識(shí)庫(kù)、KV Cache加速和記憶庫(kù)，并結(jié)合UCM技術(shù)實(shí)現(xiàn)調(diào)度與管理，破除企業(yè)AI的數(shù)據(jù)門檻，加速智能體應(yīng)用落地。

知識(shí)庫(kù)：實(shí)時(shí)生成知識(shí)、高精度檢索知識(shí)

企業(yè)數(shù)據(jù)在不斷變化與更新，如果知識(shí)轉(zhuǎn)化不及時(shí)，會(huì)導(dǎo)致模型的推理決策結(jié)果不精準(zhǔn)。華為AI數(shù)據(jù)平臺(tái)采用端到端的解析優(yōu)化、表征優(yōu)化與檢索優(yōu)化，提供一個(gè)可敏銳捕捉源端數(shù)據(jù)變化的AI數(shù)據(jù)管道，并通過(guò)多模無(wú)損解析、Token級(jí)編碼等方式，將文本、圖片、視頻等資源轉(zhuǎn)化成海量細(xì)顆粒度的知識(shí)，結(jié)合多維度檢索與重排序，實(shí)現(xiàn)超95%知識(shí)檢索精度。

KV Cache加速：容納海量歷史數(shù)據(jù)，加速推理響應(yīng)

在長(zhǎng)文本長(zhǎng)序列、多用戶多并發(fā)的推理過(guò)程中，大量的KV Cache數(shù)據(jù)存不下、系統(tǒng)響應(yīng)遲緩，導(dǎo)致推理體驗(yàn)惡化。華為AI數(shù)據(jù)平臺(tái)針對(duì)性提供了全局分層緩存能力，讓記憶數(shù)據(jù)在On-chip memory、DRAM、外置SSD存儲(chǔ)三層間按需流動(dòng)，顯著擴(kuò)充KV Cache存儲(chǔ)池，同時(shí)融合多種稀疏注意力算法，避免重復(fù)計(jì)算，大幅擴(kuò)展上下文窗口，實(shí)現(xiàn)首Token時(shí)延降低90%。

記憶庫(kù)：高效管理上下文記憶，讓模型越用越聰明

當(dāng)前，大模型普遍缺乏持久的記憶，會(huì)遺忘多步驟的中間結(jié)果和長(zhǎng)期沉淀的歷史經(jīng)驗(yàn)，無(wú)法真正實(shí)現(xiàn)自我進(jìn)化。華為AI數(shù)據(jù)平臺(tái)提供精準(zhǔn)的記憶萃取與召回能力，實(shí)現(xiàn)上下文狀態(tài)保持、信息凝練。記得越多，推理就越精準(zhǔn)，模型應(yīng)用才能“越用越聰明”。

本次發(fā)布的AI數(shù)據(jù)平臺(tái)可提供一體化和獨(dú)立式兩大部署模式。一體化部署以O(shè)ceanStor A800為全棧一體機(jī)底座；獨(dú)立式部署采用“數(shù)據(jù)引擎節(jié)點(diǎn)+OceanStor Dorado”架構(gòu)，可在現(xiàn)有存儲(chǔ)系統(tǒng)上新增數(shù)據(jù)引擎節(jié)點(diǎn)，保護(hù)歷史投資，支撐業(yè)務(wù)平滑轉(zhuǎn)型。

面向分支邊緣推理場(chǎng)景，華為發(fā)布FusionCube A1000 AI超融合一體機(jī)

如今，大量的數(shù)據(jù)是在分支邊緣場(chǎng)景產(chǎn)生的，針對(duì)傳統(tǒng)分支邊緣場(chǎng)景進(jìn)行智能化改造過(guò)程中所面臨的部署復(fù)雜、成本高昂、效率低下等問(wèn)題，華為推出FusionCube A1000 AI超融合一體機(jī)，通過(guò)集成化與智能化交付，助力AI快速部署與高效運(yùn)行。

FusionCube A1000采用通算與智算融合一體化架構(gòu)，實(shí)現(xiàn)AI部署“開(kāi)箱即用”。其內(nèi)置的AI平臺(tái)預(yù)集成了數(shù)據(jù)處理、模型訓(xùn)練與推理全流程能力，基礎(chǔ)設(shè)施部署與應(yīng)用上線周期顯著縮短80%。同時(shí)，F(xiàn)usionCube A1000具備統(tǒng)一運(yùn)維、安全運(yùn)營(yíng)的能力，實(shí)現(xiàn)全棧管理、健康監(jiān)測(cè)、故障快速定位定界，為智能體穩(wěn)定高效地運(yùn)行提供安全保障。

此外，F(xiàn)usionCube A1000支持邊緣與中心協(xié)同運(yùn)行，打破數(shù)據(jù)孤島，形成智能體從感知到自主決策的閉環(huán)。分支邊緣側(cè)產(chǎn)生的數(shù)據(jù)將回傳至中心，在中心側(cè)不斷豐富語(yǔ)料、完成模型增訓(xùn)，模型更新后可一鍵下發(fā)至邊緣側(cè)，實(shí)現(xiàn)模型能力的持續(xù)優(yōu)化與共享。同時(shí)，F(xiàn)usionCube A1000支持算力的動(dòng)態(tài)切分與調(diào)度，可同時(shí)運(yùn)行多個(gè)不同的AI模型，并依據(jù)業(yè)務(wù)優(yōu)先級(jí)智能分配資源，單卡算力利用率提升約30%。其內(nèi)置平臺(tái)還支持知識(shí)庫(kù)與記憶庫(kù)的協(xié)同構(gòu)建，數(shù)據(jù)飛輪無(wú)感運(yùn)轉(zhuǎn)，持續(xù)提升AI模型輸出的準(zhǔn)確性與實(shí)用性。

此次發(fā)布的華為AI數(shù)據(jù)平臺(tái)與FusionCube A1000，實(shí)現(xiàn)了從中心到邊緣的AI推理全場(chǎng)景覆蓋，為AI技術(shù)廣泛行業(yè)化落地注入新動(dòng)能。華為數(shù)據(jù)存儲(chǔ)將持續(xù)深耕創(chuàng)新，賦能AI全路徑，助力企業(yè)兌現(xiàn)AI商業(yè)價(jià)值。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

华为发布全新AI数据基础设施

日期： 2026-03-18

來(lái)源：C114通信网

相關(guān)內(nèi)容