《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 业界动态 > 华为发布全新AI数据基础设施

华为发布全新AI数据基础设施

加速全场景推理体验升级
2026-03-18
來(lái)源:C114通信网
關(guān)鍵詞: 华为 AI推理 AI数据 存储

3月17日,在2026華為數(shù)據(jù)存儲(chǔ)新春發(fā)布會(huì)上,華為正式發(fā)布針對(duì)AI推理場(chǎng)景的全新AI數(shù)據(jù)基礎(chǔ)設(shè)施,包含面向中心推理場(chǎng)景的AI數(shù)據(jù)平臺(tái),和面向分支邊緣推理場(chǎng)景的FusionCube A1000 AI超融合一體機(jī),旨在推動(dòng)AI推理體驗(yàn)全面升級(jí),并顯著降低推理部署門檻,加速AI商業(yè)正循環(huán)。

過(guò)去幾年,AI歷經(jīng)多輪演進(jìn),已邁入了以推理為核心的全新階段。當(dāng)下,企業(yè)正面臨兩大變化:一是數(shù)據(jù)類型與規(guī)模持續(xù)擴(kuò)展,從文本為主轉(zhuǎn)向多模態(tài)格式混合,體量從TB級(jí)躍升至EB級(jí);二是企業(yè)核心資產(chǎn)從“數(shù)據(jù)”轉(zhuǎn)變?yōu)椤爸R(shí)”與“記憶”,被實(shí)時(shí)調(diào)用以支撐智能體自主決策。這些正全面重塑AI數(shù)據(jù)基礎(chǔ)設(shè)施,成為AI行業(yè)化落地的關(guān)鍵。

面向中心推理場(chǎng)景,華為推出AI數(shù)據(jù)平臺(tái)

為解決推理業(yè)務(wù)中知識(shí)質(zhì)量不足、長(zhǎng)序列推理體驗(yàn)差以及推理記憶缺失的三大瓶頸,華為發(fā)布AI數(shù)據(jù)平臺(tái),整合知識(shí)庫(kù)、KV Cache加速和記憶庫(kù),并結(jié)合UCM技術(shù)實(shí)現(xiàn)調(diào)度與管理,破除企業(yè)AI的數(shù)據(jù)門檻,加速智能體應(yīng)用落地。

知識(shí)庫(kù):實(shí)時(shí)生成知識(shí)、高精度檢索知識(shí)

企業(yè)數(shù)據(jù)在不斷變化與更新,如果知識(shí)轉(zhuǎn)化不及時(shí),會(huì)導(dǎo)致模型的推理決策結(jié)果不精準(zhǔn)。華為AI數(shù)據(jù)平臺(tái)采用端到端的解析優(yōu)化、表征優(yōu)化與檢索優(yōu)化,提供一個(gè)可敏銳捕捉源端數(shù)據(jù)變化的AI數(shù)據(jù)管道,并通過(guò)多模無(wú)損解析、Token級(jí)編碼等方式,將文本、圖片、視頻等資源轉(zhuǎn)化成海量細(xì)顆粒度的知識(shí),結(jié)合多維度檢索與重排序,實(shí)現(xiàn)超95%知識(shí)檢索精度。

KV Cache加速:容納海量歷史數(shù)據(jù),加速推理響應(yīng)

在長(zhǎng)文本長(zhǎng)序列、多用戶多并發(fā)的推理過(guò)程中,大量的KV Cache數(shù)據(jù)存不下、系統(tǒng)響應(yīng)遲緩,導(dǎo)致推理體驗(yàn)惡化。華為AI數(shù)據(jù)平臺(tái)針對(duì)性提供了全局分層緩存能力,讓記憶數(shù)據(jù)在On-chip memory、DRAM、外置SSD存儲(chǔ)三層間按需流動(dòng),顯著擴(kuò)充KV Cache存儲(chǔ)池,同時(shí)融合多種稀疏注意力算法,避免重復(fù)計(jì)算,大幅擴(kuò)展上下文窗口,實(shí)現(xiàn)首Token時(shí)延降低90%。

記憶庫(kù):高效管理上下文記憶,讓模型越用越聰明

當(dāng)前,大模型普遍缺乏持久的記憶,會(huì)遺忘多步驟的中間結(jié)果和長(zhǎng)期沉淀的歷史經(jīng)驗(yàn),無(wú)法真正實(shí)現(xiàn)自我進(jìn)化。華為AI數(shù)據(jù)平臺(tái)提供精準(zhǔn)的記憶萃取與召回能力,實(shí)現(xiàn)上下文狀態(tài)保持、信息凝練。記得越多,推理就越精準(zhǔn),模型應(yīng)用才能“越用越聰明”。

本次發(fā)布的AI數(shù)據(jù)平臺(tái)可提供一體化和獨(dú)立式兩大部署模式。一體化部署以O(shè)ceanStor A800為全棧一體機(jī)底座;獨(dú)立式部署采用“數(shù)據(jù)引擎節(jié)點(diǎn)+OceanStor Dorado”架構(gòu),可在現(xiàn)有存儲(chǔ)系統(tǒng)上新增數(shù)據(jù)引擎節(jié)點(diǎn),保護(hù)歷史投資,支撐業(yè)務(wù)平滑轉(zhuǎn)型。

面向分支邊緣推理場(chǎng)景,華為發(fā)布FusionCube A1000 AI超融合一體機(jī)

如今,大量的數(shù)據(jù)是在分支邊緣場(chǎng)景產(chǎn)生的,針對(duì)傳統(tǒng)分支邊緣場(chǎng)景進(jìn)行智能化改造過(guò)程中所面臨的部署復(fù)雜、成本高昂、效率低下等問(wèn)題,華為推出FusionCube A1000 AI超融合一體機(jī),通過(guò)集成化與智能化交付,助力AI快速部署與高效運(yùn)行。

FusionCube A1000采用通算與智算融合一體化架構(gòu),實(shí)現(xiàn)AI部署“開(kāi)箱即用”。其內(nèi)置的AI平臺(tái)預(yù)集成了數(shù)據(jù)處理、模型訓(xùn)練與推理全流程能力,基礎(chǔ)設(shè)施部署與應(yīng)用上線周期顯著縮短80%。同時(shí),F(xiàn)usionCube A1000具備統(tǒng)一運(yùn)維、安全運(yùn)營(yíng)的能力,實(shí)現(xiàn)全棧管理、健康監(jiān)測(cè)、故障快速定位定界,為智能體穩(wěn)定高效地運(yùn)行提供安全保障。

此外,F(xiàn)usionCube A1000支持邊緣與中心協(xié)同運(yùn)行,打破數(shù)據(jù)孤島,形成智能體從感知到自主決策的閉環(huán)。分支邊緣側(cè)產(chǎn)生的數(shù)據(jù)將回傳至中心,在中心側(cè)不斷豐富語(yǔ)料、完成模型增訓(xùn),模型更新后可一鍵下發(fā)至邊緣側(cè),實(shí)現(xiàn)模型能力的持續(xù)優(yōu)化與共享。同時(shí),F(xiàn)usionCube A1000支持算力的動(dòng)態(tài)切分與調(diào)度,可同時(shí)運(yùn)行多個(gè)不同的AI模型,并依據(jù)業(yè)務(wù)優(yōu)先級(jí)智能分配資源,單卡算力利用率提升約30%。其內(nèi)置平臺(tái)還支持知識(shí)庫(kù)與記憶庫(kù)的協(xié)同構(gòu)建,數(shù)據(jù)飛輪無(wú)感運(yùn)轉(zhuǎn),持續(xù)提升AI模型輸出的準(zhǔn)確性與實(shí)用性。

此次發(fā)布的華為AI數(shù)據(jù)平臺(tái)與FusionCube A1000,實(shí)現(xiàn)了從中心到邊緣的AI推理全場(chǎng)景覆蓋,為AI技術(shù)廣泛行業(yè)化落地注入新動(dòng)能。華為數(shù)據(jù)存儲(chǔ)將持續(xù)深耕創(chuàng)新,賦能AI全路徑,助力企業(yè)兌現(xiàn)AI商業(yè)價(jià)值。

2.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。