《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 華為發(fā)布AI推理創(chuàng)新技術(shù)UCM

華為發(fā)布AI推理創(chuàng)新技術(shù)UCM

可實(shí)現(xiàn)高吞吐、低時(shí)延推理體驗(yàn),計(jì)劃9月開(kāi)源
2025-08-13
來(lái)源:IT之家
關(guān)鍵詞: 華為 AI推理 UCM

8 月 12 日消息,今日,華為正式發(fā)布 AI 推理創(chuàng)新技術(shù) UCM(推理記憶數(shù)據(jù)管理器)。

據(jù)了解,作為一款以 KV Cache 為中心的推理加速套件,UCM 融合了多類(lèi)型緩存加速算法工具,分級(jí)管理推理過(guò)程中產(chǎn)生的 KV Cache 記憶數(shù)據(jù),可擴(kuò)大推理上下文窗口,實(shí)現(xiàn)高吞吐、低時(shí)延的推理體驗(yàn),降低每 Token 推理成本。該技術(shù)已率先在中國(guó)銀聯(lián)“客戶(hù)之聲”“營(yíng)銷(xiāo)策劃”“辦公助手”三大業(yè)務(wù)場(chǎng)景中,開(kāi)展智慧金融 AI 推理加速應(yīng)用試點(diǎn),并已取得成果。

華為計(jì)劃于 2025 年 9 月正式開(kāi)源 UCM,屆時(shí)將在魔擎社區(qū)首發(fā),后續(xù)逐步貢獻(xiàn)給業(yè)界主流推理引擎社區(qū),并共享給業(yè)內(nèi)所有 Share Everything (共享架構(gòu)) 存儲(chǔ)廠商和生態(tài)伙伴。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。