1月21日消息,當你點開社交平臺,瞬間看到心儀的電影推薦;當購物網站精準呈現(xiàn)你可能喜歡的商品——這些智能服務背后,是計算系統(tǒng)在海量數據中進行的急速運算與抉擇。
然而,支撐這一切的傳統(tǒng)計算芯片正在面臨速度與能耗的雙重壓力,科學家們將目光投向超越傳統(tǒng)數字計算的新架構。
北京大學孫仲研究員團隊在這一前沿領域取得關鍵突破,成功研發(fā)出高能效的新型專用計算芯片,首次為繁復的計算任務提供了專用硬件加速方案。
實驗表明,相較于先進數字芯片,該系統(tǒng)計算速度提升約12倍,能效比提升超過228倍。相關成果發(fā)表于國際期刊《自然·通訊》。
“這項研究瞄準了機器學習中的一項核心任務——非負矩陣分解。該技術如同一位高效的‘數據解讀者’,能從巨量且龐雜的用戶行為、圖像像素等信息中,提煉出潛在的模式與特征,在圖像分析、信息聚類、個性化推薦等領域具有廣泛應用。
然而,它的計算過程要求同步求解兩個矩陣,極為繁復,依賴傳統(tǒng)數字芯片的串行計算模式,往往力不從心,成為制約實時智能的瓶頸?!睂O仲告訴記者。
正因如此,團隊創(chuàng)新性轉向了模擬計算這一新興賽道,成功研制出基于阻變存儲器的非負矩陣分解模擬計算求解器。
“這就像是為一項特定且繁重的任務,打造了一把高度定制化的‘智能鑰匙’,而非繼續(xù)使用通用的‘萬能扳手’。通過精巧的電路設計與算法協(xié)同創(chuàng)新,我們在阻變存儲器陣列上構建出高度緊湊的模擬電路,并采用原創(chuàng)的電導補償技術,使得核心計算步驟能夠實現(xiàn)‘一步求解’,極大優(yōu)化了芯片的面積與能耗表現(xiàn)?!睂O仲說。
為驗證系統(tǒng)性能,研究團隊在實驗室中成功搭建原型系統(tǒng),并完成多組實驗測試。
該系統(tǒng)既完成了對彩色圖像的高質量分解,信噪比損失微乎其微;也高效處理了電影推薦數據集訓練任務,精度幾乎與數字芯片無異。
系統(tǒng)級評估顯示,在面對網飛規(guī)模數據集的推薦系統(tǒng)訓練任務時,該模擬求解器的計算速度較先進數字芯片提升約12倍,而能效比更是實現(xiàn)了超過228倍的飛躍性提升。
“這項工作為非負矩陣分解這類約束優(yōu)化問題的實時求解開辟了新路徑,展現(xiàn)了模擬計算處理現(xiàn)實復雜數據的巨大潛力?!睂O仲說,“這意味著,未來此類高能效專用芯片,有望大幅提升個性化推薦的實時響應能力,并為生成式AI訓練提供更節(jié)能、更快的算力支持?!?/p>
“這項成果不僅拓展了高效計算架構的應用邊界,更為應對人工智能時代的算力挑戰(zhàn)提供了創(chuàng)新解決方案。
隨著后續(xù)研究深入和產業(yè)化進程推進,此類高能效專用計算架構有望在更多關鍵領域實現(xiàn)應用,為我國在下一代智能計算技術競爭中構建核心優(yōu)勢?!睂O仲期待。

