《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 英偉達CUDA重大更新

英偉達CUDA重大更新

2025-08-22
來源:EETOP
關(guān)鍵詞: 英偉達 CUDA

日前,Nvidia 發(fā)布了其 CUDA 工具包的最新更新,Ver. 13 引入了重大的性能更新。


CUDA 13 版本特性概述

CUDA 13 版本引入了全新 CPU 資源支持、統(tǒng)一 Arm 平臺架構(gòu),并新增了多個操作系統(tǒng)適配。
英偉達已發(fā)布 CUDA 工具包的最新更新版本,13 版本帶來了顯著的性能升級。

11.jpg


CUDA Toolkit 版本 13 現(xiàn)在支持最新的 Blackwell GPU 系列

升級后的工具包增強了程序員使用便利性、兼容性及語言加速能力。13 版本還首次在英偉達生態(tài)中引入基于分塊的編程模型,進一步降低開發(fā)者工作量。


什么是 CUDA?

圖形處理器(GPU)針對含多個小型處理核心的高度并行運算進行了優(yōu)化,但其本身難以直接用于非圖形計算場景的編程。CUDA 是英偉達開發(fā)的計算環(huán)境,支持圖形渲染以外的高性能計算應(yīng)用。該平臺作為 GPU 與通用應(yīng)用程序之間的中間層,可賦能需要并行運算的程序,同時包含豐富的庫、編譯器指令及語言適配功能。
AI 大語言模型開發(fā)與應(yīng)用、科學(xué)分析及密碼學(xué)等復(fù)雜場景,均能從 GPU 及多 GPU 系統(tǒng)提供的大規(guī)模并行計算中獲益。CUDA 的設(shè)計目標即讓廣泛的應(yīng)用開發(fā)者能夠利用這些計算場景。


13 版本關(guān)鍵更新

CUDA 13 新增對英偉達最新 Blackwell GPU、Jetson Thor 高級 AI 與機器人 GPU,以及 DGX Spark “桌面超級計算機” 的支持。其支持范圍覆蓋至當(dāng)前所有架構(gòu)的英偉達 GPU(不再支持 7.5 之前的架構(gòu)),并針對 Blackwell 架構(gòu)更新了 32 字節(jié)對齊的向量類型以提升性能。

該工具包統(tǒng)一了 Arm 平臺的開發(fā)者體驗,提供覆蓋服務(wù)器與嵌入式應(yīng)用的單一工具鏈,同時更新了操作系統(tǒng)與平臺支持,包括紅帽企業(yè) Linux 10、Debian 12.10、Fedora 42,以及 Rocky Linux 10.0 和 9.6。此外,NVIDIA Nsight 開發(fā)工具得到更新以優(yōu)化依賴檢查,CUDA 數(shù)學(xué)庫(如 cuBLAS、cuSPARSE、cuSOLVER 及 cuFFT)也完成升級。

NVCC 編譯器現(xiàn)支持 GCC 15 與 Clang 20,并引入新語言特性以改善應(yīng)用二進制接口(ABI)集成。用戶還將獲得加速的 Python 核心與開發(fā)者友好的封裝方式,Wheel 包與 CUDA 核心計算庫(CCCL)也優(yōu)化了庫結(jié)構(gòu)。


統(tǒng)一服務(wù)器與嵌入式開發(fā)工具鏈

在 13 版本之前,CUDA 幾乎可視為兩個獨立產(chǎn)品:開發(fā)者需分別安裝服務(wù)器級項目與嵌入式項目的工具鏈。兩者語法與操作雖高度相似,但針對服務(wù)器與嵌入式目標的庫、頭文件及其他開發(fā)組件存在差異。

13 版本打破了這一限制:現(xiàn)在單一工具鏈可同時適配兩種目標場景,生成的二進制文件會針對開發(fā)者使用的 GPU 自動優(yōu)化,無需因部署場景切換工具鏈。
新版本還整合了與 GPU 部署配套的 Arm 代碼 ——Arm 二進制文件兼容所有 Arm 目標設(shè)備(僅 Orin sm_87 除外)及仿真平臺,而舊版本需要為仿真與部署使用不同工具鏈。

12.jpg


基于分塊的并行編程

分塊編程(或基于數(shù)組的編程)支持對數(shù)組或矩陣中的所有數(shù)據(jù)點同時執(zhí)行指令。并行編程常需對多個數(shù)據(jù)塊同時執(zhí)行相同操作,而分塊編程可自動為開發(fā)者處理并行邏輯:只需編寫單個函數(shù),底層智能層會處理所有低級細節(jié)以實現(xiàn)并行運算。

比較塊級編程與基于圖塊的編程。

編譯器與運行時系統(tǒng)負責(zé)在線程與核心間分配負載,該抽象層在大幅降低編碼負擔(dān)的同時實現(xiàn)了性能最大化。


免費獲取

英偉達 CUDA 工具包 13 版本現(xiàn)已開放免費下載,支持 Linux x86_64 與 arm64-sbsa 多發(fā)行版,以及 Windows 10、11、Server 2022 和 Server 2025 的 x86_64 平臺。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。