《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 電子元件 > 業(yè)界動(dòng)態(tài) > 英偉達(dá)最終活成了“三芯”

英偉達(dá)最終活成了“三芯”

2021-04-13
來(lái)源:雷鋒網(wǎng)
關(guān)鍵詞: 英偉達(dá) ARM架構(gòu) CPU

  英偉達(dá)(NVIDIA)400億美元收購(gòu)Arm的交易還未最終達(dá)成,但并不妨礙英偉達(dá)推出其首款基于Arm架構(gòu)的數(shù)據(jù)中心CPU。今年的GTC 21依舊選擇了線上的方式,英偉達(dá)首席執(zhí)行官黃仁勛還是在自家廚房介紹了AI、汽車(chē)、機(jī)器人、5G、實(shí)時(shí)圖形、協(xié)作和數(shù)據(jù)中心等領(lǐng)域的最新進(jìn)展。

  雖然還是穿著皮衣的黃教主,但他今年更具搖滾氣質(zhì)。不僅推出了全球首款為terabyte 級(jí)別計(jì)算設(shè)計(jì)的 CPU Grace,還將英偉達(dá)的數(shù)據(jù)中心產(chǎn)品路線圖升級(jí)為GPU+CPU+DPU,只為提供10倍甚至更高的性能,保持其在AI領(lǐng)域的競(jìng)爭(zhēng)力,也推動(dòng)芯片行業(yè)的競(jìng)爭(zhēng)進(jìn)入”組合拳“時(shí)代。

  微信圖片_20210413165120.png

  不要忽略,作為一家系統(tǒng)公司,英偉達(dá)有更高遠(yuǎn)的目標(biāo)。

  黃仁勛說(shuō):”NVIDIA正在為當(dāng)今時(shí)代的每一位‘達(dá)芬奇’推進(jìn)他們的各項(xiàng)研究工作,包括語(yǔ)言理解、藥物研發(fā)或量子計(jì)算等。英偉達(dá)將助力成就他們畢生的事業(yè)。“

  1

  英偉達(dá)首款數(shù)據(jù)中心CPU性能

  提升一個(gè)數(shù)量級(jí)

  英偉達(dá)發(fā)布的首款數(shù)據(jù)中心CPU叫做Grace,是以美國(guó)海軍少將、計(jì)算機(jī)編程先驅(qū)Grace Hopper的名字命名。雷鋒網(wǎng)了解到,Grace采用臺(tái)積電5nm工藝。

  注意,Grace是一款高度專(zhuān)用型處理器,主要面向大型數(shù)據(jù)密集型HPC和AI應(yīng)用。也就是說(shuō),絕大多數(shù)的數(shù)據(jù)中心仍將繼續(xù)使用現(xiàn)有的CPU,Grace主要將用于計(jì)算領(lǐng)域的細(xì)分市場(chǎng),預(yù)計(jì)2023年可以供貨。

  微信圖片_20210413165142.png

  Grace在計(jì)算的細(xì)分領(lǐng)域可以實(shí)現(xiàn)數(shù)量級(jí)的性能提升。黃仁勛稱(chēng),基于Grace的系統(tǒng)與英偉達(dá)GPU緊密結(jié)合,性能將比目前最先進(jìn)的NVIDIA DGX系統(tǒng)(在x86 CPU上運(yùn)行)高出10倍。

  Arm屬于精簡(jiǎn)指令集,相比x86這樣的復(fù)雜指令集實(shí)現(xiàn)高性能的挑戰(zhàn)更大,英偉達(dá)分三步來(lái)實(shí)現(xiàn)超越x86 CPU的性能。

  第一,Grace內(nèi)置下一代Arm Neoverse內(nèi)核,每個(gè)CPU能在SPECrate2017_int_base基準(zhǔn)測(cè)試中分?jǐn)?shù)超過(guò)300分,為Grace提供足夠的計(jì)算性能。

  第二,有了足夠的計(jì)算性能,要滿足AI計(jì)算的需求,內(nèi)存帶寬成為瓶頸。因此,Grace采用了新內(nèi)存LPDDR5x技術(shù),帶寬是LPDDR4的兩倍,能源效率提高了10倍。

  第三,CPU和GPU之間的數(shù)據(jù)傳輸速度同樣限制了數(shù)據(jù)密集的AI計(jì)算,Grace采用第四代NVIDIA NVLink,可以實(shí)現(xiàn)從CPU到GPU連接速度超過(guò)900GB/s,相當(dāng)于目前服務(wù)器14倍的帶寬。

  從計(jì)算性能到解決帶寬問(wèn)題,再到CPU和GPU的緊密結(jié)合,使得英偉達(dá)的Arm架構(gòu)Grace可以實(shí)現(xiàn)10倍的性能提升,達(dá)到一個(gè)數(shù)量級(jí)的提升。

  Grace對(duì)于英偉達(dá)而言,是保持其AI競(jìng)爭(zhēng)力的關(guān)鍵。由于超大規(guī)模的模型很難完全放進(jìn)GPU內(nèi)存,如果存儲(chǔ)在系統(tǒng)內(nèi)存,訪問(wèn)速度則會(huì)大大受限,如果選用其它CPU供應(yīng)商的產(chǎn)品,不能實(shí)現(xiàn)最高的性能優(yōu)化。

  自研一款CPU,不僅可以實(shí)現(xiàn)更高性能,未來(lái)的迭代,以及進(jìn)行系統(tǒng)優(yōu)化也更容易。同時(shí),英偉達(dá)還能幫助Arm將優(yōu)勢(shì)拓展到移動(dòng)計(jì)算之外,無(wú)論是對(duì)英偉達(dá)自身還是Arm而言都是優(yōu)選。

  畢竟,黃仁勛對(duì)于達(dá)成收購(gòu)Arm的交易持樂(lè)觀態(tài)度。在發(fā)布會(huì)后的電話會(huì)議上,黃仁勛表示目前收購(gòu)工作在有序進(jìn)行,相信監(jiān)管部門(mén)會(huì)支持這筆收購(gòu),2022年會(huì)有積極正面的結(jié)果。

  2

  升級(jí)GPU+CPU+DPU三芯片系統(tǒng)公司

  英偉達(dá)強(qiáng)勁的GPU加上最新發(fā)布的CPU Grace,再加上最新更新的Bluefield DPU,構(gòu)成了英偉達(dá)最新的數(shù)據(jù)中心芯片路線圖?!蔽覀兠磕甓紩?huì)發(fā)布激動(dòng)人心的新品。三類(lèi)芯片,逐年飛躍,一個(gè)架構(gòu)?!包S仁勛表示。

  微信圖片_20210413165251.png

  數(shù)據(jù)中心路線圖包括CPU、GPU和DPU這三類(lèi)芯片,而Grace和BlueField是其中必不可少的關(guān)鍵組成部分。每個(gè)芯片架構(gòu)歷經(jīng)兩年的打磨周期(周期內(nèi)可能出現(xiàn)轉(zhuǎn)變),一年專(zhuān)注于 x86 平臺(tái),另一年專(zhuān)注于 Arm 平臺(tái)。

  ”目前市場(chǎng)上每年交付的 3000 萬(wàn)臺(tái)數(shù)據(jù)中心服務(wù)器中,有 1/3 用于運(yùn)行軟件定義的數(shù)據(jù)中心堆棧,其負(fù)載的增長(zhǎng)速度遠(yuǎn)遠(yuǎn)快于摩爾定律。除非我們找到加速的辦法,否則用于運(yùn)行應(yīng)用的算力將會(huì)越來(lái)越少?!包S仁勛說(shuō),”新時(shí)代的計(jì)算機(jī)需要新的芯片、新的系統(tǒng)架構(gòu)、新的網(wǎng)絡(luò)、新的軟件和工具。“

  顯然,英偉達(dá)推出自家的Arm架構(gòu)CPU并非要與x86陣營(yíng)的AMD和Intel爭(zhēng)奪市場(chǎng),而是面向新興的細(xì)分市場(chǎng),通過(guò)三種芯片的組合實(shí)現(xiàn)差異化,并保持競(jìng)爭(zhēng)力。

  GPU是英偉達(dá)AI領(lǐng)導(dǎo)力的基石,黃仁勛說(shuō):”只需一張 GeForce 顯卡,每個(gè)學(xué)生都可以擁有一臺(tái)超級(jí)計(jì)算機(jī),這正是 Alex Krizhevsky、Ilya 和 Hinton 當(dāng)年訓(xùn)練 AI 模型 AlexNet 的方式?!?/p>

  在今天的GTC上,英偉達(dá)還更新了DPU(Data processing unit,數(shù)據(jù)處理單元)?!爆F(xiàn)代超大規(guī)模云技術(shù)推動(dòng)數(shù)據(jù)中心從基礎(chǔ)上走向了新的架構(gòu), 利用一種專(zhuān)門(mén)針對(duì)數(shù)據(jù)中心基礎(chǔ)架構(gòu)軟件而設(shè)計(jì)的新型處理器, 來(lái)卸載和加速由虛擬化、網(wǎng)絡(luò)、存儲(chǔ)、安全和其它云原生AI服務(wù)產(chǎn)生的巨大計(jì)算負(fù)荷。BlueField DPU正是為此而生?!包S仁勛如此解釋。

 微信圖片_20210413165307.png

  去年10月,英偉達(dá)發(fā)布首代DPU BlueField-2,能夠卸載相當(dāng)于30個(gè)CPU核的工作負(fù)載。今天發(fā)布的最新一代BlueField-3 DPU,是專(zhuān)為AI和加速計(jì)算設(shè)計(jì),實(shí)現(xiàn)了10倍的性能提升,有16個(gè)Arm A78 CPU核,和4倍的加密速度,能夠替代300個(gè)CPU核,能以400Gbps的速率,對(duì)網(wǎng)絡(luò)流量進(jìn)行保護(hù)、卸載和加速。

 微信圖片_20210413165319.png

  BlueField-3通過(guò)NVIDIA DOCA(集數(shù)據(jù)中心于芯片的架構(gòu))軟件開(kāi)發(fā)包為開(kāi)發(fā)者提供一個(gè)完整、開(kāi)放的軟件平臺(tái),新一代DPU預(yù)計(jì)將于2022年第一季度發(fā)布樣品。

  包括黃仁勛在內(nèi)的多位英偉達(dá)發(fā)言人曾不止一次表示,英偉達(dá)是一家系統(tǒng)公司。作為系統(tǒng)公司,軟件自然也是重點(diǎn)。

  GTC 21上,黃仁勛發(fā)布了用于訓(xùn)練Transformers的框架—— 英偉達(dá)Megatron。Transformers能夠生成文檔摘要、將電子郵件中的短語(yǔ)補(bǔ)充完整、對(duì)測(cè)驗(yàn)進(jìn)行評(píng)分、生成體育賽事現(xiàn)場(chǎng)評(píng)論、甚至生成代碼,已經(jīng)幫助開(kāi)發(fā)者在自然語(yǔ)言處理領(lǐng)域取得了突破性進(jìn)展。

  他還介紹了英偉達(dá)用于計(jì)算藥物研發(fā)加速庫(kù)Clara Discovery的一些新模型。

  還有量子電路模擬器提供加速cuQuantum,目標(biāo)是為加快有賴(lài)于量子位(或量子比特,能作為單個(gè)的0或1存在,也可以同時(shí)作為二者存在)的量子計(jì)算研究,幫助研究人員設(shè)計(jì)出更完善的量子計(jì)算機(jī)。

  針對(duì)數(shù)據(jù)中心的安全,英偉達(dá)也推出了Morpheus數(shù)據(jù)中心安全平臺(tái),基于英偉達(dá)AI、BlueField、Net-Q網(wǎng)絡(luò)遙測(cè)軟件和EGX而構(gòu)建,能夠?qū)ν暾臄?shù)據(jù)包進(jìn)行實(shí)時(shí)檢測(cè)。

  面向會(huì)話式AI,英偉達(dá)Jarvis已經(jīng)可用,其能夠?qū)崿F(xiàn)語(yǔ)音識(shí)別、語(yǔ)言理解、翻譯和表達(dá)性語(yǔ)音。雷鋒網(wǎng)了解到,Jarvis支持五種語(yǔ)言。

  為加快包括搜索、廣告、在線購(gòu)物等推薦系統(tǒng)的速度,黃仁勛宣布NVIDIA Merlin現(xiàn)可通過(guò)NGC(NVIDIA的深度學(xué)習(xí)框架容器目錄)獲取。

  還有,為了幫助客戶將自身專(zhuān)業(yè)知識(shí)應(yīng)用于AI領(lǐng)域,黃仁勛發(fā)布了NVIDIA TAO,可以運(yùn)用客戶和合作伙伴的數(shù)據(jù),對(duì)NVIDIA預(yù)訓(xùn)練模型進(jìn)行微調(diào)和適配,同時(shí)保護(hù)數(shù)據(jù)隱私。

  3

  英偉達(dá)的”三芯“時(shí)代

  有了全新的數(shù)據(jù)中心芯片路線圖,匹配豐富的軟件,英偉達(dá)能做什么?

  首先是獲益的就是數(shù)據(jù)中心。黃仁勛透露,基于今天新發(fā)布的Grace CPU以及下一代GPU,瑞士國(guó)家超級(jí)計(jì)算中心、蘇黎世聯(lián)邦理工大學(xué)將構(gòu)建一臺(tái)名為阿爾卑斯的超級(jí)計(jì)算機(jī),算力 20Exaflops(目前全球第一超算富岳的算力約為0.537Exaflops),將實(shí)現(xiàn)兩天訓(xùn)練一次GPT-3模型的能力,比目前基于英偉達(dá)GPU打造的 Selene 超級(jí)計(jì)算機(jī)快7倍。

  微信圖片_20210413165340.png

  另外,美國(guó)能源部下屬的洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室也將在2023年推出一臺(tái)基于Grace 的超級(jí)計(jì)算機(jī)。

  更進(jìn)一步,英偉達(dá)可以擴(kuò)展Arm從云到邊緣的市場(chǎng),包括將基于AWS Graviton2的Amazon EC2實(shí)例與NVIDIA GPU相結(jié)合;通過(guò)新HPC開(kāi)發(fā)者套件,為科學(xué)和AI應(yīng)用的開(kāi)發(fā)提供支持;提升邊緣視頻分析和安全功能;打造新一類(lèi)基于Arm并搭載NVIDIA RTX GPU的新款PC。

  除了在高性能計(jì)算市場(chǎng),英偉達(dá)的三芯片組合也能提升其在自動(dòng)駕駛汽車(chē)市場(chǎng)的競(jìng)爭(zhēng)力?;谟ミ_(dá)新一代GPU架構(gòu)、全新Arm CPU以及深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)加速器,黃仁勛推出了新一代面向自動(dòng)駕駛汽車(chē)的NVIDIA DRIVE Atlan,該處理器性能最高達(dá)每秒超過(guò)1000萬(wàn)億次(TOPS)運(yùn)算,約是上一代Orin處理器的4倍,超過(guò)了絕大多數(shù)L5無(wú)人駕駛出租車(chē)的總計(jì)算能力。

微信圖片_20210413165351.png

  DRIVE Atlan SoC也集成BlueField DPU,可以支持自動(dòng)駕駛汽車(chē)中的復(fù)雜計(jì)算和AI工作負(fù)載。預(yù)計(jì)DRIVE Atlan將搭載在多家汽車(chē)制造商的2025年車(chē)型上。

  微信圖片_20210413165402.png

  ”對(duì)于汽車(chē)而言,更高的算力意味著更加智能化,開(kāi)發(fā)者們也能讓產(chǎn)品更快迭代。TOPS 就是新的馬力?!包S仁勛說(shuō)。

  不僅如此,英偉達(dá)還推出了Hyperion 8 AV平臺(tái),這是一個(gè)先進(jìn)的數(shù)據(jù)采集、開(kāi)發(fā)和測(cè)試平臺(tái),包含參考傳感器、自動(dòng)駕駛汽車(chē)和中央計(jì)算機(jī)、3D地面真實(shí)數(shù)據(jù)記錄儀、網(wǎng)絡(luò)以及所有必要的軟件。

  不難發(fā)現(xiàn),面向AI、數(shù)據(jù)中心、自動(dòng)駕駛這些新興市場(chǎng),再?gòu)?qiáng)大的單芯片也很難滿足需求,因此,英偉達(dá)將其數(shù)據(jù)中心芯片路線圖升級(jí)為GPU+CPU+DPU,匹配的豐富軟件,進(jìn)行系統(tǒng)優(yōu)化,能夠幫助英偉達(dá)保持領(lǐng)先地位。

  4

  小結(jié)

  對(duì)于以GPU見(jiàn)長(zhǎng)的英偉達(dá)發(fā)布CPU,許多人可能會(huì)表示驚訝。其實(shí),去年以CPU見(jiàn)長(zhǎng)的英特爾也發(fā)布了自研GPU。AMD也在擁有CPU和GPU的基礎(chǔ)上要收購(gòu)FPGA。巨頭們都做出了相同的選擇,意味著的是芯片行業(yè)的競(jìng)爭(zhēng)已經(jīng)進(jìn)入了新的階段,靠單一的芯片已經(jīng)很難滿足AI、5G、自動(dòng)駕駛等應(yīng)用的需求,組合拳以及系統(tǒng)優(yōu)化是未來(lái)的重點(diǎn)。

  英偉達(dá)的優(yōu)勢(shì)在于,通過(guò)GPU+CPU+DPU的產(chǎn)品組合,能夠最大程度維持其在AI領(lǐng)域優(yōu)勢(shì),加上軟件和系統(tǒng)的優(yōu)化,更好地滿足新興應(yīng)用的需求,在新的市場(chǎng)占據(jù)領(lǐng)導(dǎo)力,而非與競(jìng)爭(zhēng)對(duì)手搶奪已有的市場(chǎng)。比如,用英偉達(dá)Omniverse創(chuàng)建共享虛擬3D世界。

 

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。