《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 業(yè)界動態(tài) > 人工智能處理器三強 Intel/NVIDIA/AMD誰將稱霸

人工智能處理器三強 Intel/NVIDIA/AMD誰將稱霸

2016-08-26

  英特爾在舊金山IDF16上除了核心亮點融合現(xiàn)實(MR)Alloy項目之外,新一代至強融核(XEON PHI)處理器也一同發(fā)布。Intel、NIVIDIA、AMD作為PC時代的老對手,在人工智能時代,它們的競爭又會碰撞出怎么樣的火花?

  借著IDF16的余溫還未褪去,我們在文章中將首先談一談錯失移動互聯(lián)網(wǎng)紅利的英特爾在人工智能方面做了哪些努力,接下來將會通過英特爾、英偉達(dá)、AMD在2016年最新發(fā)布的XEON PHI、NVIDIA Tesla、AMD FirePro S處理器來探究究竟誰能夠成為人工智能領(lǐng)域的霸主。

  英特爾積極布局人工智能

  數(shù)據(jù)顯示,2015年全球人工智能市場規(guī)模到達(dá)1683.9億元,預(yù)計2020年將達(dá)到近3700億元,年復(fù)合增長率達(dá)到17%。谷歌、Facebook、微軟等科技巨頭紛紛押注人工智能領(lǐng)域,PC芯片霸主英特爾在錯過移動互聯(lián)網(wǎng)的紅利之后也開始了在人工智能領(lǐng)域的布局。

7976.tmp.png

  2015-2020年全球人工智能市場規(guī)模

  2015年,Intel以167億美元收購了年收入不足20億美元的全球第二大FPGA廠商Altera。由于FPGA 是具有一定的可編程性,介于專用芯片和通用芯片之間,可同時進(jìn)行數(shù)據(jù)并行和任務(wù)并行計算,在圖像識別、信號處理等特定場景中具有比 GPU、CPU 更高的性價比。因此此舉被認(rèn)為是這是英特爾布局人工智能的一個重要戰(zhàn)略。

  IDF16之前,英特爾宣布收購深度學(xué)習(xí)創(chuàng)業(yè)公司 Nervana System,該公司是一家在芯片領(lǐng)域具有自主知識產(chǎn)權(quán)的公司,旗下的 Engine 芯片在深度學(xué)習(xí)訓(xùn)練時有著比傳統(tǒng) GPU 的能耗和性能優(yōu)勢。

  憑借著兩大收購,英特爾基本補齊了在人工智能,尤其是機器學(xué)習(xí)領(lǐng)域的兩大短板,同時也進(jìn)一步延伸了處理器的業(yè)務(wù)體系。更重要的是,英特爾旗下的風(fēng)險投資機構(gòu)過去幾年在人工智能領(lǐng)域也十分活躍。

802C.tmp.png

  英特爾XEON PHI處理器

  IDF16上,Intel發(fā)布第三代Xeon Phi處理器,代號Knights Mil。它將是2011年代號Knigts Corner,22nm工藝,最多61個核心,浮點性能1TFLOPS,和2013年代號Knights Landing,14nm工藝,最多72核心,浮點性能3+TFLOPS之后的繼任者。

  Knights Mill架構(gòu)是第三代,目前只知道它會在2017年問世,制程工藝升級到10nm,同時會支持Intel第二代Omni-path網(wǎng)絡(luò)架構(gòu),但是Intel并沒有公布太多細(xì)節(jié),具體的性能等級也未知。不過Knights Mill除了繼續(xù)提高能效、優(yōu)化并行性能、增強各種運行精度、搭配高彈性大容量內(nèi)存之外,DL深度學(xué)習(xí)也會是重點。

86B6.tmp.png

  Xeon Phi是Intel針對高性能計算市場推出的處理器,與主要競爭產(chǎn)品有NVIDIA的Tesla、AMD的FirePro S相比,后兩者是基于GPU的,Xeon Phi是X86眾核架構(gòu)的。

1B49.tmp.png

  NVIDIA Tesla

  在深度學(xué)習(xí)芯片領(lǐng)域,Nvidia的GPU 具備統(tǒng)治性的地位,在2016年國際超級計算大會上,NVIDIA發(fā)布了PCI-E版本的Tesla P100。

  Tesla P100是帕斯卡家族的首款產(chǎn)品,也是迄今唯一基于GP100大核心的產(chǎn)品,不過此前發(fā)布的版本是面向NVLink總線服務(wù)器的,而今天的新款則用于傳統(tǒng)PCI-E環(huán)境。二者核心規(guī)格完全相同,都有3584個流處理器,只不過核心加速頻率從1480MHz降至1300MHz(基礎(chǔ)頻率未公布),因此計算性能損失了大約22%,半精度浮點18.7TFlops(每秒18.7萬億次計算)、單精度浮點9.3TFlops、雙精度浮點4.7TFlops。

AAEC.tmp.png

  顯存繼續(xù)搭載HBM2,頻率也保持在1.4GHz,但除了4096-bit 16GB的完整版,還有個3072-bit 12GB的精簡版,帶寬分別為720GB/s、540GB/s。

  由于頻率降低,新卡的功耗也從300W降到了250W,和上一代Tesla M10相同,可以無縫升級,繼續(xù)配合服務(wù)器采用被動散熱。

1D5F.tmp.png

E763.tmp.png

  Tesla P100和配套軟件將在今年第四季度出貨,具體價格未公布。

96F5.tmp.png

  AMD FirePro

  AMD在今年早些時候發(fā)布了號稱世界最強VR顯卡Radeon Pro Duo,雙芯Fiji,隨后AMD又推出了面向HPC、數(shù)據(jù)中心等高性能加速卡FirePro S9300 X2,該處理器是雙芯Fiji專業(yè)版,浮點性能13.9TFLOPS,8GB HBM顯存,TDP為300W,號稱世界單精度性能最高的專業(yè)卡,售價5999美元。

  AMD的FirePro S系列主要面向HPC市場,與前面介紹的Intel Xeon Phi及NVIDIA Tesla K系列形成競爭關(guān)系。它們在HPC領(lǐng)域多是用作加速卡,所以浮點性能非常強大。

B1B8.tmp.png

5EAB.tmp.png

  AMD宣稱S9300 X2是世界最快的單精度加速卡

  FirePro S9300這次使用的是2個Fiji完整核心,每個GPU有4096個流處理器單元,跟之前發(fā)布的Radeon Pro Duo差不多,不過因為被動散熱,所以其頻率肯定會降低一些,13.9TFLOPS的浮點性能與后者的16TFLOPS有所下降,但它在GPU加速卡中其性能依然是拔尖的,AMD宣稱S9300 X2是世界最快的單精度加速卡。

9881.tmp.png

  競品的對比

  NVIDIA同級別的對手是Tesla K80,浮點性能只有5.6TFLOPS,帶寬480GB/s,顯存容量24GB,TDP為300W,而FirePro S9300 X2在同為300W TDP下浮點性能翻倍,帶寬更是高達(dá)1TB/s,雖然8GB的顯存容量不夠看,不過別忘了它使用的是HBM顯存,跟普通GDDR5顯存不一樣。

65C1.tmp.png

  FirePro S系列解決方案

  FirePro S9300 X2專業(yè)卡售價為5999美元,折合人民幣38682元左右,而NVIDIA的K80發(fā)布時售價為5000美元,后來降到4000美元。

  誰能稱霸?

  通過上面的詳細(xì)介紹,想必你對XEON PHI、NVIDIA Tesla、AMD FirePro S最新人工智能處理器都有了一定的認(rèn)識。目前來看NVIDIA占據(jù)一定的優(yōu)勢,AMD在追趕,借助收購補齊短板的英特爾未來可期。

  隨著三大廠商此產(chǎn)品的上市,在未來的人工智能、深度學(xué)習(xí)領(lǐng)域,誰能笑到最后還很難預(yù)測,我們只能拭目以待。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。