123,123,123

人工智能处理器三强 Intel/NVIDIA/AMD谁将称霸

日期： 2016-08-26

關鍵詞： 芯片处理器深度学习人工智能

　　英特爾在舊金山IDF16上除了核心亮點融合現實（MR）Alloy項目之外，新一代至強融核（XEON PHI）處理器也一同發(fā)布。Intel、NIVIDIA、AMD作為PC時代的老對手，在人工智能時代，它們的競爭又會碰撞出怎么樣的火花？

　　借著IDF16的余溫還未褪去，我們在文章中將首先談一談錯失移動互聯網紅利的英特爾在人工智能方面做了哪些努力，接下來將會通過英特爾、英偉達、AMD在2016年最新發(fā)布的XEON PHI、NVIDIA Tesla、AMD FirePro S處理器來探究究竟誰能夠成為人工智能領域的霸主。

　　英特爾積極布局人工智能

　　數據顯示，2015年全球人工智能市場規(guī)模到達1683.9億元，預計2020年將達到近3700億元，年復合增長率達到17%。谷歌、Facebook、微軟等科技巨頭紛紛押注人工智能領域，PC芯片霸主英特爾在錯過移動互聯網的紅利之后也開始了在人工智能領域的布局。

7976.tmp.png

　　2015-2020年全球人工智能市場規(guī)模

　　2015年，Intel以167億美元收購了年收入不足20億美元的全球第二大FPGA廠商Altera。由于FPGA 是具有一定的可編程性，介于專用芯片和通用芯片之間，可同時進行數據并行和任務并行計算，在圖像識別、信號處理等特定場景中具有比 GPU、CPU 更高的性價比。因此此舉被認為是這是英特爾布局人工智能的一個重要戰(zhàn)略。

　　IDF16之前，英特爾宣布收購深度學習創(chuàng)業(yè)公司 Nervana System，該公司是一家在芯片領域具有自主知識產權的公司，旗下的 Engine 芯片在深度學習訓練時有著比傳統 GPU 的能耗和性能優(yōu)勢。

　　憑借著兩大收購，英特爾基本補齊了在人工智能，尤其是機器學習領域的兩大短板，同時也進一步延伸了處理器的業(yè)務體系。更重要的是，英特爾旗下的風險投資機構過去幾年在人工智能領域也十分活躍。

802C.tmp.png

　　英特爾XEON PHI處理器

　　IDF16上，Intel發(fā)布第三代Xeon Phi處理器，代號Knights Mil。它將是2011年代號Knigts Corner，22nm工藝，最多61個核心，浮點性能1TFLOPS，和2013年代號Knights Landing，14nm工藝，最多72核心，浮點性能3+TFLOPS之后的繼任者。

　　Knights Mill架構是第三代，目前只知道它會在2017年問世，制程工藝升級到10nm，同時會支持Intel第二代Omni-path網絡架構，但是Intel并沒有公布太多細節(jié)，具體的性能等級也未知。不過Knights Mill除了繼續(xù)提高能效、優(yōu)化并行性能、增強各種運行精度、搭配高彈性大容量內存之外，DL深度學習也會是重點。

86B6.tmp.png

　　Xeon Phi是Intel針對高性能計算市場推出的處理器，與主要競爭產品有NVIDIA的Tesla、AMD的FirePro S相比，后兩者是基于GPU的，Xeon Phi是X86眾核架構的。

1B49.tmp.png

　　NVIDIA Tesla

　　在深度學習芯片領域，Nvidia的GPU 具備統治性的地位，在2016年國際超級計算大會上，NVIDIA發(fā)布了PCI-E版本的Tesla P100。

　　Tesla P100是帕斯卡家族的首款產品，也是迄今唯一基于GP100大核心的產品，不過此前發(fā)布的版本是面向NVLink總線服務器的，而今天的新款則用于傳統PCI-E環(huán)境。二者核心規(guī)格完全相同，都有3584個流處理器，只不過核心加速頻率從1480MHz降至1300MHz（基礎頻率未公布），因此計算性能損失了大約22%，半精度浮點18.7TFlops（每秒18.7萬億次計算）、單精度浮點9.3TFlops、雙精度浮點4.7TFlops。

AAEC.tmp.png

　　顯存繼續(xù)搭載HBM2，頻率也保持在1.4GHz，但除了4096-bit 16GB的完整版，還有個3072-bit 12GB的精簡版，帶寬分別為720GB/s、540GB/s。

　　由于頻率降低，新卡的功耗也從300W降到了250W，和上一代Tesla M10相同，可以無縫升級，繼續(xù)配合服務器采用被動散熱。

1D5F.tmp.png

E763.tmp.png

　　Tesla P100和配套軟件將在今年第四季度出貨，具體價格未公布。

96F5.tmp.png

　　AMD FirePro

　　AMD在今年早些時候發(fā)布了號稱世界最強VR顯卡Radeon Pro Duo，雙芯Fiji，隨后AMD又推出了面向HPC、數據中心等高性能加速卡FirePro S9300 X2，該處理器是雙芯Fiji專業(yè)版，浮點性能13.9TFLOPS，8GB HBM顯存，TDP為300W，號稱世界單精度性能最高的專業(yè)卡，售價5999美元。

　　AMD的FirePro S系列主要面向HPC市場，與前面介紹的Intel Xeon Phi及NVIDIA Tesla K系列形成競爭關系。它們在HPC領域多是用作加速卡，所以浮點性能非常強大。

B1B8.tmp.png

5EAB.tmp.png

　　AMD宣稱S9300 X2是世界最快的單精度加速卡

　　FirePro S9300這次使用的是2個Fiji完整核心，每個GPU有4096個流處理器單元，跟之前發(fā)布的Radeon Pro Duo差不多，不過因為被動散熱，所以其頻率肯定會降低一些，13.9TFLOPS的浮點性能與后者的16TFLOPS有所下降，但它在GPU加速卡中其性能依然是拔尖的，AMD宣稱S9300 X2是世界最快的單精度加速卡。

9881.tmp.png

　　競品的對比

　　NVIDIA同級別的對手是Tesla K80，浮點性能只有5.6TFLOPS，帶寬480GB/s，顯存容量24GB，TDP為300W，而FirePro S9300 X2在同為300W TDP下浮點性能翻倍，帶寬更是高達1TB/s，雖然8GB的顯存容量不夠看，不過別忘了它使用的是HBM顯存，跟普通GDDR5顯存不一樣。

65C1.tmp.png

　　FirePro S系列解決方案

　　FirePro S9300 X2專業(yè)卡售價為5999美元，折合人民幣38682元左右，而NVIDIA的K80發(fā)布時售價為5000美元，后來降到4000美元。

　　誰能稱霸？

　　通過上面的詳細介紹，想必你對XEON PHI、NVIDIA Tesla、AMD FirePro S最新人工智能處理器都有了一定的認識。目前來看NVIDIA占據一定的優(yōu)勢，AMD在追趕，借助收購補齊短板的英特爾未來可期。

　　隨著三大廠商此產品的上市，在未來的人工智能、深度學習領域，誰能笑到最后還很難預測，我們只能拭目以待。

版權聲明：本站內容除特別聲明的原創(chuàng)文章之外，轉載內容只為傳遞更多信息，并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經濟損失。聯系電話：010-82306118；郵箱：aet@chinaaet.com。

人工智能处理器三强 Intel/NVIDIA/AMD谁将称霸

日期： 2016-08-26

相關內容