前言:
今年國際固態(tài)半導(dǎo)體電路會議(ISSCC)剛剛落下帷幕。從其中研究成果看到下一步的投入方向,從中可以探究整體半導(dǎo)體行業(yè)的未來發(fā)展動向。
各國入選論文數(shù)量的變化
2022年ISSCC共收到投稿論文651篇,其中200篇獲得錄用。
從ISSCC 2022入選論文數(shù)量上來看,遠(yuǎn)東地區(qū)首次超過北美。
從錄用論文的來源國和地區(qū)看,美國以69篇繼續(xù)領(lǐng)跑,韓國有41篇,而僅有7篇的日本位居第五。
日本獲得錄用的論文數(shù)量僅占3.5%,與上一年小幅下降,前沿領(lǐng)域研究的落后可能波及日本的產(chǎn)業(yè)競爭力。
比較而言,我國絕大部分來自學(xué)術(shù)界;而日本、韓國、北美則會有很多公司,這是我們應(yīng)該重點加強的。
入選論文兩篇以上的企業(yè)/大學(xué)/研發(fā)機構(gòu),我國有六家:其中清華大學(xué)一家就貢獻(xiàn)了9篇論文。
三星:移動端NPU覆蓋AI算法多面需求
三星工程師分享了即將推出的3nm GAE MBCFET芯片的制造細(xì)節(jié),三星已經(jīng)為MBCFET注冊了商標(biāo)。
雖然三星目前尚未披露其所有特性,但三星在ISSCC上討論了如何使用新型晶體管來提高SRAM性能和可擴展性。
近年來,SRAM的可擴展性一直落后于邏輯的可擴展性。同時,現(xiàn)代片上系統(tǒng)將SRAM的負(fù)載用于各種高速緩存,因此提高其可伸縮性是一項至關(guān)重要的任務(wù)。
三星的移動端NPU目前已經(jīng)使用在其4nm Exynos SoC中。
其NPU可以覆蓋INT4、INT8和FP16幾種精度,這些計算精度基本上能覆蓋移動端人工智能算法所有的需求。
例如INT4針對較為簡單的網(wǎng)絡(luò);FP16針對較為復(fù)雜對于精度要求更高的網(wǎng)絡(luò)。
該NPU有高性能模式和低功耗模式兩種工作模式,從而滿足移動端不同應(yīng)用場景之間的切換。
覆蓋了手機芯片在日常應(yīng)用中的痛點,其優(yōu)化的方向有非常明確的實際應(yīng)用場景,已經(jīng)過實戰(zhàn)的打磨。
SK海力士:基于GDDR接口的DRAM存內(nèi)計算
SK海力士在DRAM存內(nèi)計算研究中,使用了將計算單元集成在DRAM存儲芯片中的架構(gòu)并完成了4Gb AiM芯片;
通過DRAM控制器,該DRAM既可以做存內(nèi)計算,又可以當(dāng)作正常的DRAM來使用。
AiM相對傳統(tǒng)的GPU+HBM2在常用機器學(xué)習(xí)模型中可以實現(xiàn)高達(dá)10倍的性能提升。
GDDR6 AiM的工作電壓為1.25V,低于現(xiàn)有產(chǎn)品的1.35V工作電壓。
GDDR6-AiM 與 CPU / GPU 的組合,其有望在某些場景下達(dá)成16倍的計算速度,預(yù)期可在機器學(xué)習(xí)、高性能計算、大數(shù)據(jù)計算 / 存儲中得到廣泛的應(yīng)用。
本次新推出的這款內(nèi)存,將采用 TSV 硅通孔工藝制造,單顆最大容量可達(dá) 24GB。目前這類產(chǎn)品在服務(wù)器 CPU 中有應(yīng)用,與處理器核心緊密封裝在一起,實現(xiàn)高速率。
臺積電:SRAM+下一代存儲器打造差異化IP
SRAM一向是半導(dǎo)體工藝的一個重要基準(zhǔn),因此臺積電抓住下一代SRAM IP將對于鞏固其代工廠龍頭地位有重要作用。
本次由臺積電作為唯一作者機構(gòu)在ISSCC上發(fā)表的SRAM論文是基于其5nm工藝,其64kb的IP可以實現(xiàn)在不同計算精度(INT4–INT8)下實現(xiàn)非常高的計算密度(55.3-221.2 TOPS/mm2)和能效比(70–254 TOPS/W)。
在下一代存儲器方面,臺積電也在和臺清大、佐治亞理工等高校合作發(fā)表了多項新技術(shù),涉及RRAM、STT-MRAM、相變存儲器等多種新存儲器。
帶有存內(nèi)計算的SRAM和下一代存儲器也就成為了臺積電能提供帶有差異化IP的一個重要機會。
作為全球最大的代工廠,臺積電在人工智能領(lǐng)域的投入在本屆ISSCC上主要體現(xiàn)為帶有存內(nèi)計算的片上存儲器IP,包括SRAM和下一代存儲器(RRAM,STT-MRAM)等。
AMD:應(yīng)用3D V-Cache新技術(shù)
游戲CPU銳龍7 5800X3D即將上市,AMD在ISSCC 2022國際固態(tài)電路會議上詳細(xì)解讀了這項令游戲性能大漲15%的新技術(shù)。
AMD在L3級別使用了共享環(huán)形總線設(shè)計,CCD中的每個核心都可以訪問整個L3緩存,從而進一步提升性能。
代號Milan-X的EPYC霄龍?zhí)幚砥饕彩褂昧?D V-Cache技術(shù),CCD被減薄處理,而后應(yīng)用臺積電的SoIC技術(shù)將V-Cache“面朝下”放置在CCD上。
此外CCD上還會有一層Support Silicon讓它擁有和IOD相同的高度,這樣CPU的封裝尺寸不會發(fā)生變化,相應(yīng)的散熱設(shè)計也無需進行調(diào)整。
IBM:量子計算的獨特性決定芯片反向
目前量子計算技術(shù)面臨的核心問題還是在實證物理階段的困擾,在理論物理階段已經(jīng)基本成熟。
但進入實證物理階段的時候,需要的是讓這個難以琢磨以及極為不穩(wěn)定的量子糾纏能夠成為一種可掌握的穩(wěn)定性技術(shù)。
IBM在ISSCC上發(fā)表的研究中指出,量子計算的主要目的并不是取代傳統(tǒng)通用計算機,而是在一些專門的問題中:
如質(zhì)因數(shù)分解,化學(xué)相關(guān)模擬計算、優(yōu)化問題等獲得遠(yuǎn)高于傳統(tǒng)計算機算法的處理速度,這是由于量子計算的獨特特性所決定的。
IBM研制出超過100個量子比特的計算機,表明這項技術(shù)具有可拓展性,從而有足夠的計算能力來解決有趣的問題,這是通往更強大機器的鋪路石。
谷歌:研發(fā)Sycamore量子計算芯片
谷歌在其論文中指出,控制和讀出芯片將會是量子計算機跨向下一步(即進一步增加量子位數(shù))的關(guān)鍵。
也可以說當(dāng)量子計算機成為主流時,相關(guān)的控制和讀出芯片也可望會成為一個新的芯片品類市場。
谷歌在資源庫中提供了豐富并且重要的內(nèi)容。其中之一是 OpenFermion,與量子化學(xué)的內(nèi)容相關(guān)。
第二個是建立在 Google 經(jīng)典計算硬件上的量子TensorFlow。其張量處理器(TPU)就是運行在這一系統(tǒng)上,并處理量子模擬和機器學(xué)習(xí)等問題。
Chiplet集成芯片:一場關(guān)于維度的戰(zhàn)爭
經(jīng)過ISSCC 2021 Chiplet的小冷靜期,終于ISSCC 2022的Chiplet論文迎來了大爆發(fā)。
兩大CPU廠今年基于Chiplet的爆款產(chǎn)品:英特爾的Ponte Vecchio和AMD的3D-VCache(Zen3) 都在ISSCC上展示了技術(shù)細(xì)節(jié)。
這兩款芯片都實現(xiàn)了真正意義上的3D芯片,從維度上超越了2.5D的CoWoS 和Fanout封裝技術(shù):采用硅inerposer或者RDL外沿層技術(shù)實現(xiàn)多層平面互連。
阿里達(dá)摩院也實現(xiàn)了基于Hybrid Bonding的近存計算引擎,可用于推薦系統(tǒng)。
復(fù)旦大學(xué)提出了面向2.5D封裝的可擴展存算一體架構(gòu),通過Chiplet技術(shù),達(dá)到流片后的再度靈活配置特性,支持不同尺度的終端學(xué)習(xí)場景。
結(jié)尾:
未來已來,而大廠仍未掉隊。存算已經(jīng)每一類存儲器的爭奇斗艷的舞臺,基于數(shù)字方法和近數(shù)字方法開始取代了前兩年大行其道的模擬計算,而傳統(tǒng)存儲器大廠臺積電、三星和海力士仍是主角。隨著量子計算的深入而深知,谷歌、IBM等各大廠商也在不斷進化其自研芯片。