文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.200841
中文引用格式: 程佳風(fēng),王紅亮. 基于HLS工具的CNN加速器的設(shè)計(jì)與優(yōu)化方法研究[J].電子技術(shù)應(yīng)用,2021,47(3):18-21,26.
英文引用格式: Cheng Jiafeng,Wang Hongliang. Research on the design and optimization method of CNN accelerator based on HLS tools[J]. Application of Electronic Technique,2021,47(3):18-21,26.
0 引言
近年來,卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用范圍越來越廣泛,其應(yīng)用場景也日益復(fù)雜,卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算密集和存儲(chǔ)密集特征日益凸顯,成為快速高效實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)的限制。于是基于GPU[1]、ASIC[2]、FPGA[3]的不同的加速器平臺(tái)被相繼提出以提升CNN的設(shè)計(jì)性能。GPU的電力消耗巨大,硬件結(jié)構(gòu)固定,限制了卷積神經(jīng)網(wǎng)絡(luò)在嵌入式設(shè)備的應(yīng)用;ASIC開發(fā)成本極高,靈活性低,不適合搭載復(fù)雜多變的卷積神經(jīng)網(wǎng)絡(luò);FPGA具有功耗低、性能高、靈活性好的特點(diǎn),因此更加適用于卷積神經(jīng)網(wǎng)絡(luò)硬件加速的開發(fā)研究,但由于Verilog HDL開發(fā)門檻高,開發(fā)周期相對(duì)較長,影響了FPGA在卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用的普及[4-5]。
本文基于軟硬件協(xié)同的思想,利用HLS工具,在PYNQ-Z2上實(shí)現(xiàn)了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)加速器,并采用矩陣切割的設(shè)計(jì)方法對(duì)卷積核運(yùn)算進(jìn)行優(yōu)化。
本文詳細(xì)內(nèi)容請下載:http://www.ihrv.cn/resource/share/2000003402
作者信息:
程佳風(fēng),王紅亮
(中北大學(xué) 電子測量技術(shù)國家重點(diǎn)實(shí)驗(yàn)室,山西 太原030051)
