摘要:為在嵌入式應用領域中實現高性能、低功耗的深度學習算法,針對網絡的前向傳播過程,通過設計指令格式和數據格式來傳輸CNNs計算所需要的參數,采用基于FPGA的軟硬件協同設計的方法,構建面向嵌入式應用的深度學習分類系統。實驗結果表明,在100MHz的工作頻率下,與GPU實現相比,該加速器在保證分類精度的情況下,整個網絡的平均性能為0.08GOP/s,能耗比為GTX 1070的2.29倍,功耗僅為GPU的2.114%。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社
熱門期刊
期刊名稱:計算機工程與設計
計算機工程與設計雜志緊跟學術前沿,緊貼讀者,國內刊號為:11-1775/TP。堅持指導性與實用性相結合的原則,創辦于1980年,雜志在全國同類期刊中發行數量名列前茅。