基于浮柵器件的低位寬卷積神經網絡研究
所屬分類:技術論文
上傳者:zhoubin333
文檔大小:450 K
標簽: 卷積神經網絡 量化 存算一體
所需積分:0分積分不夠怎么辦?
文檔介紹:浮柵器件(Flash)能夠將存儲和計算的特性相結合,實現(xiàn)存算一體化,但是單個浮柵單元最多只能存儲位寬為4 bit的數(shù)據(jù)。面向Nor Flash,研究了卷積神經網絡參數(shù)的低位寬量化,對經典的AlexNet、VGGNet以及ResNet通過量化感知訓練。采用非對稱量化,將模型參數(shù)從32位浮點數(shù)量化至4位定點數(shù),模型大小變?yōu)樵瓉淼?/8,針對Cifar10數(shù)據(jù)集,4位量化模型的準確率相對于全精度網絡僅下降不到2%。最后將量化完成的卷積神經網絡模型使用Nor Flash陣列加速。Hspice仿真結果表明,相對于全精度模型,部署在Nor Flash陣列中的量化模型精度僅下降2.25%,驗證了卷積神經網絡部署在Nor Flash上的可行性。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。