基于浮柵器件的低位寬卷積神經網絡研究 | |
所屬分類:技術論文 | |
上傳者:zhoubin333 | |
文檔大小:450 K | |
標簽: 卷積神經網絡 量化 存算一體 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:浮柵器件(Flash)能夠將存儲和計算的特性相結合,實現(xiàn)存算一體化,但是單個浮柵單元最多只能存儲位寬為4 bit的數(shù)據(jù)。面向Nor Flash,研究了卷積神經網絡參數(shù)的低位寬量化,對經典的AlexNet、VGGNet以及ResNet通過量化感知訓練。采用非對稱量化,將模型參數(shù)從32位浮點數(shù)量化至4位定點數(shù),模型大小變?yōu)樵瓉淼?/8,針對Cifar10數(shù)據(jù)集,4位量化模型的準確率相對于全精度網絡僅下降不到2%。最后將量化完成的卷積神經網絡模型使用Nor Flash陣列加速。Hspice仿真結果表明,相對于全精度模型,部署在Nor Flash陣列中的量化模型精度僅下降2.25%,驗證了卷積神經網絡部署在Nor Flash上的可行性。 | |
現(xiàn)在下載 | |
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計算機系統(tǒng)工程研究所版權所有 京ICP備10017138號-2