基于深度學(xué)習(xí)的可視化圖表分類(lèi)方法研究
所屬分類(lèi):技術(shù)論文
上傳者:wwei
文檔大?。?span>205 K
標(biāo)簽: 圖表分類(lèi) 圖表理解 卷積神經(jīng)網(wǎng)絡(luò)
所需積分:0分積分不夠怎么辦?
文檔介紹:可視化圖表的分類(lèi)研究對(duì)于圖表理解和文檔解析具有很大的意義。分別通過(guò)爬蟲(chóng)和軟件生成的方式,構(gòu)建了兩個(gè)包含16類(lèi)常見(jiàn)圖表的數(shù)據(jù)集,該數(shù)據(jù)集在數(shù)量、類(lèi)型和樣式豐富性上具有一定的優(yōu)勢(shì)。在3個(gè)數(shù)據(jù)集上實(shí)驗(yàn)對(duì)比了Transformer架構(gòu)和卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)的模型,結(jié)果表明Transformer架構(gòu)在圖表分類(lèi)任務(wù)上具有一定優(yōu)勢(shì)。基于Swin Transformer模型,設(shè)計(jì)了多種數(shù)據(jù)增強(qiáng)策略,在增加模型泛化性的同時(shí)也引入了分布差異;通過(guò)對(duì)不同策略訓(xùn)練出的模型預(yù)測(cè)進(jìn)行均值融合,同單模型相比分類(lèi)性能有較大提升。在6個(gè)測(cè)試集上對(duì)集成模型進(jìn)行了測(cè)試,分類(lèi)準(zhǔn)確率均大于0.9;對(duì)于圖像質(zhì)量高、視覺(jué)形式簡(jiǎn)單的生成圖表,模型分類(lèi)準(zhǔn)確率接近1。
現(xiàn)在下載
VIP會(huì)員,AET專(zhuān)家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。