基于ERNIE-CAB-CNN的稀土專利文本分類模型 | |
所屬分類:技術(shù)論文 | |
上傳者:wwei | |
文檔大?。?span>4277 K | |
標(biāo)簽: 稀土專利分類 文本分類 類別注意力 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:針對稀土專利文本專業(yè)性強(qiáng)的特點以及現(xiàn)有的文本分類方法存在的不足,鑒于類別注意力在計算機(jī)視覺領(lǐng)域的廣泛應(yīng)用和取得的良好效果,提出了一種用于文本分類的類別注意力模塊(Category Attention Module,CAB),并結(jié)合預(yù)訓(xùn)練模型ERNIE和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)構(gòu)建了一個用于稀土專利文本分類的創(chuàng)新模型ERNIE-CAB-CNN。模型使用ERNIE對專利文本進(jìn)行向量化,得到語義信息更加豐富的向量表示后,通過CAB為文本中各個類別的重要特征賦予較高權(quán)值,使模型可以更準(zhǔn)確地區(qū)分不同類別的特征。最后用CNN進(jìn)一步提取文本中其他關(guān)鍵局部特征,得到的最終文本向量表示用于分類。通過Patsnap專利數(shù)據(jù)庫官方網(wǎng)站檢索下載稀土專利數(shù)據(jù)構(gòu)建數(shù)據(jù)集進(jìn)行實驗,實驗結(jié)果表明,稀土專利文本分類模型ERNIE-CAB-CNN在測試集上分類的準(zhǔn)確率、精確率、F1分?jǐn)?shù)分別為82.68%、83.2%、82.06%,取得了良好的分類效果。 | |
現(xiàn)在下載 | |
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2