基于TF-IDF進(jìn)化集成分類器的鐵路安全故障文本分類
所屬分類:技術(shù)論文
上傳者:aetmagazine
文檔大?。?span>768 K
標(biāo)簽: 鐵路安全問題 TF-IDF 基分類器
所需積分:0分積分不夠怎么辦?
文檔介紹:鐵路安全問題是鐵路運(yùn)輸保證的核心問題,鐵路安全問題非結(jié)構(gòu)化文本數(shù)據(jù)量大,文本內(nèi)容無特定規(guī)律,對(duì)于綜合分析解決安全故障問題造成很高的難度。針對(duì)鐵路安全問題數(shù)據(jù)智能分類,提出進(jìn)化集成分類器模型。運(yùn)用TF-IDF算法,通過分析接觸網(wǎng)安全問題的數(shù)據(jù)特點(diǎn)提取文本特征。采用決策樹作為基分類器的Bagging集成分類器將文本數(shù)據(jù)分類,在Bagging分類過程中,針對(duì)Bagging算法產(chǎn)生的基分類器組合解集,提出采用遺傳算法(Genetic Algorithm)將其優(yōu)化,產(chǎn)生分類結(jié)果較優(yōu)的基分類器組合解集。以鐵路局實(shí)際安全問題進(jìn)行實(shí)驗(yàn)分析,實(shí)驗(yàn)證明TF-IDF+Bagging+Genetic Algorithm=Evolutionary Ensemble Classifier進(jìn)化集成分類器模型在鐵路安全問題文本分類中具有較高的準(zhǔn)確性。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。