基于爬蟲和TFIDF-NB算法的微博情感分析
所屬分類:技術(shù)論文
上傳者:aetmagazine
文檔大?。?span>544 K
標(biāo)簽: 微博輿情 網(wǎng)絡(luò)爬蟲 情感分類
所需積分:0分積分不夠怎么辦?
文檔介紹:針對微博網(wǎng)絡(luò)輿情信息量大、無規(guī)則、隨機變化的特點,提出TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes)用于微博情感分析,設(shè)計與實現(xiàn)了一個基于Scrapy框架的微博評論爬蟲,將某熱點事件的若干條微博評論進行爬取并存進數(shù)據(jù)庫,然后進行文本分割、LDA(Latent Dirichlet Allocation)主題聚類,最后使用TFIDF-NB算法進行情感分類。實驗結(jié)果表明,TFIDF-NB算法平均準(zhǔn)確率高于線性支持向量機算法和K近鄰算法,在精確率和召回率方面高于K近鄰算法,具有較好的情感分類效果。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。