基于爬蟲和TFIDF-NB算法的微博情感分析 | |
所屬分類:技術(shù)論文 | |
上傳者:aetmagazine | |
文檔大?。?span>544 K | |
標(biāo)簽: 微博輿情 網(wǎng)絡(luò)爬蟲 情感分類 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:針對微博網(wǎng)絡(luò)輿情信息量大、無規(guī)則、隨機變化的特點,提出TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes)用于微博情感分析,設(shè)計與實現(xiàn)了一個基于Scrapy框架的微博評論爬蟲,將某熱點事件的若干條微博評論進行爬取并存進數(shù)據(jù)庫,然后進行文本分割、LDA(Latent Dirichlet Allocation)主題聚類,最后使用TFIDF-NB算法進行情感分類。實驗結(jié)果表明,TFIDF-NB算法平均準(zhǔn)確率高于線性支持向量機算法和K近鄰算法,在精確率和召回率方面高于K近鄰算法,具有較好的情感分類效果。 | |
現(xiàn)在下載 | |
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計算機系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2