《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 基于重點(diǎn)突發(fā)詞的突發(fā)事件檢測方法
基于重點(diǎn)突發(fā)詞的突發(fā)事件檢測方法
2020年電子技術(shù)應(yīng)用第11期
富雅玲1,楊文忠1,2,吾守爾·斯拉木1,楊蒙蒙1,梁 凡1
1.新疆大學(xué) 信息科學(xué)與工程學(xué)院,新疆 烏魯木齊830046; 2.中國電子科學(xué)研究院 社會安全風(fēng)險(xiǎn)感知與防控大數(shù)據(jù)應(yīng)用國家工程實(shí)驗(yàn)室,新疆 烏魯木齊830000
摘要: 由于突發(fā)事件具有突發(fā)性、聚眾性、破壞性,針對微博中發(fā)布的突發(fā)事件,避免由突發(fā)事帶來一系列社會問題,提出一種結(jié)合用戶影響力和突發(fā)詞的突發(fā)事件檢測方法。為提取大量重點(diǎn)突發(fā)詞,使用詞影響力和詞狀態(tài)兩個(gè)指標(biāo)計(jì)算詞突發(fā)值,將大于一定閾值的詞作為突發(fā)詞;采用凝聚層次聚類方法,對突發(fā)詞集的共現(xiàn)矩陣進(jìn)行聚類得到熱點(diǎn)話題。之后將結(jié)果放入訓(xùn)練好的分類器對熱點(diǎn)話題進(jìn)行分類,最終得到突發(fā)事件及其類型。使用真實(shí)的微博數(shù)據(jù)對其進(jìn)行實(shí)驗(yàn),對比使用分類器前后的實(shí)驗(yàn)結(jié)果,該方法可以有效過濾一般熱點(diǎn)話題,提高突發(fā)事件檢測的準(zhǔn)確率。
中圖分類號: TP391.1
文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.200148
中文引用格式: 富雅玲,楊文忠,吾守爾·斯拉木,等. 基于重點(diǎn)突發(fā)詞的突發(fā)事件檢測方法[J].電子技術(shù)應(yīng)用,2020,46(11):82-86.
英文引用格式: Fu Yaling,Yang Wenzhong,Woxur Silamu,et al. Method of bursty events detection based on key bursty-words[J]. Application of Electronic Technique,2020,46(11):82-86.
Method of bursty events detection based on key bursty-words
Fu Yaling1,Yang Wenzhong1,2,Woxur Silamu1,Yang Mengmeng1,Liang Fan1
1.College of Information Science and Engineering,Xinjiang University,Urumqi 830046,China; 2.National Engineering Laboratory of Social Security Risk Perception and Prevention and Control of Big Data Application, Chinese Academy of Electronic Sciences,Urumqi 830000,China
Abstract: Because of the suddenness, crowd-gathering and destructiveness of bursty events, this paper proposes an bursty event detection method combining user influence and bursty-words for the bursty events published in weibo to avoid a series of social problems caused by bursty events. In order to extract a large number of key burst-words, we need to first calculate the bursty value of words, using two indicators: word influence and word state, taking words larger than a certain threshold as burst words; adopting cohesive hierarchical clustering method, hot topics are clustered by the co-occurrence matrix of burst word sets. After that, the results were put into the trained classifier to classify hot topics, and finally the bursty events and their types were obtained. The real microblog data were used to conduct bursty events on them. The experimental results before and after the use of the classifier were compared. This method can effectively filter common hot topics and improve the accuracy of emergency detection.
Key words : bursty event;burst word;clustering;classification;event detection

0 引言

    微博因其良好的服務(wù)和海量的用戶而被大眾所熟知,現(xiàn)已成為國內(nèi)最大的社交媒體。突發(fā)事件具有突發(fā)性和破壞性,在發(fā)生突發(fā)性事件,網(wǎng)民在社交媒體上進(jìn)行傳播,沒有相應(yīng)的法律條款來對事件采取相應(yīng)措施,對應(yīng)急管理會形成一些障礙,如果不能及時(shí)遏制事件發(fā)展的趨勢,將會給社會帶來一些負(fù)面影響。社交網(wǎng)絡(luò)中的突發(fā)事件是指在社交網(wǎng)絡(luò)中先前若干時(shí)間段內(nèi)該事件很少被用戶討論或者被討論頻次呈現(xiàn)平穩(wěn)分布,但在當(dāng)前時(shí)間段內(nèi)以高頻次出現(xiàn)的事件[1]。事件檢測有助于及時(shí)了解人們對事件的看法和實(shí)際情況,減少突發(fā)事件信息搜索的任務(wù),這一工作為自然語言處理(NLP)和機(jī)器學(xué)習(xí)的研究提供了方向[2]。因此,快速有效地檢測到突發(fā)事件,及時(shí)消除突發(fā)事件可能帶來的社會負(fù)面效應(yīng),變得尤為重要。綜合以上分析,提出一種結(jié)合用戶影響力和突發(fā)詞的突發(fā)事件檢測方法,對突發(fā)事件及其類型進(jìn)行檢測。




本文詳細(xì)內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000003060




作者信息:

富雅玲1,楊文忠1,2,吾守爾·斯拉木1,楊蒙蒙1,梁  凡1

(1.新疆大學(xué) 信息科學(xué)與工程學(xué)院,新疆 烏魯木齊830046;

2.中國電子科學(xué)研究院 社會安全風(fēng)險(xiǎn)感知與防控大數(shù)據(jù)應(yīng)用國家工程實(shí)驗(yàn)室,新疆 烏魯木齊830000)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。