《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 面向社交平臺應急關聯(lián)信息的文本分類綜述
面向社交平臺應急關聯(lián)信息的文本分類綜述
網(wǎng)絡安全與數(shù)據(jù)治理
姜鈺棋, 強子珊,卜凡亮
中國人民公安大學信息網(wǎng)絡安全學院
摘要: 緊急事件發(fā)生初期,及時從海量社交平臺數(shù)據(jù)中挖掘有效信息為應急響應提供決策參考具有重要意義。隨著自然語言處理技術飛速發(fā)展,文本分類已被逐漸運用于該領域,主要可分為基于傳統(tǒng)機器學習的K近鄰、樸素貝葉斯、決策樹、支持向量機等方法,以及基于深度學習的CNN、RNN、GCN、Transformer等方法。從算法原理、發(fā)展歷程、適用領域及性能優(yōu)劣等方面對當前主流的文本分類方法進行分析,調研了社交平臺應急關聯(lián)信息文本分類的研究現(xiàn)狀與熱點,歸納了現(xiàn)有方法面臨的問題與挑戰(zhàn),展望了未來研究方向,為后續(xù)科研工作提供參考與啟示。
中圖分類號:TP391.1;TP18文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2024.05.001
引用格式:姜鈺棋, 強子珊,卜凡亮.面向社交平臺應急關聯(lián)信息的文本分類綜述[J].網(wǎng)絡安全與數(shù)據(jù)治理,2024,43(5):1-10,34.
Overview of text classification for emergency related information on social platforms
Jiang Yuqi, Qiang Zishan, Bu Fanliang
College of Information Network Security, People′s Public Security University of China
Abstract: In the early stages of an emergency event, timely extraction of valuable information from massive social media data holds great significance in providing decision-making references for emergency response. With the rapid development of natural language processing, text classification has gradually been applied in this field, mainly divided into traditional machine learning based methods such as K-Nearest Neighbor, Naive Bayes, Decision Tree, Support Vector Machines, and deep learning based methods such as CNN, RNN, GCN and Transformer. This paper analyzes the current mainstream text classification methods from aspects including algorithm principles, development history, applicable fields, advantages and disadvantages. It investigates the research status and hotspots of text classification for emergency-related information on social media platforms, summarizes the problems and challenges faced by existing methods, and presents future research directions, providing references and inspiration for subsequent scientific research work.
Key words : text classification; machine learning; deep learning; emergency related information on social platforms

引言

突發(fā)事件具有不可控性與未知性,一旦發(fā)生,后果往往難以設想。在應急處置過程中,如果要有效提升應急救援協(xié)調能力,降低突發(fā)事件帶來風險并減少損失,那么對事件關聯(lián)信息進行及時準確的收集、處理和共享就顯得至關重要。

隨著互聯(lián)網(wǎng)技術的發(fā)展與智能終端的普及,網(wǎng)絡文本逐漸成為大數(shù)據(jù)背景下一種重要的信息資源。在突發(fā)事件發(fā)生的緊急情況下,社交媒體會充當重要的信息交流平臺,實時傳遞緊急事件的相關情況。因此,社交平臺應急關聯(lián)信息文本分類的研究已成為互聯(lián)網(wǎng)時代的熱點問題之一。許多學者開始關注社交平臺應急關聯(lián)信息的文本分類問題。即通過將社交平臺上的信息劃分為不同的類別來實現(xiàn)快速甄別,為應急救援部門提供及時、可靠的決策支持。所采用的研究方法可分為基于機器學習的傳統(tǒng)分類算法與基于深度學習的分類模型。伴隨著BERT[1]等大規(guī)模語言模型的問世,基于預訓練模型的文本分類研究取得了突破性進展,分類準確度不斷提升。隨之而來的挑戰(zhàn)也不可忽視。例如,社交平臺上獲取的信息通常是非結構化且由多種模態(tài)組成的,并且可能伴隨大量的噪聲信息,會大大增加分類的難度,使分類結果的準確性難以得到保證。因此,如何有效地篩選與處理信息數(shù)據(jù),同時融合多模態(tài)數(shù)據(jù)進行更全面的分析,仍需進行深入的研究。此外,如何提高分類算法的魯棒性和泛化能力,也是需要進一步深究的問題。


本文詳細內容請下載:

http://theprogrammingfactory.com/resource/share/2000006009


作者信息:

姜鈺棋, 強子珊,卜凡亮

(中國人民公安大學信息網(wǎng)絡安全學院,北京100240)


Magazine.Subscription.jpg

此內容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。