基于多模態(tài)特征融合的社交媒體賬號分類方法
網(wǎng)絡(luò)安全與數(shù)據(jù)治理 10期
湯智偉,明 楊,費(fèi)高雷,翟學(xué)萌,胡光岷
(電子科技大學(xué)信息與通信工程學(xué)院,四川成都611731)
摘要: 社交媒體賬號分類方法從賬號的屬性信息出發(fā),通過構(gòu)建賬號特征從而對賬號進(jìn)行分類,對從海量社交媒體數(shù)據(jù)中挖掘有價(jià)值的信息具有十分重要的作用?,F(xiàn)有社交媒體賬號分類一般基于用戶發(fā)布的信息提取特征,存在賬號信息描述不完整、分類有效性低的問題。針對上述問題,提出了一種基于多模態(tài)特征融合的社交媒體賬號分類方法。該方法綜合考慮賬號自身屬性、文本以及賬號之間的社交關(guān)系等信息,使用張量分析的方法對賬號所表現(xiàn)的多模態(tài)特征進(jìn)行融合。相比現(xiàn)有方法,所提方法可以更好地利用賬號的各種信息,獲得更好的分類效果。通過實(shí)驗(yàn),所提方法準(zhǔn)確率達(dá)到了93.74%。
中圖分類號:TP181
文獻(xiàn)標(biāo)識碼:A
DOI:10.19358/j.issn.2097-1788.2023.10.001
引用格式:湯智偉,明楊,費(fèi)高雷,等.基于多模態(tài)特征融合的社交媒體賬號分類方法[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2023,42(10):1-7.
文獻(xiàn)標(biāo)識碼:A
DOI:10.19358/j.issn.2097-1788.2023.10.001
引用格式:湯智偉,明楊,費(fèi)高雷,等.基于多模態(tài)特征融合的社交媒體賬號分類方法[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2023,42(10):1-7.
Social media account classification based on multimodal feature fusion
Tang Zhiwei,Ming Yang,F(xiàn)ei Gaolei,Zhai Xuemeng,Hu Guangmin
(School of Information and Communication Engineering, University of Electronic Science and Technology of China, Chengdu 611731, China)
Abstract: Social media account classification methods start from the attribute information of the account, construct the account features and classify the account, which is very important for mining valuable information from the massive social media data. Existing social media account classification is generally based on extracting features from the information posted by users, which has the problems of incomplete description of account information and low effectiveness of classification. To solve the problems above, the paper proposes a social media account classification method based on multimodal feature fusion. The method uses tensor analysis to fuse the multimodal features expressed by the account after comprehensively considering the information of the account′s own attributes, the text, and the social relationships between the accounts. Compared with the existing methods, the method proposed in this paper can better utilize the various information of accounts and obtain better classification results. Through experiments, the method in this paper achieves an accuracy rate of 93.74%.
Key words : social media; account classification; feature fusion; tensor decomposition
0 引言
隨著社交媒體的興起,用戶賬號的分類成為了研究者關(guān)注的問題。這涉及檢測異常賬號和識別相關(guān)主題賬號。傳統(tǒng)方法主要從賬號文本信息或社交關(guān)系中提取特征,但存在特征單一和缺乏融合的問題[1] 。
為了更充分挖掘數(shù)據(jù)信息[2] ,多模態(tài)學(xué)習(xí)嶄露頭角。多模態(tài)學(xué)習(xí)充分利用不同信息類型之間的相關(guān)性與互補(bǔ)性,提供更全面的特征表示[3] 。多模態(tài)融合有兩大優(yōu)點(diǎn):模態(tài)之間互補(bǔ)相關(guān)[4] ,且系統(tǒng)具備強(qiáng)容錯(cuò)性。然而,在社交媒體賬號分類領(lǐng)域,多模態(tài)研究相對較少。
本文提出了一種多模態(tài)特征融合的社交媒體賬號分類方法。在特征提取階段,綜合考慮了賬號屬性、文本和社交關(guān)系等多模態(tài)信息。在融合過程中,采用張量方法將這些多模態(tài)特征整合,以張量分解降低數(shù)據(jù)復(fù)雜性。多模態(tài)特征融合有助于捕捉各模態(tài)之間的聯(lián)系,提高賬號分類準(zhǔn)確性和模型泛化性。
本文詳細(xì)內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000005731
作者信息:
湯智偉,明楊,費(fèi)高雷,翟學(xué)萌,胡光岷
(電子科技大學(xué)信息與通信工程學(xué)院,四川成都611731)
此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。