文獻標識碼: A、
DOI: 10.20044/j.csdg.2097-1788.2022.02.003
引用格式: 凌仕勇,龔錦紅. 基于SVM和Word2Vec的Web應用入侵檢測系統(tǒng)[J].網絡安全與數據治理,2022,41(2):13-19.
0 引言
隨著高校信息化的發(fā)展,高校應用系統(tǒng)中積累了大量的師生、教學、科研、管理方面的業(yè)務數據。而隨著各業(yè)務系統(tǒng)的對外訪問,網絡安全問題日趨嚴重。目前,校園網安全運維主要是通過網絡安全產品如防火墻、IDS、IPS等設備來實現,總體效果不佳,一個重要的原因是忽視了日志在校園網管理中的作用。校園網中的網絡產品、服務器、應用系統(tǒng)等軟硬件運行過程中產生大量的日志,記錄了系統(tǒng)運行,使用者、攻擊者的訪問行為,可以通過對這些日志的綜合分析和處理,有效解決校園網運行中遇到的安全問題。
Web入侵檢測是針對Web應用的一種入侵檢測技術,通過對Web應用的請求分析,檢測和識別Web攻擊行為。在已有研究中,周勇祿[1]使用Web日志中動態(tài)頁面的參數值長度、字符分布等數據,建立了基于統(tǒng)一異常的檢測模型。Estevez-Tapiador等[2]對日志URL進行了劃分,對應到馬爾科夫模型的不同狀態(tài),使用狀態(tài)轉移矩陣,根據模型達到終態(tài)的概率判斷日志的合法性。Le[3]將Web入侵的URL根據不同部分進行切割,包括域名、路徑、參數等,并對每個部分進行選定特征的提取。Ma[4]等人提取入侵URL中的host等特征,以此進行Web應用入侵威脅檢測。Kolar[5]等人則采用詞袋模型解決Web威脅入侵的檢測問題。
高校信息系統(tǒng)一般分散部署在各個服務器中,導致所產生的日志也比較分散。高凱[6]研究了大數據環(huán)境下,采用分布式數據流的四個子系統(tǒng):數據采集子系統(tǒng)、消息處理子系統(tǒng)、流式計算子系統(tǒng)和數據存儲子系統(tǒng),進行用戶大規(guī)模日志安全分析。陳付梅等[7-9]介紹了大規(guī)模系統(tǒng)的日志模式提煉算法的優(yōu)化方法。上述研究從不同角度構建了針對Web應用的入侵檢測模型或系統(tǒng),但主要是通過對URL的分析,提取基于文本的統(tǒng)計特征,從而構建分析模型,而沒有考慮到POST請求體的數據,且在對文本數據的特征向量構建上,主要以統(tǒng)計特征為主,較少考慮到文本本身的詞匯特性。本文主要針對數據中心產生的Web日志進行研究,采用Word2Vec構造特征向量,利用支持向量機進行模型訓練,并基于MapReduce并行計算模型,給出了一種海量數據異常入侵檢測算法。通過此系統(tǒng)對日志事件進行并行挖掘分析,可以很好地發(fā)現安全攻擊事件,得出平臺整體的安全態(tài)勢,為數據中心正常運轉提供安全保障。
本文詳細內容請下載:http://theprogrammingfactory.com/resource/share/2000004853
作者信息:
凌仕勇1,龔錦紅2
(1.華東交通大學 網絡信息中心,江西 南昌330013;
2.華東交通大學 電氣與自動化工程學院,江西 南昌330013)