摘 要: 提出了一種基于徑向基函數(shù)神經(jīng)網(wǎng)絡的網(wǎng)絡流量識別方法。根據(jù)實際網(wǎng)絡中的流量數(shù)據(jù),建立了一個基于RBF神經(jīng)網(wǎng)絡的流量識別模型。先介紹了RBF神經(jīng)網(wǎng)絡的結構設計及學習算法,針對RBF神經(jīng)網(wǎng)絡在隱節(jié)點過多的情況下算法過于復雜的缺點,采用了優(yōu)化的算法計算隱含層節(jié)點。仿真實驗證明,該模型具有較好的準確率、低復雜度、高識別效果和良好的自適應性。
關鍵詞: RBF神經(jīng)網(wǎng)絡;流量識別;流量分類
隨著互聯(lián)網(wǎng)業(yè)務量的急劇增長,網(wǎng)絡性能和服務質(zhì)量方面的問題日益突出。在網(wǎng)絡資源有限的情況下,建立網(wǎng)絡流量模型,識別網(wǎng)絡流量,及時作出控制或者調(diào)整,將會極大提高網(wǎng)絡性能和服務質(zhì)量。尤其是隨著近年來互聯(lián)網(wǎng)技術的發(fā)展,網(wǎng)絡主要流量已經(jīng)由傳統(tǒng)的FTP、TELNET和HTTP向P2P和IM服務轉變。傳統(tǒng)的網(wǎng)絡流量識別方法已經(jīng)不能滿足當前網(wǎng)絡發(fā)展的需求。
神經(jīng)網(wǎng)絡對非線性函數(shù)關系具有良好的逼近能力,所以本文提出了一種基于RBF函數(shù)神經(jīng)網(wǎng)絡的網(wǎng)絡流量模型。RBF神經(jīng)網(wǎng)絡為局部神經(jīng)網(wǎng)絡模型,計算速度快、實時性好,相對于傳統(tǒng)的線性流量模型具有更高的逼近能力和良好的自適應性,并可克服基于BP神經(jīng)網(wǎng)絡的流量模型訓練時間長及計算復雜度高的不足。
1 RBF神經(jīng)網(wǎng)絡結構及學習算法
1.1 RBF神經(jīng)網(wǎng)絡結構
RBF神經(jīng)網(wǎng)絡是20世紀80年代由MOODY J和DARKEN C提出的一種神經(jīng)網(wǎng)絡模型,是具有單隱層的前饋網(wǎng)絡,屬于局部逼近網(wǎng)絡,已證明能以任意精度逼近任一連續(xù)函數(shù)。RBF神經(jīng)網(wǎng)絡的結構如圖1所示。
網(wǎng)絡由輸入層、徑向基函數(shù)隱含層、輸出層三層構成。低維空間非線性可分的問題總可以映射到一個高維空間,使其在此高維空間中為線性可分[1]。RBF的輸出單元部分構成一個單層感知機,只要合理選擇隱單元數(shù)(高維空間的維數(shù))和作用函數(shù),就可以把原來的問題映射為一個線性可分問題[2]。RBF網(wǎng)絡中輸入到隱含層的映射是非線性的,而隱含層到輸出的映射是線性的。隱含層的節(jié)點數(shù)與實際問題的要求有直接的關聯(lián),過多的節(jié)點數(shù)會導致學習時間過長和低容錯率,所以必須優(yōu)化隱含層的節(jié)點數(shù)。隱含層的節(jié)點數(shù)可以采用式(1)計算:
2 識別過程
流量識別過程分為四個部分:數(shù)據(jù)獲取過程、數(shù)據(jù)預處理過程、數(shù)據(jù)訓練過程和測試數(shù)據(jù)分類過程。重點在于建立一個RBF神經(jīng)網(wǎng)絡模型對網(wǎng)絡流量進行分類。
(1)數(shù)據(jù)獲取過程是通過數(shù)據(jù)獲取模塊提取網(wǎng)絡連接記錄和分析特征,以選擇合適的網(wǎng)絡特征屬性作為原始的輸入值。選擇一組最合適的特征子集作為RBF神經(jīng)網(wǎng)絡的原始輸入值。
(2)數(shù)據(jù)預處理過程是將特征子集映射到[-1,1]的范圍[4]。
(3)數(shù)據(jù)訓練過程是將經(jīng)過預處理后的網(wǎng)絡流量特征子集作為RBF神經(jīng)網(wǎng)絡模型的訓練集。
(4)根據(jù)RBF神經(jīng)網(wǎng)絡的輸出對網(wǎng)絡流量進行分類。
3 試驗與分析
本文選用流量文庫http://newsfeed.ntcu.net/中給出的兩組實際數(shù)據(jù)進行實驗,兩組數(shù)據(jù)分別如表1、表2所示。
RBF網(wǎng)絡在數(shù)據(jù)一中采用248個輸入層節(jié)點、262個隱含層節(jié)點和11個輸出層節(jié)點的結構;在數(shù)據(jù)二中采用248個輸入節(jié)點、260個隱含層節(jié)點和8個輸出層節(jié)點的結構。實驗結果如表3所示。
本文提出了一種基于RBF神經(jīng)網(wǎng)絡的網(wǎng)絡流量識別方法。通過測試兩組開發(fā)的網(wǎng)絡流量數(shù)據(jù)集,證明該方法具有較高的準確度、低復雜性和良好的自適應性。
參考文獻
[1] Shi Zhongzhi.Neural Network[M].Beijing:Higher Education Press,2009.
[2] COVER T M.Geometrical and statistical properties of system of linear inequalities with applications in pattern recognition[J].IEEE Transactions on Electronic Computer,1965(14):326-334.
[3] Fei Sike Technology R&D Center.Matlab Application[M]. Beijing:Electronic Industry Press,2005.
[4] MOORE A W,ZUEV D.Discriminators for use in flow-based classification[A].Intel Research,Cambridge,2005.
[5] 王俊松.基于Elman神經(jīng)網(wǎng)絡的網(wǎng)絡流量建模及預測[J].計算機工程,2009(9):190-191.