文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.191010
中文引用格式: 荊通,丁文銳,劉春輝. 基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測(cè)方法[J].電子技術(shù)應(yīng)用,2020,46(3):80-85.
英文引用格式: Jing Tong,Ding Wenrui,Liu Chunhui. Multi-step spectrum occupancy prediction method based on association rule mining[J]. Application of Electronic Technique,2020,46(3):80-85.
0 引言
認(rèn)知無線電技術(shù)提高了系統(tǒng)的頻譜利用率,然而在傳統(tǒng)頻譜感知中,認(rèn)知用戶對(duì)所有頻帶進(jìn)行感知會(huì)造成大量的能量損耗和處理時(shí)延,因此如何準(zhǔn)確預(yù)測(cè)空間頻譜占用情況,即頻譜預(yù)測(cè)技術(shù),受到研究人員的廣泛研究。頻譜預(yù)測(cè)技術(shù)能夠?yàn)檎J(rèn)知用戶提供更好的頻譜接入條件,減少認(rèn)知用戶和主用戶之間產(chǎn)生的數(shù)據(jù)傳輸沖突,避免對(duì)主用戶通信造成干擾,降低響應(yīng)時(shí)延,增加網(wǎng)絡(luò)的吞吐量[1]。頻譜預(yù)測(cè)過程一般包含3個(gè)步驟:(1)數(shù)據(jù)采集,實(shí)際頻譜采集或建立仿真頻譜模型生成;(2)數(shù)據(jù)預(yù)處理,有效數(shù)據(jù)選取、信號(hào)與噪聲的分離;(3)頻譜預(yù)測(cè),設(shè)計(jì)頻譜預(yù)測(cè)方法進(jìn)行預(yù)測(cè)。
設(shè)計(jì)有效的頻譜預(yù)測(cè)方法需考慮預(yù)測(cè)機(jī)制與預(yù)測(cè)方法兩方面:預(yù)測(cè)機(jī)制大多是采用時(shí)隙通信模式,將每個(gè)時(shí)隙的頻譜占用或空閑情況定義為一個(gè)二元時(shí)間序列,通過分析歷史數(shù)據(jù)獲取頻譜使用規(guī)律,進(jìn)而預(yù)測(cè)未來頻譜占用狀態(tài)[2];頻譜預(yù)測(cè)方法主要有基于隱馬爾可夫(Hidden Markov Model,HMM)的方法[3]、基于自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average,ARIMA)的方法[4]、基于神經(jīng)網(wǎng)絡(luò)的方法[5]、基于關(guān)聯(lián)規(guī)則挖掘的方法等[6]?;陉P(guān)聯(lián)規(guī)則挖掘的方法在頻譜預(yù)測(cè)中性能表現(xiàn)較好,這類方法又包括基于部分周期模式挖掘的方法[6]、基于貝葉斯的方法[7]、應(yīng)用統(tǒng)計(jì)學(xué)習(xí)的方法[8]以及最大子模式命中[9]等。
在實(shí)際頻譜預(yù)測(cè)應(yīng)用中,往往不僅需要預(yù)測(cè)下一個(gè)時(shí)隙的頻譜占用情況,而且需要預(yù)測(cè)多個(gè)時(shí)隙一分鐘甚至一小時(shí)的頻譜占用情況,進(jìn)而統(tǒng)計(jì)分析信道的可用性,避免頻繁切換信道。現(xiàn)有方法只能保證下一個(gè)時(shí)隙的一步預(yù)測(cè)效果較為理想,而多時(shí)隙多步預(yù)測(cè)存在效果下降較快的問題。針對(duì)這一問題,本文借鑒Apriori算法中查找頻繁項(xiàng)集的思想,提出基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測(cè)方法,通過采集真實(shí)數(shù)據(jù)對(duì)所提出方法進(jìn)行實(shí)驗(yàn)驗(yàn)證。
1 頻譜占用度
1.1 頻譜占用度預(yù)測(cè)用數(shù)據(jù)選取
信道頻譜占用度可以體現(xiàn)頻譜的活躍程度,信道頻譜活躍程度對(duì)驗(yàn)證方法的可行性十分關(guān)鍵。若信道頻譜占用度極低(0%~5%),數(shù)據(jù)處理后生成的信道狀態(tài)信息(Channel State Information,CSI)序列將近似為全0序列;若信道頻譜占用度極高(95%~100%),生成的CSI序列將近似為全1序列,對(duì)這些信道進(jìn)行CSI序列預(yù)測(cè)得到的結(jié)果極為可觀,正確率可達(dá)到90%以上,丟失率接近0。但這兩種極端情況都將使得CSI信道活躍度降低,即0/1狀態(tài)的轉(zhuǎn)換頻率變低,此時(shí)頻譜占用預(yù)測(cè)也將失去意義。故本文選取頻譜占用度35%~94%的信道進(jìn)行預(yù)測(cè)分析。信道占用度計(jì)算方法如式(1)所示:
其中,F(xiàn)co表示信道占用度,Tf表示信道占用時(shí)間,T表示信道測(cè)量時(shí)間。
1.2 頻譜占用度閾值選取
頻譜占用狀態(tài)只有兩種:占用和空閑。通常,信道頻譜強(qiáng)度高于某門限,則認(rèn)為信道處于被占用狀態(tài),用“1”表示;相反,認(rèn)為信道處于空閑狀態(tài),用“0”表示,轉(zhuǎn)換原理如式(2)所示:
其中,cs表示信道狀態(tài),PC表示信道電平值,PO表示預(yù)設(shè)門限值。該過程中如果預(yù)設(shè)門限值設(shè)置較小,則某些噪聲信號(hào)將被誤認(rèn)為是有用信號(hào);若門限設(shè)置較高,則會(huì)遺漏有用信號(hào),因此頻譜占用度閾值的選取是數(shù)據(jù)預(yù)處理過程較為關(guān)鍵的步驟。
本文采用動(dòng)態(tài)門限分割[10]的方法確定頻譜占用度門限,方法流程如圖1所示。
動(dòng)態(tài)門限分割方法涉及兩個(gè)參數(shù),一個(gè)是用于信噪分離的判別值,另一個(gè)是噪聲曲線平滑處理的次數(shù)。在《超短波頻段占用度測(cè)試技術(shù)規(guī)范》中,建議門限電平設(shè)置為各頻段內(nèi)當(dāng)?shù)亟邮諜C(jī)平均功率電平或電壓指示以上5 dB。在無線電監(jiān)測(cè)工作中,一般把超過噪聲電平3 dB~5 dB的頻點(diǎn)視為信號(hào)。基于以上兩點(diǎn),本文采用5 dB作為信噪分離的判別值,平滑處理次數(shù)取60,動(dòng)態(tài)門限如圖2所示。
圖2(a)信道編號(hào)為3,統(tǒng)計(jì)電平值較低,多數(shù)集中在-76.45 dBm左右,且處于動(dòng)態(tài)判決門限以下,被認(rèn)定為噪聲信道;圖2(b)信道編號(hào)為61,統(tǒng)計(jì)電平值較高,多數(shù)集中在-67.45 dBm左右,且處于動(dòng)態(tài)判決門限以上,被認(rèn)定為信號(hào)信道。
各個(gè)信道的幅度-頻率信號(hào)被動(dòng)態(tài)門限分割之后就形成了CSI矩陣,如圖3所示(圖中黑色實(shí)心方塊表示當(dāng)前CSI=1,空白處則表示CSI=0)。
2 算法原理
2.1 時(shí)間序列關(guān)聯(lián)規(guī)則挖掘算法
Apriori算法[6]是關(guān)聯(lián)規(guī)則挖掘算法中經(jīng)典的算法,多用于非時(shí)序項(xiàng)集。算法一般分為兩部,一是生成頻繁模式,二是根據(jù)頻繁模式生成關(guān)聯(lián)規(guī)則。而使用該算法處理時(shí)間序列數(shù)據(jù)時(shí),必須對(duì)序列進(jìn)行模式劃分。對(duì)序列進(jìn)行模式劃分時(shí),每次取一部分?jǐn)?shù)據(jù)進(jìn)行時(shí)間序列關(guān)聯(lián)規(guī)則計(jì)算,然后向后滑動(dòng)一個(gè)窗口,產(chǎn)生一個(gè)新的事務(wù),再次計(jì)算時(shí)間序列關(guān)聯(lián)規(guī)則。保持每個(gè)事務(wù)窗口一致,這樣可以使當(dāng)前事務(wù)區(qū)別于上一個(gè)事務(wù),同時(shí)又不會(huì)漏掉可能產(chǎn)生的時(shí)間序列特征組合,如圖4所示。
時(shí)間序列關(guān)聯(lián)規(guī)則挖掘過程中有兩個(gè)重要判決條件:(1)當(dāng)模式出現(xiàn)次數(shù)N大于最小支持度時(shí),生成頻繁模式;(2)頻繁模式轉(zhuǎn)移率P大于最小置信度時(shí),生成關(guān)聯(lián)規(guī)則,如圖5所示。
2.2 基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測(cè)算法
本節(jié)將使用上文方法生成的關(guān)聯(lián)規(guī)則進(jìn)行多步長頻譜占用預(yù)測(cè)。
本文算法涉及概念和符號(hào)見表1。
輸入:原始幅度頻率數(shù)據(jù)(File_level)。
輸出:預(yù)測(cè)的準(zhǔn)確率以及丟失率。
(1)將原始幅度頻率數(shù)據(jù)通過動(dòng)態(tài)門限分割、信道分割,生成由0和1組成的CSI序列。
(2)當(dāng)生成的CSI序列長度大于跨度L時(shí),檢測(cè)序列中異常值的情況,進(jìn)行基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測(cè)。
(3)對(duì)預(yù)測(cè)結(jié)果與實(shí)際監(jiān)測(cè)結(jié)果進(jìn)行對(duì)比,統(tǒng)計(jì)預(yù)測(cè)準(zhǔn)確率和丟失率。
算法中輸入的原始數(shù)據(jù)為401×n的矩陣(File_level),n為采集數(shù)據(jù)的時(shí)隙數(shù)(本文時(shí)隙間隔為1 s),通過動(dòng)態(tài)門限分割以及信道編號(hào)(1~401)的選擇,形成單一信道的CSI序列。頻繁項(xiàng)跨度(FrQ_length)限定了頻繁子序列長度的最大值,取值范圍可設(shè)為1~n之中的任意整數(shù)值,當(dāng)其設(shè)為1時(shí),算法可近似于兩狀態(tài)馬爾可夫過程;當(dāng)其設(shè)置為接近n時(shí),頻繁項(xiàng)數(shù)量太少,算法失效,故本文取10%n。最小支持度(Min_sup)與最小置信度(Min_conf)體現(xiàn)了頻繁項(xiàng)的頻繁程度以及規(guī)則的可靠性。最小預(yù)測(cè)長度(Min_span)的設(shè)定可以減少頻繁子序列生成規(guī)則的數(shù)量,提升算法效率和精度。
關(guān)聯(lián)規(guī)則是頻譜占用預(yù)測(cè)的主要依據(jù)。項(xiàng)集統(tǒng)計(jì)數(shù)大于Min_sup即為頻繁項(xiàng),若頻繁項(xiàng)A統(tǒng)計(jì)數(shù)為a、頻繁項(xiàng)B統(tǒng)計(jì)數(shù)為b,則轉(zhuǎn)移率Pab=a/b,當(dāng)Pab大于Min_conf時(shí)產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,即當(dāng)前序列為A時(shí),預(yù)測(cè)結(jié)果為B的概率為Pab。
圖6為多步長頻譜占用預(yù)測(cè)算法流程。
在多步長預(yù)測(cè)過程中,算法沒有在規(guī)則中找到適合的規(guī)則,則記為一次丟失,輸出“-1”,即異常值,異常值的出現(xiàn)會(huì)影響下一次的預(yù)測(cè),所以要進(jìn)行異常值替換,每個(gè)異常值“-1”都會(huì)分兩次替換成“0”或“1”,例如序列[1 0 -1 0]會(huì)替換成[1 0 0 0]和[1 0 1 0],由這兩個(gè)序列查找關(guān)聯(lián)規(guī)則中置信度最高的規(guī)則進(jìn)行預(yù)測(cè)或者繼續(xù)丟失,即如果有m個(gè)異常值,則要進(jìn)行2m次替換,最終由替換后的序列置信度最高值進(jìn)行預(yù)測(cè)或者繼續(xù)丟失。若Pred_length>1,即多步長,步長遞增過程如圖7所示,圖中標(biāo)注下劃線并加粗的字符為預(yù)測(cè)序列值,算法使用預(yù)測(cè)結(jié)果更新CSI序列,直至完成多步長預(yù)測(cè)算法。
若當(dāng)前序列滿足預(yù)測(cè)條件,記預(yù)測(cè)次數(shù)(Predict)加1;若預(yù)測(cè)結(jié)果與下一時(shí)隙狀態(tài)序列相同,記預(yù)測(cè)正確次數(shù)(Correct)加1;若最終沒有找到滿足預(yù)測(cè)條件的關(guān)聯(lián)規(guī)則,記丟失次數(shù)(Loss)加1,丟失率記為Loss_Rate,公式如下:
3 實(shí)驗(yàn)及分析
3.1 數(shù)據(jù)采集與預(yù)處理
本文中的頻譜監(jiān)測(cè)數(shù)據(jù)來自北京航空航天大學(xué)學(xué)院路校區(qū)連續(xù)約48 h(2018年12月22日16時(shí)22分~2018年12月24日16時(shí)25分)頻段為88 MHz~108 MHz,即調(diào)頻FM廣播業(yè)務(wù)頻段進(jìn)行監(jiān)測(cè),監(jiān)測(cè)設(shè)備包括是德公司E4407b頻譜分析儀、PC以及SAS-521F-2接收天線,表2列出了監(jiān)測(cè)參數(shù)。
頻譜儀每次掃描空間頻譜獲得400個(gè)頻譜采樣點(diǎn),在監(jiān)測(cè)時(shí)間內(nèi)每一秒形成一個(gè)“場強(qiáng)-頻率”對(duì)應(yīng)關(guān)系的文本數(shù)據(jù)文件,因此每小時(shí)產(chǎn)生3 600個(gè)數(shù)據(jù)集。
數(shù)據(jù)的選取對(duì)預(yù)測(cè)模型的學(xué)習(xí)效果有著極為重要的影響,合適的數(shù)據(jù)能夠?yàn)樘岣哳A(yù)測(cè)模型的正確率提供良好的支持。正常情況下,頻譜的短期變化趨勢(shì)是連續(xù)的,而長期變化具有明顯的周期性,周期性具體體現(xiàn)在日、星期、年周期性以及節(jié)假日特性。為了提高信道頻譜占用預(yù)測(cè)精度,在數(shù)據(jù)選擇時(shí)應(yīng)考慮這一周期性特點(diǎn)。故本文采用第一天100時(shí)隙作為訓(xùn)練集,第二天相同時(shí)間的100時(shí)隙作為測(cè)試集。
圖8為對(duì)所采集到的頻譜數(shù)據(jù)進(jìn)行“場強(qiáng)-頻率-時(shí)間”三維可視化處理結(jié)果。
3.2 主要參數(shù)分析
3.2.1 多步長對(duì)預(yù)測(cè)結(jié)果的影響
圖9和圖10分別展示了13號(hào)和86號(hào)信道中預(yù)測(cè)步長對(duì)預(yù)測(cè)結(jié)果的影響。
通過信道13和信道86的10步預(yù)測(cè)結(jié)果可見,隨著預(yù)測(cè)步長的增加,預(yù)測(cè)丟失率逐漸減少,雖然預(yù)測(cè)正確率也隨步長增加呈下降趨勢(shì),但下降趨勢(shì)較緩,總預(yù)測(cè)正確率由于丟失率的逐漸減少,隨預(yù)測(cè)步長的增加呈略微上升的趨勢(shì)??梢娫撍惴ㄔ诙嗖介L預(yù)測(cè)中有效減少丟失率的同時(shí),保持了較高的預(yù)測(cè)正確率。
3.2.2 信道占用度對(duì)預(yù)測(cè)結(jié)果的影響
本實(shí)驗(yàn)中選取了占用度由35%到94%依次升高的6個(gè)信道。圖11展示了預(yù)測(cè)步長為1和10的結(jié)果。
從圖11中可以看出,總體上信道占用預(yù)測(cè)正確率保持較高的水準(zhǔn),其丟失率沒有隨著占用度的變化有正相關(guān)或者負(fù)相關(guān)的規(guī)律。由此可見總體上算法體現(xiàn)出了良好的性能,信道占用度的變化對(duì)預(yù)測(cè)結(jié)果的影響不大。
3.2.3 規(guī)則置信度對(duì)預(yù)測(cè)結(jié)果的影響
圖12(a)和圖12(b)分別展示了3個(gè)信道在最小置信度為0.7、0.8和0.9時(shí)的正確率和丟失率。
從圖12中可以看出,隨著最小置信度由0.7升高至0.9,丟失率由15%左右升高至40%左右??梢?,最小置信度的設(shè)置對(duì)丟失率影響很大,這是由于隨著最小置信度的升高,可用的關(guān)聯(lián)規(guī)則逐漸減少,即信道信息的可預(yù)測(cè)性降低。預(yù)測(cè)正確率隨最小置信度的提高緩慢升高,而預(yù)測(cè)丟失率則隨最小置信度的提高急劇升高,因此,設(shè)置適合的最小置信度對(duì)CSI序列的可預(yù)測(cè)性至關(guān)重要。
4 結(jié)論
本文提出類Apriori算法的頻繁模式關(guān)聯(lián)規(guī)則挖掘算法,實(shí)現(xiàn)對(duì)信道占用狀態(tài)的多步長預(yù)測(cè)。實(shí)驗(yàn)表明,該算法在實(shí)際頻譜預(yù)測(cè)中相比隱馬爾科夫模型和神經(jīng)網(wǎng)絡(luò)模型等預(yù)測(cè)方法,不需要任何先驗(yàn)知識(shí),可根據(jù)歷史數(shù)據(jù)進(jìn)行快速預(yù)測(cè),達(dá)到了較好的預(yù)測(cè)效果。
參考文獻(xiàn)
[1] 劉鎮(zhèn)鳴,龔曉峰.認(rèn)知無線電中頻譜預(yù)測(cè)方法[J].兵工自動(dòng)化,2017,36(9):86-89.
[2] 尹斯星.認(rèn)知無線電中基于海量頻譜監(jiān)測(cè)數(shù)據(jù)挖掘的動(dòng)態(tài)頻譜接入策略研究[D].北京:北京郵電大學(xué),2010.
[3] 張凱,齊麗娜.一種基于隱馬爾可夫模型的自適應(yīng)聯(lián)合頻譜預(yù)測(cè)方法[J].南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,35(1):79-83.
[4] 段洪濤,曾繁聲,李景春.一種預(yù)測(cè)頻段占用度的時(shí)間序列分析方法[J].無線電工程,2011,41(7):17-20,64.
[5] 楊健,趙杭生,陳曦.遺傳算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)頻譜預(yù)測(cè)模型訓(xùn)練[J].解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,17(6):505-511.
[6] 滿方微,石榮,何彬彬.基于關(guān)聯(lián)規(guī)則挖掘的無線電頻譜占用預(yù)測(cè)[J].電訊技術(shù),2016,56(11):1183-1188.
[7] HUANG P,LIU C,YANG X,et al.Wireless spectrum occupancy prediction based on partial periodic pattern mining[J].IEEE Transactions on Parallel and Distributed Systems,2014,25(7):1925-1934.
[8] JACOB J,JOSE B R,MATHEW J.Spectrum prediction in cognitive radio networks: a bayesian approach[C].2014 Eighth International Conference on Next Generation Mobile Apps,Services and Technologies,Oxford,2014:203-208.
[9] MAN F,SHI R,HE B.The data mining in wireless spectrum monitoring application[C].2017 IEEE 2nd International Conference on Big Data Analysis(ICBDA),Beijing,2017:223-227.
[10] 丁浩,沈文靜.基于動(dòng)態(tài)門限電平的短波段頻譜占用度測(cè)量[C].2011全國無線及移動(dòng)通信學(xué)術(shù)大會(huì)論文集,2011:408-411.
作者信息:
荊 通1,丁文銳1,2,劉春輝2
(1.北京航空航天大學(xué) 電子信息工程學(xué)院,北京100191;2.北京航空航天大學(xué) 無人系統(tǒng)研究院,北京100191)