文獻標識碼: A
文章編號: 0258-7998(2011)12-0076-04
基于案例推理CBR(Case-Based Reasoning)借鑒人類處理問題的方式,運用以前積累的知識和經驗直接解決問題。由于CBR具備自主學習功能,不要求決策主體掌握豐富領域知識或精確的數學模型,僅僅通過簡單的案例記憶就能實現出色的增量學習和自我提升,因而引起相關專家和學者的關注,逐漸成為人工智能領域的一個研究熱點。
認知無線電技術作為無線通信領域與人工智能領域相結合的產物[1],近年來受到極大關注。認知決策引擎是認知無線電CR(Cognitive Radio)實現其智能的核心功能模塊,決策引擎以CR觀察到的外界無線環(huán)境、CR自身狀態(tài)和用戶需求信息為輸入,對目標和情境進行分析,根據已有知識進行推理、決策,輸出達到用戶需求的優(yōu)化配置,同時能夠學習不同配置在新環(huán)境下的效用,從而豐富系統(tǒng)知識,以適應環(huán)境和需求的變化[2]。
當認知無線電可以通過觀察獲得需要的所有環(huán)境知識(表示為c),且用戶需求u與環(huán)境c和配置d之間的定量關系u=f(c,d)已知時,將認知決策的過程建模為一個優(yōu)化問題[3],即在給定的環(huán)境c下,尋找最優(yōu)配置決策d,使性能u最大(或尋找某個配置決策d,使性能u得到滿足)的情況。參考文獻[4]使用遺傳算法對CR中多目標優(yōu)化問題進行了研究,參考文獻[5]將粒子群優(yōu)化算法應用在認知引擎的決策問題中,參考文獻[6]考慮遺傳算法中參數敏感度對不同目標的影響,進一步提升了優(yōu)化效率。然而,在實際應用中,CR可直接觀測得到的環(huán)境參數有限(比如信道統(tǒng)計特性等無法直接觀測得到),且系統(tǒng)可能面臨各種不同的傳播環(huán)境、動態(tài)接入不同頻段的信道,輸入c和u與輸出d的關系很復雜,函數f無法事先確知。此時,認知無線電需要通過不斷地學習來理解并適應環(huán)境。目前,針對環(huán)境部分可觀測、精確函數f未知下的認知決策系統(tǒng)研究才剛起步,參考文獻[3]簡單舉例說明了學習在解決這類問題當中的關鍵作用,但尚未有相關系統(tǒng)的研究成果出現。
本文針對這類問題,研究基于案例的推理決策問題,提出基于案例庫的認知決策引擎。文中所提決策框架具有自學習、多狀態(tài)多目標通用性強、快速收斂等特點。
1 CBR簡介
基于案例的推理模仿人類的思維方式,直接援引以前積累的經驗和知識解決現在的問題,同時將當前問題及解決結果補充為新知識,從而實現自主學習和增量學習。
通常,CBR系統(tǒng)的運作過程可以概括為“4Rs”(如圖1所示):
(1)檢索(Retrieve):分析當前面臨的新問題,定義新問題的特征或屬性,在案例庫中尋找對解決當前問題有最大潛在啟發(fā)價值的舊案例;
(2)重用(Reuse):以相似案例為基礎,通過自適應的調整,構造新問題的解決策略;
(3)修訂(Revise):執(zhí)行并驗證當前策略;
(4)存儲(Retain):將有參考價值的經驗案例存儲到案例庫中。
其中,檢索和重用屬于推理階段,修訂和存儲屬于學習階段,學習的過程將以往的決策經驗以案例的形式進行積累,使系統(tǒng)知識不斷豐富,以提高未來推理的效能,從而在面對新問題時能夠做出更好的決策。
2 基于CBR與模擬退火的自學習認知決策算法
認知引擎的輸入變量包括用戶的目標需求、觀測到的無線環(huán)境變量以及CR自身狀態(tài),三者共同影響認知引擎的配置決策。為了使CR通信案例庫具有廣泛的可借鑒性,為不同目標、不同狀態(tài)的CR決策提供參考,構建如表1所示案例庫。其中條件屬性包括觀測的無線環(huán)境特征和自身狀態(tài)(如當前信道是否空閑、最大發(fā)射功率、可選的調制編碼方式等),用于描述問題發(fā)生的場景或情境。決策屬性為CR所作的一些反應,包括信道、發(fā)射功率、調制方式、編碼方式、數據包長等配置參數。結果為在不同條件屬性下,相應配置所帶來的不同目標的實際性能,如誤比特率、吞吐量、頻譜效率、存活時間等。
出,算法具有快速收斂性(決策100次左右,算法已經能夠獲取可觀的性能),且退火系數越小,溫度下降越快,收斂也越快,但過快收斂的代價是性能次優(yōu);而反之,過大的退火系數能夠帶來更優(yōu)的吞吐量,然而收斂速度相對較慢。在接下來的仿真中,取λ=0.5。
為驗證本算法對于不同通信目標的廣泛通用性,考慮兩種典型通信目標。目標1:最大化系統(tǒng)吞吐量;目標2:在保證系統(tǒng)吞吐量大于4 Mb/s前提下,最大化頻譜能效。仿真結果如圖3所示。對于通信目標1,隨著案例經驗的累積,其學到的知識也日益豐富,因而系統(tǒng)吞吐量性能越來越好(如圖3左上所示),但其頻譜效能并未得到提高(圖3左下)。對于通信目標2,在配置決策滿足吞吐量的目標要求下(圖3右上),系統(tǒng)的頻譜效能隨著決策的進行逐漸提高(圖3右下)。仿真結果表明本算法可以滿足不同的目標需求。
圖4為功率參數調整曲線。如圖,當通信目標為最大化用戶吞吐量時,盡管系統(tǒng)不知道功率越大則吞吐量越大的這種先驗知識,但是通過不斷學習,系統(tǒng)不斷調整其發(fā)射功率,使其逼近于最大發(fā)射功率23 dBm。另一方面,對于最大化頻譜能效的用戶而言,功率將被調整到一個適合的大小。
圖5和圖6分別統(tǒng)計了兩種目標下,不同信道和不同調制方式被應用的概率。針對通信目標1,CR首選信道5并采用16QAM的調制方式(5信道帶寬大且傳播損耗相對較小),而針對目標2,CR首選信道傳播損耗最小的信道6,并應用調制階數最高的64QAM調制方式。
本文針對認知無線電中環(huán)境部分可觀測,信道統(tǒng)計信息先驗未知,且系統(tǒng)的目標、環(huán)境與配置間的關系不明確,需要通過學習進行配置決策的問題,提出了一種基于案例推理和模擬退火思想的認知決策引擎算法,理論分析和仿真結果表明,該算法具有增量自學習、多目標適用性、快速收斂等優(yōu)點。案例庫有廣泛借鑒性,可實現在不同節(jié)點間相互學習的功能,下一步可研究關于多節(jié)點合作的學習引擎的實現方法,如何應用數據挖掘的方法從案例庫中提取出有用知識的問題也有待進一步研究。
參考文獻
[1] MITOLA J. Cognitive radio-making software radios more personal[J]. IEEE Personal Communications, 1999,6(4):13-18.
[2] 汪李峰,魏勝群.認知引擎技術[J].中興通信技術,2009,15(04):05-09.
[3] CLANCY C,HECKER J,et al.Application of machine learning to cognitive radio networks[J].IEEE Wireless Communications, 2007,14(4):47-52.
[4] RIESER C J. Biologically inspired cognitive radio engine model utilizing distributed genetic algorithms for secure and robust wireless communications and networking[D]. Blacksburg,VA,USA:Virginia Polytechnic Institute and State University, 2004.
[5] 趙知勁,徐世宇,鄭仕鏈,等.基于二進制粒子群算法的認知無線電決策引擎[J].物理學報, 2009,58(7):5118-5125.
[6] NEWMAN T R, EVANS J B. Parameter sensitivity in cognitive radio adaptation engines[C]. New Frontiers in Dynamic Spectrum Access Networks, DySPAN 2008, 3st IEEE International Symposium on, Chicago, IL(2008-01-05.