《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應(yīng)用 > 基于BP算法的無模型自適應(yīng)迭代學(xué)習(xí)控制
基于BP算法的無模型自適應(yīng)迭代學(xué)習(xí)控制
來源:微型機(jī)與應(yīng)用2010年第22期
李 佳
(青島科技大學(xué) 自動化與電子工程學(xué)院 自主導(dǎo)航與智能控制研究所,山東 青島266042)
摘要: 為了改善針對一般非線性離散時間系統(tǒng)的控制性能,引入“擬偽偏導(dǎo)數(shù)”概念,給出了一般非線性離散時間系統(tǒng)沿迭代軸的非參數(shù)動態(tài)線性化形式,并綜合BP神經(jīng)網(wǎng)絡(luò)以及模糊控制各自的優(yōu)點(diǎn),提出了基于BP算法無模型自適應(yīng)迭代學(xué)習(xí)控制方案。仿真結(jié)果表明,該控制器對模型有較強(qiáng)的魯棒性和跟蹤性。
Abstract:
Key words :

摘  要: 為了改善針對一般非線性離散時間系統(tǒng)的控制性能,引入“擬偽偏導(dǎo)數(shù)”概念,給出了一般非線性離散時間系統(tǒng)沿迭代軸的非參數(shù)動態(tài)線性化形式,并綜合BP神經(jīng)網(wǎng)絡(luò)以及模糊控制各自的優(yōu)點(diǎn),提出了基于BP算法無模型自適應(yīng)迭代學(xué)習(xí)控制方案。仿真結(jié)果表明,該控制器對模型有較強(qiáng)的魯棒性和跟蹤性。
關(guān)鍵詞: BP算法;無模型自適應(yīng)控制;迭代學(xué)習(xí);擬偽偏導(dǎo)數(shù)

    針對設(shè)計部分依賴、不完全依賴和不依賴受控系統(tǒng)數(shù)學(xué)模型的控制系統(tǒng),國內(nèi)外控制理論界做了多年的努力,發(fā)展了許多理論和方法。例如專家系統(tǒng)、模糊控制[1]、神經(jīng)網(wǎng)絡(luò)、多模型方法等。最近無模型自適應(yīng)控制理論得到了廣泛的應(yīng)用,該控制器的設(shè)計和分析不需要已知系統(tǒng)的任何知識,僅依賴于系統(tǒng)的輸入輸出數(shù)據(jù),與模型結(jié)構(gòu)、系統(tǒng)階數(shù)均無關(guān)。
    迭代學(xué)習(xí)控制(ILC)可利用以前操作的信息修正當(dāng)前控制行為,提高控制性能,可以實(shí)現(xiàn)有限時間區(qū)間上的完全跟蹤任務(wù),近十幾年來得到了廣泛的研究[2]。池榮虎將非參數(shù)自適應(yīng)控制(NP-AC)的基本思想和分析手段引入到學(xué)習(xí)過程中,提出了一種新的無模型自適應(yīng)迭代學(xué)習(xí)控制方案(MF-AILC)[3,4]。考慮如下一般非線性離散時間SISO系統(tǒng):


這種控制方案只需系統(tǒng)的輸入輸出數(shù)據(jù),與系統(tǒng)的模型結(jié)構(gòu)、系統(tǒng)階數(shù)無關(guān)。
    神經(jīng)網(wǎng)絡(luò)是借鑒于生物神經(jīng)網(wǎng)絡(luò)而發(fā)展起來的新型智能信息處理系統(tǒng),可作為一般的函數(shù)估計器,有較強(qiáng)的自學(xué)習(xí)、自組織與自適應(yīng)性,能夠用數(shù)理方法從信息處理的角度對人腦神經(jīng)網(wǎng)絡(luò)進(jìn)行抽象,并建立某種簡化模型。模糊邏輯則模仿人腦的邏輯思維機(jī)理,用于處理模型未知或不精確的控制問題,對非線性系統(tǒng)控制簡單、有效。二者各有所長,具有互補(bǔ)性。模糊神經(jīng)網(wǎng)絡(luò)將神經(jīng)網(wǎng)絡(luò)與模糊邏輯[5]相結(jié)合,這種結(jié)合給智能系統(tǒng)提供了一個新的研究方向[6]。

    根據(jù)系統(tǒng)的運(yùn)行狀態(tài),調(diào)整控制器的參數(shù)-擬偽偏導(dǎo)數(shù)θ(k,t),以達(dá)到某種性能指標(biāo)的最優(yōu)化,使輸出層的輸出對應(yīng)于擬偽偏導(dǎo)數(shù)θ(k,t),通過神經(jīng)網(wǎng)絡(luò)的自身學(xué)習(xí)、加權(quán)系數(shù)調(diào)整,使其穩(wěn)定狀態(tài)對應(yīng)于某種最優(yōu)控制律下的無模型自適應(yīng)控制器的參數(shù)。引入模塊模糊量化法,系統(tǒng)的狀態(tài)變量進(jìn)行歸檔模糊量化和歸一化處理。利用模糊控制的魯棒性和非線性控制作用,對神經(jīng)網(wǎng)絡(luò)NN的輸入進(jìn)行預(yù)處理,避免了當(dāng)神經(jīng)網(wǎng)絡(luò)用Sigmoid函數(shù)或雙曲正切函數(shù)時,由于輸入過大易導(dǎo)致輸出趨于飽和使得對輸入不再敏感。
2 算法實(shí)現(xiàn)
2.1 BP神經(jīng)網(wǎng)絡(luò)

    三層BP神經(jīng)網(wǎng)絡(luò),有M個輸入節(jié)點(diǎn)、Q個隱層節(jié)點(diǎn)、一個輸出節(jié)點(diǎn),輸出節(jié)點(diǎn)對應(yīng)無模型自適應(yīng)迭代學(xué)習(xí)控制器的逆為偏導(dǎo)數(shù)θ(k,t),輸出層和隱層的神經(jīng)元的激勵函數(shù)可取正負(fù)對稱的Sigmoid函數(shù)。
    BP網(wǎng)絡(luò)的前向計算和加權(quán)系數(shù)修正迭代算法如下:
    輸入節(jié)點(diǎn)對應(yīng)經(jīng)模糊量化處理后的系統(tǒng)狀態(tài)變量:
  

    本文將BP神經(jīng)網(wǎng)絡(luò)、模糊理論及無模型自適應(yīng)迭代學(xué)習(xí)相結(jié)合,構(gòu)造出了一種基于BP神經(jīng)網(wǎng)絡(luò)的模糊無模型自適應(yīng)迭代學(xué)習(xí)控制器。該控制器綜合了三者的優(yōu)點(diǎn),利用有著較強(qiáng)的非線性逼近性的BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)逆?zhèn)纹珜?dǎo)數(shù)。文章提出的控制方案,不需要已知系統(tǒng)的任何先驗(yàn)知識,是一種無模型的方法,而且迭代學(xué)習(xí)控制律的學(xué)習(xí)增益僅依賴于系統(tǒng)的輸入輸出數(shù)據(jù)設(shè)計,并可沿學(xué)習(xí)軸迭代地更新。仿真結(jié)果表明了該控制方案的有效性。

參考文獻(xiàn)
[1] 李友善.Fuzzy控制理論在甜菜制糖過程的應(yīng)用[J].自動化學(xué)報,1994,20(3):334-337.
[2] LIN C J,LIN C T.An ART-based fuzzy adaptive learning control networks[J].IEEE Trans on Fuzzy Systems,1997,5(4):477-496.
[3] 池榮虎.非線性離散時間系統(tǒng)的自適應(yīng)迭代學(xué)習(xí)控制及應(yīng)用[D].北京:北京交通大學(xué)博士論文,2006.
[4] CHI Rong Hu,HOU Zhong Sheng.A model-free adaptive control approach for freeway traffic density via ramp metering[J].IJICIC 2008,4(11):2823-2832.
[5] 劉有才,劉增良.模糊邏輯與神經(jīng)網(wǎng)絡(luò)[M].北京:北京航空航天大學(xué)出版社,1996.
[6] ZHANG Jin, LI Heng Tong.Adaptive neural network control for a class of MIMO nonlinear systems with disturbances in discrete-time[J]. IEEE Trans on Fuzzy Systems,2004,34(4).
[7] 施陽.MATLAB語言精要及動態(tài)仿真工具SIMULINK[M]. 西安:西北工業(yè)大學(xué)出版社,1999.
[8] 聞新,周露,李翔,等.MATLAB神經(jīng)網(wǎng)絡(luò)仿真與應(yīng)用[M]. 北京:北京科學(xué)出版社,2003.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。