文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.04.013
引用格式: 張子霖. 基于深度強(qiáng)化學(xué)習(xí)的電動汽車協(xié)調(diào)充電算法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2022,41(4):83-89.
0 引言
電動汽車作為一種新型的分布式移動資源,已成為智能電網(wǎng)發(fā)展的重要組成部分[1],越來越多的研究人員開始關(guān)注電動汽車在電網(wǎng)中的社會價值。但電動汽車的日益普及也不可避免地給用戶和電網(wǎng)帶來了一系列的問題和挑戰(zhàn)。例如,大量電動汽車的不協(xié)調(diào)充電,將導(dǎo)致電網(wǎng)承受不可預(yù)測的負(fù)荷。因此,如何設(shè)計(jì)多輛電動汽車在整個工作過程中的協(xié)調(diào)充電策略,以降低能源成本,保證用戶對電動汽車荷電狀態(tài)的滿意度,并將對配電網(wǎng)的影響降到最低,是亟需解決的問題。
近年來,為了解決電動汽車的協(xié)調(diào)充電問題,出現(xiàn)了許多分布式調(diào)度方法。例如,為了最大限度地提高電動汽車用戶的便利性,開發(fā)了一種分散的基于交替方向乘法器的優(yōu)化算法[2]。為使電動汽車充電成本最小化,使用電動汽車充電概率模型建立了一個嚴(yán)格凸分散系統(tǒng)形式的多人博弈[3]。但上述研究只關(guān)注了單一的目標(biāo),這在實(shí)際應(yīng)用中往往是受限制的。針對多目標(biāo)的協(xié)調(diào)充電問題,通過多智能體自私協(xié)同優(yōu)化的方案,除了實(shí)現(xiàn)用戶利益以外,也保證避免變壓器過載[4],但它沒有充分考慮狀態(tài)空間泛化和值函數(shù)逼近的影響,導(dǎo)致擬合性能較差,計(jì)算開銷也不理想。針對該問題,文獻(xiàn)[5]考慮采用基于機(jī)器學(xué)習(xí)的方法,其以收斂速度快、計(jì)算效率高而被廣泛應(yīng)用于大規(guī)模數(shù)據(jù)的高維問題中。
本文詳細(xì)內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000004104
作者信息:
張子霖
(中國科學(xué)技術(shù)大學(xué) 自動化系,安徽 合肥230026)