《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 基于有限記憶、概率學(xué)習(xí)的雙時(shí)間尺度切片資源分配方法
基于有限記憶、概率學(xué)習(xí)的雙時(shí)間尺度切片資源分配方法
電子技術(shù)應(yīng)用
邵鋒1,孫君1,2
1.南京郵電大學(xué) 通信與信息工程學(xué)院;2.江蘇省無(wú)線(xiàn)通信重點(diǎn)實(shí)驗(yàn)室
摘要: 網(wǎng)絡(luò)切片是使網(wǎng)絡(luò)能夠滿(mǎn)足不同垂直領(lǐng)域的不同服務(wù)需求的關(guān)鍵要素,為解決網(wǎng)絡(luò)中切片類(lèi)型動(dòng)態(tài)變化的問(wèn)題,提出了一種聯(lián)邦-多智能體強(qiáng)化學(xué)習(xí)雙時(shí)間尺度資源分配(F-MALML)算法。大時(shí)間尺度下,通過(guò)有限記憶學(xué)習(xí)算法為每個(gè)基站分配資源;小時(shí)間尺度內(nèi)各基站使用F-MALML算法進(jìn)一步為切片中的用戶(hù)動(dòng)態(tài)分配資源。引入了一種概率學(xué)習(xí)機(jī)制,根據(jù)前一時(shí)隙的分配結(jié)果和網(wǎng)絡(luò)實(shí)際狀態(tài),動(dòng)態(tài)調(diào)整每個(gè)時(shí)間尺度的分配策略。仿真結(jié)果表明,所提算法相比于其他兩種基準(zhǔn)算法在新增切片的切片滿(mǎn)意度及系統(tǒng)頻譜效率方面都有較大提升,且表現(xiàn)出更好的穩(wěn)定性。
中圖分類(lèi)號(hào):TN929.5 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.246123
中文引用格式: 邵鋒,孫君. 基于有限記憶、概率學(xué)習(xí)的雙時(shí)間尺度切片資源分配方法[J]. 電子技術(shù)應(yīng)用,2025,51(3):17-24.
英文引用格式: Shao Feng,Sun Jun. Dual time scale network slice resource allocation method based on limited memory and probability learning[J]. Application of Electronic Technique,2025,51(3):17-24.
Dual time scale network slice resource allocation method based on limited memory and probability learning
Shao Feng1,Sun Jun1,2
1.College of Telecommunications & Information Engineering, Nanjing University of Posts and Telecommunications; 2.Jiangsu Key Laboratory of Wireless Communications
Abstract: Network slicing is crucial for enabling networks to meet the diverse service demands of various verticals. To address the issue of dynamic changes in slice types, a Federated Multi-Agent Reinforcement Learning (F-MALML) algorithm with dualtime scale resource allocation is proposed. At the large time scale, a finite memory learning algorithm allocates resources to each base station. At the small time scale, each base station uses F-MALML to dynamically allocate resources to users. A probabilistic learning mechanism is introduced to adjust the allocation strategy based on previous results and the current network state. Simulation results show that the proposed algorithm achieves significant improvements in slice satisfaction for newly added slices and system spectral efficiency compared to the two benchmark algorithms, while demonstrating better stability.
Key words : network slicing;resource allocation;dual time scale;deep reinforcement learning;slicing satisfaction

引言

5G-A和6G移動(dòng)網(wǎng)絡(luò)將帶來(lái)增強(qiáng)的網(wǎng)絡(luò)能力和性能,為不同的行業(yè)和個(gè)人提供各種用例[1]。不同的應(yīng)用程序在帶寬、時(shí)延、能源效率、移動(dòng)性等方面有不同甚至相互矛盾的要求,而網(wǎng)絡(luò)切片技術(shù)可以有效地解決這一需求。網(wǎng)絡(luò)切片通常包括接入網(wǎng)切片和核心網(wǎng)切片,對(duì)無(wú)線(xiàn)接入網(wǎng)(Radio Access Network,RAN)來(lái)說(shuō),向用戶(hù)分配無(wú)線(xiàn)電資源是一項(xiàng)極其復(fù)雜的操作,通常面臨著資源稀缺和異構(gòu)服務(wù)質(zhì)量(QoS)的問(wèn)題[2]。因此,如何將通信資源以最佳方式分配到切片和用戶(hù)成為關(guān)鍵問(wèn)題。Zangooei 等人比較綜合地調(diào)研了在RAN切片中處理資源分配問(wèn)題最先進(jìn)的強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)方法,并且給出了RL方法在網(wǎng)絡(luò)切片中可能存在的問(wèn)題以及解決方案[3]。Hua等人針對(duì)最大化網(wǎng)絡(luò)切片中的系統(tǒng)頻譜效率(Spectral Efficiency,SE)、系統(tǒng)效用等參數(shù)做出了研究[4-7]。Filali等人針對(duì)服務(wù)水平協(xié)議(Service Level Agreement,SLA)滿(mǎn)意度以及資源塊(Resource Block,RB)分配效率、尋求最優(yōu)的RB分配策略問(wèn)題做出了研究[8-11]。新興的6G網(wǎng)絡(luò)預(yù)計(jì)將為異構(gòu)需求提供更多的服務(wù),這是由許多垂直行業(yè)創(chuàng)建的[12],因此網(wǎng)絡(luò)切片的類(lèi)型更加多樣,粒度需要更加精細(xì),且可能發(fā)生動(dòng)態(tài)變化?;谏鲜鎏魬?zhàn),本文針對(duì)多基站多切片、切片類(lèi)型動(dòng)態(tài)變化場(chǎng)景下的資源分配問(wèn)題做出了研究,提出了一種更加智能化的算法,并通過(guò)仿真驗(yàn)證了算法的性能。


本文詳細(xì)內(nèi)容請(qǐng)下載:

http://theprogrammingfactory.com/resource/share/2000006353


作者信息:

邵鋒1,孫君1,2

(1.南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003;

2.江蘇省無(wú)線(xiàn)通信重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210003)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。