文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.174797
中文引用格式: 王平,于祥春. 基于密度聚類的能耗數(shù)據(jù)采集網(wǎng)關(guān)設(shè)計[J].電子技術(shù)應(yīng)用,2018,44(6):35-38,43.
英文引用格式: Wang Ping, Yu Xiangchun. Design of power information collection gateway based on density clustering[J]. Application of Electronic Technique,2018,44(6):35-38,43.
0 引言
隨著網(wǎng)絡(luò)技術(shù)的進步與發(fā)展,將無線抄表系統(tǒng)應(yīng)用于電力行業(yè)已然成為一種趨勢[1]。集中器作為用電信息采集系統(tǒng)中的重要節(jié)點,是實現(xiàn)主站與采集節(jié)點的通信橋梁[2]。集中器作為中介轉(zhuǎn)發(fā)設(shè)備,缺乏對用電數(shù)據(jù)進行分析的能力,導(dǎo)致主站對用電行為分析和響應(yīng)的滯后[3]。為了能夠在用戶側(cè)實現(xiàn)對能耗采集數(shù)據(jù)的分析與處理,采用該網(wǎng)關(guān)對集中器進行接入管理,獲取各集中器的能耗數(shù)據(jù)并進行分類存儲與分析,以解決主站對異常用電滯后的問題。
目前,諸多學(xué)者針對用電信息采集系統(tǒng)及異常能耗數(shù)據(jù)分析提出了多種解決方案。文獻[3]通過構(gòu)造關(guān)聯(lián)規(guī)則,提出了一種基于密度聚類DBSCAN算法,用于識別離群點的用電模式。文獻[4]通過軟、硬件的協(xié)同配合,實現(xiàn)了集中器與控制終端和遠程管理中心快速、可靠的通信。文獻[5]中的用電信息采集系統(tǒng)側(cè)重于需求管理和響應(yīng),分析了用戶用電行為。文獻[6]基于實時性方面的考慮,提出了一種層次化的異常事件檢測系統(tǒng)。以上研究對用電信息采集系統(tǒng)的發(fā)展做出了積極貢獻。
為解決主站對用電數(shù)據(jù)分析滯后的問題,本文研究了網(wǎng)關(guān)接入用電信息采集系統(tǒng)時獲取地址的過程;網(wǎng)關(guān)接入用電信息采集網(wǎng)絡(luò)后,讀入集中器能耗數(shù)據(jù)并進行分類存儲,采用密度聚類DBSCAN算法[7-8]得出離群點集合,并通過決策樹C4.5算法[9-10]得出離群點數(shù)據(jù)對應(yīng)的用電行為。
1 網(wǎng)關(guān)獲取節(jié)點地址
網(wǎng)關(guān)與主站通信在應(yīng)用層應(yīng)滿足376.1電網(wǎng)規(guī)約[11],該規(guī)約對數(shù)據(jù)域地址進行規(guī)定,其地址由3部分組成:2 B行政區(qū)劃碼A1、2 B終端地址A2和1 B主站地址和組地址標志A3。
網(wǎng)關(guān)接入用電信息采集網(wǎng)絡(luò),獲取節(jié)點地址的流程如下:網(wǎng)關(guān)通過構(gòu)建數(shù)據(jù)幀,向主站發(fā)送地址查詢命令,獲取地址A,其由2 B的行政區(qū)劃碼A1和2 B的終端地址A2構(gòu)成,地址格式如圖1所示。
網(wǎng)關(guān)與主站進行通信的過程中,主站根據(jù)網(wǎng)關(guān)節(jié)點地址構(gòu)建數(shù)據(jù)幀地址域,包括地址段A1、A2和A3。在單播情況下,A1、A2直接從目標集中器地址A中獲取,A3為主站地址和組地址標志。A3的D0位為終端組地址標志,D0為0時表示終端地址A2為單地址;D0為1時表示終端地址A2為組地址;A3的D1~D7組成0~127個主站地址MSA,其中數(shù)據(jù)幀地址域格式如圖2所示。
2 網(wǎng)關(guān)關(guān)鍵軟硬件設(shè)計
網(wǎng)關(guān)基于ARM11和Linux操作系統(tǒng)[12]進行設(shè)計,采用輕量級的SQLite3數(shù)據(jù)庫對相關(guān)能耗數(shù)據(jù)及用戶信息進行存儲。對用電信息采集數(shù)據(jù)進行分析需要基于一定規(guī)模的歷史數(shù)據(jù),考慮到存儲容量、網(wǎng)關(guān)規(guī)格和成本等因素,采用SD卡進行內(nèi)存擴展。選取BOA服務(wù)器作為網(wǎng)關(guān)的Web服務(wù)器程序,在網(wǎng)關(guān)上實現(xiàn)簡單的網(wǎng)頁查看功能。
2.1 外擴存儲模塊設(shè)計
在網(wǎng)關(guān)上實現(xiàn)對用電信息采集數(shù)據(jù)的分析,需要基于一定的歷史數(shù)據(jù),網(wǎng)關(guān)需要存儲一定數(shù)量的數(shù)據(jù),而網(wǎng)關(guān)自身內(nèi)存有限,所以需要擴大用電信息采集網(wǎng)關(guān)的存儲能力,SD卡與S3C6410中的SDIO0接口的原理圖如圖3所示。
2.2 SQLite3數(shù)據(jù)庫的設(shè)計
SQLite3是一個嵌入式數(shù)據(jù)庫,其存儲后端采用Btree實現(xiàn)。SQLite在硬盤上一個數(shù)據(jù)庫一個文件,每個數(shù)據(jù)庫文件頭部保存有這個數(shù)據(jù)庫的元信息,包括版本、大小、Btree根節(jié)點位置等。
數(shù)據(jù)庫可以高效、安全、大批量地對數(shù)據(jù)進行管理,將SQLite3數(shù)據(jù)庫移植到本網(wǎng)關(guān)中以實現(xiàn)對能耗數(shù)據(jù)的分析。根據(jù)用電異常量分析算法對數(shù)據(jù)類型的需求進行存儲,包括能耗類型、相對頻率、用戶類型、環(huán)境溫度等。
2.3 BOA服務(wù)器程序的設(shè)計
本網(wǎng)關(guān)采用BOA服務(wù)器Web程序搭載后臺管理界面,前端界面采用AJAX技術(shù)與服務(wù)器中的CGI程序進行交互,后臺管理網(wǎng)頁設(shè)計架構(gòu)如圖4所示。
用電信息采集網(wǎng)關(guān)Web網(wǎng)頁中的主要功能包括以下3個方面:
(1)查詢能耗信息:通過曲線對能耗信息進行顯示,可以查看用戶時、日、月的用電信息等情況。
(2)查看網(wǎng)關(guān)狀態(tài):主要顯示當前數(shù)據(jù)庫的可用空間、與服務(wù)器間的通信狀況及接入的集中器信息。
(3)查看能耗數(shù)據(jù)分析:可查看歷史能耗信息及異常情況下的數(shù)據(jù)情況。
3 用電信息異常分析算法
3.1 密度聚類算法
網(wǎng)關(guān)將集中器上傳的能耗數(shù)據(jù)進行備份,以進行及時分析。對用電時段進行劃分,將工作日劃分為黑、白兩個時段,將周末劃分為早、中、晚3個時段,各時段的時間跨度可根據(jù)用戶類型及其生活作息習(xí)慣進行調(diào)整。在相同日期類型和時間段內(nèi),人們的用電行為比較類似,用電數(shù)據(jù)具有較小的波動性,采用密度聚類DBSCAN算法獲取異常用電數(shù)據(jù)。
3.2 異常量的獲取
將不同日期類型和時間段的數(shù)據(jù)作為一個能耗數(shù)據(jù)單元,針對不同的數(shù)據(jù)單元采用不同的參數(shù)Eps和MinPts。參數(shù)的選擇效率直接決定了該網(wǎng)關(guān)的質(zhì)量,采用文獻[13]提出的根據(jù)KNN分布算法與數(shù)學(xué)統(tǒng)計分析使網(wǎng)關(guān)自行計算各個數(shù)據(jù)單元中參數(shù)Eps與MinPts的值。
3.3 異常量分析
以一定周期對用電數(shù)據(jù)進行采集,同時采集溫度、日期類型和用電狀態(tài)(是否有異常,是何種異常),并將采集的數(shù)據(jù)存放在data.db文件中。采用決策樹C4.5算法對歷史數(shù)據(jù)及對應(yīng)的用電行為進行訓(xùn)練。調(diào)入通過DBSCAN算法獲取的各個數(shù)據(jù)單元的噪聲點集合根據(jù)決策樹C4.5算法得出各噪聲點所對應(yīng)的異常用電行為,并通過相應(yīng)的機制采取對應(yīng)的措施。然后根據(jù)實際調(diào)查驗證通過決策樹C4.5算法得出的結(jié)論是否正確,如果不正確將實際用電行為替代判斷用電行為。
4 測試與分析
4.1 實驗平臺的搭建
搭建測試環(huán)境,所需設(shè)備與模塊如表1所示。
采用2個集中器分別與16個采集節(jié)點通過470 MHz構(gòu)建無線抄表網(wǎng)絡(luò),網(wǎng)關(guān)通過交換機與集中器和主站(筆記本電腦)相連,集中器通過交換機接入網(wǎng)關(guān)。一個集中器采集子網(wǎng)放置在距離網(wǎng)關(guān)較近的地方,另一個集中器采集子網(wǎng)放置在較遠的地方,并且將兩個集中器采集子網(wǎng)設(shè)置為不同的通信信道,將一個子網(wǎng)內(nèi)節(jié)點的信道設(shè)置為9,另一個子網(wǎng)內(nèi)節(jié)點的信道設(shè)置為14,以防止采集節(jié)點之間的相互干擾。
4.2 網(wǎng)關(guān)獲取地址的驗證
網(wǎng)關(guān)上電后,向主站發(fā)送地址查詢主站的行政區(qū)劃碼A1和管理的網(wǎng)關(guān)數(shù)量配置自身地址,通過串口調(diào)試助手打印網(wǎng)關(guān)地址信息。打印結(jié)果為00000001,前兩個字節(jié)為行政區(qū)劃碼A1,與主站保持一致;由于在網(wǎng)關(guān)接入主站時主站僅有網(wǎng)關(guān)這一個節(jié)點,因此終端地址A2為0001,其打印信息如圖5所示。
4.3 異常分析模塊的驗證
將用電數(shù)據(jù)進行分段,并歸一化至溫度為25 ℃的情況下,通過KNN分布算法和數(shù)據(jù)統(tǒng)計算法實現(xiàn)對參數(shù)Eps與MinPts的自行計算,提高了網(wǎng)關(guān)的運行效率。
根據(jù)不同日期類型和用戶的用電習(xí)慣將一天的用電數(shù)據(jù)進行分段劃分,分別對工作日和周末的不同時間段的用電數(shù)據(jù)進行聚類,并將節(jié)假日通過節(jié)假日因子歸并為周末進行聚類,采用DBSCAN算法能夠準確判斷新讀入的用電信息是否為噪聲點。通過決策樹C4.5算法對歷史數(shù)據(jù)分時段和日期類型進行訓(xùn)練,能夠準確判定噪聲點的異常用電行為。
以工作日、周末和節(jié)假日對用電日期進行歸類,并將節(jié)假日歸并為周末,使得在各自的用電類別中人們的用電習(xí)慣具有較高的相似性,采用決策樹C4.5算法可以得到更為準確的結(jié)果。將周末和工作日的用電數(shù)據(jù)根據(jù)人們的用電習(xí)慣的不同分為不同的區(qū)間單元,使得在各個時段內(nèi)用電數(shù)據(jù)波動幅度較小,提高了DBSCAN算法的準確性。
5 結(jié)論
本網(wǎng)關(guān)結(jié)合用電信息采集網(wǎng)絡(luò)特征,基于相關(guān)電網(wǎng)規(guī)約構(gòu)造數(shù)據(jù)查詢幀,配置網(wǎng)關(guān)自身地址,實現(xiàn)網(wǎng)關(guān)對集中器的接入管理。通過對外擴存儲拓展程序、SQLite3數(shù)據(jù)庫程序、BOA服務(wù)器程序的設(shè)計和移植以及異常檢測單元塊的設(shè)計,完成網(wǎng)關(guān)在數(shù)據(jù)存儲和異常檢測功能。本文所采用的查詢主站地址池方法可以高效地配置網(wǎng)關(guān)自身地址;網(wǎng)關(guān)采用SQLite3數(shù)據(jù)庫實現(xiàn)對能耗數(shù)據(jù)的有效存儲,通過采用DBSCAN算法和決策樹C4.5算法實現(xiàn)對采集數(shù)據(jù)的異常用電行為的判斷,解決了主站對能耗數(shù)據(jù)分析滯后的問題。
參考文獻
[1] 孫宏斌,郭慶來,潘昭光.能源互聯(lián)網(wǎng):理念、架構(gòu)與前沿展望[J].電力系統(tǒng)自動化,2015(19):1-8.
[2] 佟為明,張希棟,李中偉,等.基于橢圓曲線密碼的數(shù)據(jù)集中器通信報文混合密碼算法[J].電力系統(tǒng)自動化,2014,38(4):86-91.
[3] 田力,向敏.基于密度聚類技術(shù)的電力系統(tǒng)用電量異常分析算法[J].電力系統(tǒng)自動化,2017(5):64-70.
[4] 向敏,王時賀,趙星宇.一種基于電力載波通信的路燈控制系統(tǒng)集中器的設(shè)計[J].重慶郵電大學(xué)學(xué)報(自然科學(xué)版),2013,25(2):161-165.
[5] GELAZANSKAS L,GAMAGE K A A.Demand side management in smart grid:a review and proposals for future direction[J].Sustainable Cities & Society,2014,11(11):22-30.
[6] LEE S C,NEVATIA R.Hierarchical abnormal event detection by real time and semi-real time multi-tasking video surveillance system[J].Machine Vision & Applications,2014,25(1):133-143.
[7] 韓利釗,錢雪忠,羅靖,等.基于區(qū)域劃分的DBSCAN多密度聚類算法[J/OL].[2017-06-04].http://www.arocmag.com/article/02-2018-06-047.html.
[8] MALHOTRA A,BAJAJ K.A hybrid pattern based text mining approach for malware detection using DBScan[J].CSI Transactions on ICT,2016,4(2-4):141-149.
[9] 苗煜飛,張霄宏.決策樹C4.5算法的優(yōu)化與應(yīng)用[J].計算機工程與應(yīng)用,2015,51(13):255-258.
[10] MANTAS C J,ABELLAN J,CASTELLANO J G. Analysis of Credal-C4.5 for classification in noisy domains[J].Expert Systems with Applications,2016,61:314-326.
[11] Q/GDW 376.1-2013.電力用戶用電信息采集系統(tǒng)通信協(xié)議[S].北京:國家電網(wǎng)公司,2013.
[12] 劉煒,毛建鑫,梁磊,等.一種基于ARM的集中器的硬件實現(xiàn)[J].電子技術(shù)應(yīng)用,2014,40(1):86-89.
[13] 周治平,王杰鋒,朱書偉,等.一種改進的自適應(yīng)快速AF-DBSCAN聚類算法[J].智能系統(tǒng)學(xué)報,2016,11(1):93-98.
作者信息:
王 平,于祥春
(重慶郵電大學(xué) 自動化學(xué)院,重慶400065)