《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應(yīng)用 > 基于密度聚類的能耗數(shù)據(jù)采集網(wǎng)關(guān)設(shè)計
基于密度聚類的能耗數(shù)據(jù)采集網(wǎng)關(guān)設(shè)計
2018年電子技術(shù)應(yīng)用第6期
王 平,于祥春
重慶郵電大學(xué) 自動化學(xué)院,重慶400065
摘要: 現(xiàn)有用電信息采集網(wǎng)絡(luò)集中器不具備對異常用電量進行檢測功能,導(dǎo)致主站對異常用電行為分析與響應(yīng)滯后。設(shè)計一款具備異常檢測功能的用電信息采集網(wǎng)關(guān),將網(wǎng)關(guān)安裝在集中器側(cè)對集中器能耗數(shù)據(jù)進行異常分析是應(yīng)對該問題的有效解決方案。根據(jù)用電信息采集網(wǎng)絡(luò)的特征和相關(guān)電網(wǎng)規(guī)約,網(wǎng)關(guān)通過構(gòu)造數(shù)據(jù)幀查詢主站地址池配置自身地址;基于密度聚類DBSCAN算法和決策樹C4.5算法對異常用電行為進行判斷。實驗結(jié)果表明,該網(wǎng)關(guān)能夠快速地對自身地址進行配置并對能耗數(shù)據(jù)進行異常分析。
中圖分類號: TP391
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.174797
中文引用格式: 王平,于祥春. 基于密度聚類的能耗數(shù)據(jù)采集網(wǎng)關(guān)設(shè)計[J].電子技術(shù)應(yīng)用,2018,44(6):35-38,43.
英文引用格式: Wang Ping, Yu Xiangchun. Design of power information collection gateway based on density clustering[J]. Application of Electronic Technique,2018,44(6):35-38,43.
Design of power information collection gateway based on density clustering
Wang Ping,Yu Xiangchun
School of Automation,Chongqing University of Posts and Telecommunications,Chongqing 400065,China
Abstract: Existing power collection network concentrator doesn′t have ability to detect abnormal power load, which leads the main station of abnormal electricity behavior analysis and response lag. An information collection gateway with anomaly detection function is designed. Installing the gateway on the concentrator side to conduct anomaly analysis of the energy consumption data of the concentrator is an effective solution to the problem. According to the characteristics of the information collection network and the relevant grid regulations, the gateway constructs its own address by constructing the data frame to query the address pool from the master station. The abnormal electric behavior is judged based on the density clustering DBSCAN algorithm and the decision tree C4.5 algorithm. Test results show that the gateway can quickly configure its own address and conduct anomaly analysis of energy consumption data.
Key words : acquisition gateway;anomaly detection;energy consumption data;address configuration;DBSCAN algorithm

0 引言

    隨著網(wǎng)絡(luò)技術(shù)的進步與發(fā)展,將無線抄表系統(tǒng)應(yīng)用于電力行業(yè)已然成為一種趨勢[1]。集中器作為用電信息采集系統(tǒng)中的重要節(jié)點,是實現(xiàn)主站與采集節(jié)點的通信橋梁[2]。集中器作為中介轉(zhuǎn)發(fā)設(shè)備,缺乏對用電數(shù)據(jù)進行分析的能力,導(dǎo)致主站對用電行為分析和響應(yīng)的滯后[3]。為了能夠在用戶側(cè)實現(xiàn)對能耗采集數(shù)據(jù)的分析與處理,采用該網(wǎng)關(guān)對集中器進行接入管理,獲取各集中器的能耗數(shù)據(jù)并進行分類存儲與分析,以解決主站對異常用電滯后的問題。

    目前,諸多學(xué)者針對用電信息采集系統(tǒng)及異常能耗數(shù)據(jù)分析提出了多種解決方案。文獻[3]通過構(gòu)造關(guān)聯(lián)規(guī)則,提出了一種基于密度聚類DBSCAN算法,用于識別離群點的用電模式。文獻[4]通過軟、硬件的協(xié)同配合,實現(xiàn)了集中器與控制終端和遠程管理中心快速、可靠的通信。文獻[5]中的用電信息采集系統(tǒng)側(cè)重于需求管理和響應(yīng),分析了用戶用電行為。文獻[6]基于實時性方面的考慮,提出了一種層次化的異常事件檢測系統(tǒng)。以上研究對用電信息采集系統(tǒng)的發(fā)展做出了積極貢獻。

    為解決主站對用電數(shù)據(jù)分析滯后的問題,本文研究了網(wǎng)關(guān)接入用電信息采集系統(tǒng)時獲取地址的過程;網(wǎng)關(guān)接入用電信息采集網(wǎng)絡(luò)后,讀入集中器能耗數(shù)據(jù)并進行分類存儲,采用密度聚類DBSCAN算法[7-8]得出離群點集合,并通過決策樹C4.5算法[9-10]得出離群點數(shù)據(jù)對應(yīng)的用電行為。

1 網(wǎng)關(guān)獲取節(jié)點地址

    網(wǎng)關(guān)與主站通信在應(yīng)用層應(yīng)滿足376.1電網(wǎng)規(guī)約[11],該規(guī)約對數(shù)據(jù)域地址進行規(guī)定,其地址由3部分組成:2 B行政區(qū)劃碼A1、2 B終端地址A2和1 B主站地址和組地址標志A3。

    網(wǎng)關(guān)接入用電信息采集網(wǎng)絡(luò),獲取節(jié)點地址的流程如下:網(wǎng)關(guān)通過構(gòu)建數(shù)據(jù)幀,向主站發(fā)送地址查詢命令,獲取地址A,其由2 B的行政區(qū)劃碼A1和2 B的終端地址A2構(gòu)成,地址格式如圖1所示。

qrs2-t1.gif

    網(wǎng)關(guān)與主站進行通信的過程中,主站根據(jù)網(wǎng)關(guān)節(jié)點地址構(gòu)建數(shù)據(jù)幀地址域,包括地址段A1、A2和A3。在單播情況下,A1、A2直接從目標集中器地址A中獲取,A3為主站地址和組地址標志。A3的D0位為終端組地址標志,D0為0時表示終端地址A2為單地址;D0為1時表示終端地址A2為組地址;A3的D1~D7組成0~127個主站地址MSA,其中數(shù)據(jù)幀地址域格式如圖2所示。

qrs2-t2.gif

2 網(wǎng)關(guān)關(guān)鍵軟硬件設(shè)計

    網(wǎng)關(guān)基于ARM11和Linux操作系統(tǒng)[12]進行設(shè)計,采用輕量級的SQLite3數(shù)據(jù)庫對相關(guān)能耗數(shù)據(jù)及用戶信息進行存儲。對用電信息采集數(shù)據(jù)進行分析需要基于一定規(guī)模的歷史數(shù)據(jù),考慮到存儲容量、網(wǎng)關(guān)規(guī)格和成本等因素,采用SD卡進行內(nèi)存擴展。選取BOA服務(wù)器作為網(wǎng)關(guān)的Web服務(wù)器程序,在網(wǎng)關(guān)上實現(xiàn)簡單的網(wǎng)頁查看功能。

2.1 外擴存儲模塊設(shè)計

    在網(wǎng)關(guān)上實現(xiàn)對用電信息采集數(shù)據(jù)的分析,需要基于一定的歷史數(shù)據(jù),網(wǎng)關(guān)需要存儲一定數(shù)量的數(shù)據(jù),而網(wǎng)關(guān)自身內(nèi)存有限,所以需要擴大用電信息采集網(wǎng)關(guān)的存儲能力,SD卡與S3C6410中的SDIO0接口的原理圖如圖3所示。

qrs2-t3.gif

2.2 SQLite3數(shù)據(jù)庫的設(shè)計

    SQLite3是一個嵌入式數(shù)據(jù)庫,其存儲后端采用Btree實現(xiàn)。SQLite在硬盤上一個數(shù)據(jù)庫一個文件,每個數(shù)據(jù)庫文件頭部保存有這個數(shù)據(jù)庫的元信息,包括版本、大小、Btree根節(jié)點位置等。

    數(shù)據(jù)庫可以高效、安全、大批量地對數(shù)據(jù)進行管理,將SQLite3數(shù)據(jù)庫移植到本網(wǎng)關(guān)中以實現(xiàn)對能耗數(shù)據(jù)的分析。根據(jù)用電異常量分析算法對數(shù)據(jù)類型的需求進行存儲,包括能耗類型、相對頻率、用戶類型、環(huán)境溫度等。

2.3 BOA服務(wù)器程序的設(shè)計

    本網(wǎng)關(guān)采用BOA服務(wù)器Web程序搭載后臺管理界面,前端界面采用AJAX技術(shù)與服務(wù)器中的CGI程序進行交互,后臺管理網(wǎng)頁設(shè)計架構(gòu)如圖4所示。

qrs2-t4.gif

    用電信息采集網(wǎng)關(guān)Web網(wǎng)頁中的主要功能包括以下3個方面:

    (1)查詢能耗信息:通過曲線對能耗信息進行顯示,可以查看用戶時、日、月的用電信息等情況。

    (2)查看網(wǎng)關(guān)狀態(tài):主要顯示當前數(shù)據(jù)庫的可用空間、與服務(wù)器間的通信狀況及接入的集中器信息。

    (3)查看能耗數(shù)據(jù)分析:可查看歷史能耗信息及異常情況下的數(shù)據(jù)情況。

3 用電信息異常分析算法

3.1 密度聚類算法

    網(wǎng)關(guān)將集中器上傳的能耗數(shù)據(jù)進行備份,以進行及時分析。對用電時段進行劃分,將工作日劃分為黑、白兩個時段,將周末劃分為早、中、晚3個時段,各時段的時間跨度可根據(jù)用戶類型及其生活作息習(xí)慣進行調(diào)整。在相同日期類型和時間段內(nèi),人們的用電行為比較類似,用電數(shù)據(jù)具有較小的波動性,采用密度聚類DBSCAN算法獲取異常用電數(shù)據(jù)。

qrs2-gs1-5.gif

3.2 異常量的獲取

    將不同日期類型和時間段的數(shù)據(jù)作為一個能耗數(shù)據(jù)單元,針對不同的數(shù)據(jù)單元采用不同的參數(shù)Eps和MinPts。參數(shù)的選擇效率直接決定了該網(wǎng)關(guān)的質(zhì)量,采用文獻[13]提出的根據(jù)KNN分布算法與數(shù)學(xué)統(tǒng)計分析使網(wǎng)關(guān)自行計算各個數(shù)據(jù)單元中參數(shù)Eps與MinPts的值。

qrs2-gs6.gif

3.3 異常量分析

    以一定周期對用電數(shù)據(jù)進行采集,同時采集溫度、日期類型和用電狀態(tài)(是否有異常,是何種異常),并將采集的數(shù)據(jù)存放在data.db文件中。采用決策樹C4.5算法對歷史數(shù)據(jù)及對應(yīng)的用電行為進行訓(xùn)練。調(diào)入通過DBSCAN算法獲取的各個數(shù)據(jù)單元的噪聲點集合qrs2-gs6-x1.gif根據(jù)決策樹C4.5算法得出各噪聲點所對應(yīng)的異常用電行為,并通過相應(yīng)的機制采取對應(yīng)的措施。然后根據(jù)實際調(diào)查驗證通過決策樹C4.5算法得出的結(jié)論是否正確,如果不正確將實際用電行為替代判斷用電行為。

4 測試與分析

4.1 實驗平臺的搭建

    搭建測試環(huán)境,所需設(shè)備與模塊如表1所示。

qrs2-b1.gif

    采用2個集中器分別與16個采集節(jié)點通過470 MHz構(gòu)建無線抄表網(wǎng)絡(luò),網(wǎng)關(guān)通過交換機與集中器和主站(筆記本電腦)相連,集中器通過交換機接入網(wǎng)關(guān)。一個集中器采集子網(wǎng)放置在距離網(wǎng)關(guān)較近的地方,另一個集中器采集子網(wǎng)放置在較遠的地方,并且將兩個集中器采集子網(wǎng)設(shè)置為不同的通信信道,將一個子網(wǎng)內(nèi)節(jié)點的信道設(shè)置為9,另一個子網(wǎng)內(nèi)節(jié)點的信道設(shè)置為14,以防止采集節(jié)點之間的相互干擾。

4.2 網(wǎng)關(guān)獲取地址的驗證

    網(wǎng)關(guān)上電后,向主站發(fā)送地址查詢主站的行政區(qū)劃碼A1和管理的網(wǎng)關(guān)數(shù)量配置自身地址,通過串口調(diào)試助手打印網(wǎng)關(guān)地址信息。打印結(jié)果為00000001,前兩個字節(jié)為行政區(qū)劃碼A1,與主站保持一致;由于在網(wǎng)關(guān)接入主站時主站僅有網(wǎng)關(guān)這一個節(jié)點,因此終端地址A2為0001,其打印信息如圖5所示。

qrs2-t5.gif

4.3 異常分析模塊的驗證

    將用電數(shù)據(jù)進行分段,并歸一化至溫度為25 ℃的情況下,通過KNN分布算法和數(shù)據(jù)統(tǒng)計算法實現(xiàn)對參數(shù)Eps與MinPts的自行計算,提高了網(wǎng)關(guān)的運行效率。

    根據(jù)不同日期類型和用戶的用電習(xí)慣將一天的用電數(shù)據(jù)進行分段劃分,分別對工作日和周末的不同時間段的用電數(shù)據(jù)進行聚類,并將節(jié)假日通過節(jié)假日因子歸并為周末進行聚類,采用DBSCAN算法能夠準確判斷新讀入的用電信息是否為噪聲點。通過決策樹C4.5算法對歷史數(shù)據(jù)分時段和日期類型進行訓(xùn)練,能夠準確判定噪聲點的異常用電行為。

    以工作日、周末和節(jié)假日對用電日期進行歸類,并將節(jié)假日歸并為周末,使得在各自的用電類別中人們的用電習(xí)慣具有較高的相似性,采用決策樹C4.5算法可以得到更為準確的結(jié)果。將周末和工作日的用電數(shù)據(jù)根據(jù)人們的用電習(xí)慣的不同分為不同的區(qū)間單元,使得在各個時段內(nèi)用電數(shù)據(jù)波動幅度較小,提高了DBSCAN算法的準確性。

5 結(jié)論

    本網(wǎng)關(guān)結(jié)合用電信息采集網(wǎng)絡(luò)特征,基于相關(guān)電網(wǎng)規(guī)約構(gòu)造數(shù)據(jù)查詢幀,配置網(wǎng)關(guān)自身地址,實現(xiàn)網(wǎng)關(guān)對集中器的接入管理。通過對外擴存儲拓展程序、SQLite3數(shù)據(jù)庫程序、BOA服務(wù)器程序的設(shè)計和移植以及異常檢測單元塊的設(shè)計,完成網(wǎng)關(guān)在數(shù)據(jù)存儲和異常檢測功能。本文所采用的查詢主站地址池方法可以高效地配置網(wǎng)關(guān)自身地址;網(wǎng)關(guān)采用SQLite3數(shù)據(jù)庫實現(xiàn)對能耗數(shù)據(jù)的有效存儲,通過采用DBSCAN算法和決策樹C4.5算法實現(xiàn)對采集數(shù)據(jù)的異常用電行為的判斷,解決了主站對能耗數(shù)據(jù)分析滯后的問題。

參考文獻

[1] 孫宏斌,郭慶來,潘昭光.能源互聯(lián)網(wǎng):理念、架構(gòu)與前沿展望[J].電力系統(tǒng)自動化,2015(19):1-8.

[2] 佟為明,張希棟,李中偉,等.基于橢圓曲線密碼的數(shù)據(jù)集中器通信報文混合密碼算法[J].電力系統(tǒng)自動化,2014,38(4):86-91.

[3] 田力,向敏.基于密度聚類技術(shù)的電力系統(tǒng)用電量異常分析算法[J].電力系統(tǒng)自動化,2017(5):64-70.

[4] 向敏,王時賀,趙星宇.一種基于電力載波通信的路燈控制系統(tǒng)集中器的設(shè)計[J].重慶郵電大學(xué)學(xué)報(自然科學(xué)版),2013,25(2):161-165.

[5] GELAZANSKAS L,GAMAGE K A A.Demand side management in smart grid:a review and proposals for future direction[J].Sustainable Cities & Society,2014,11(11):22-30.

[6] LEE S C,NEVATIA R.Hierarchical abnormal event detection by real time and semi-real time multi-tasking video surveillance system[J].Machine Vision & Applications,2014,25(1):133-143.

[7] 韓利釗,錢雪忠,羅靖,等.基于區(qū)域劃分的DBSCAN多密度聚類算法[J/OL].[2017-06-04].http://www.arocmag.com/article/02-2018-06-047.html.

[8] MALHOTRA A,BAJAJ K.A hybrid pattern based text mining approach for malware detection using DBScan[J].CSI Transactions on ICT,2016,4(2-4):141-149.

[9] 苗煜飛,張霄宏.決策樹C4.5算法的優(yōu)化與應(yīng)用[J].計算機工程與應(yīng)用,2015,51(13):255-258.

[10] MANTAS C J,ABELLAN J,CASTELLANO J G. Analysis of Credal-C4.5 for classification in noisy domains[J].Expert Systems with Applications,2016,61:314-326.

[11] Q/GDW 376.1-2013.電力用戶用電信息采集系統(tǒng)通信協(xié)議[S].北京:國家電網(wǎng)公司,2013.

[12] 劉煒,毛建鑫,梁磊,等.一種基于ARM的集中器的硬件實現(xiàn)[J].電子技術(shù)應(yīng)用,2014,40(1):86-89.

[13] 周治平,王杰鋒,朱書偉,等.一種改進的自適應(yīng)快速AF-DBSCAN聚類算法[J].智能系統(tǒng)學(xué)報,2016,11(1):93-98.



作者信息:

王  平,于祥春

(重慶郵電大學(xué) 自動化學(xué)院,重慶400065)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。