《電子技術(shù)應用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應用 > 公共元數(shù)據(jù)配置管理平臺設(shè)計
公共元數(shù)據(jù)配置管理平臺設(shè)計
2020年電子技術(shù)應用第1期
任李娟,盧 軍,郭 維
成都信息工程大學 軟件工程學院,四川 成都610225
摘要: 隨著互聯(lián)網(wǎng)快速發(fā)展,各平臺利用元數(shù)據(jù)來組織和管理平臺數(shù)據(jù)資源,平臺內(nèi)平臺具有封閉性使得元數(shù)據(jù)資源分散、反復存儲,增大元數(shù)據(jù)共享難度,降低元數(shù)據(jù)利用率。為解決這一問題,提出公共元數(shù)據(jù)配置管理平臺,將公共元數(shù)據(jù)統(tǒng)一配置管理,利用Web Service技術(shù)提供配置與共享元數(shù)據(jù)服務,采用Redis內(nèi)存數(shù)據(jù)庫提高數(shù)據(jù)共享效率。目前,已在氣象大數(shù)據(jù)平臺中運用了基于氣象公共元數(shù)據(jù)的配置管理平臺,其不僅提高了平臺公共元數(shù)據(jù)的利用率、節(jié)約存儲,也提高了服務的響應速度。同時,將配置管理平臺的主要功能抽象,使平臺設(shè)計可適用于其他類似的基于元數(shù)據(jù)的數(shù)據(jù)共享平臺。
中圖分類號: TN915.09;TP319
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.190761
中文引用格式: 任李娟,盧軍,郭維. 公共元數(shù)據(jù)配置管理平臺設(shè)計[J].電子技術(shù)應用,2020,46(1):100-103.
英文引用格式: Ren Lijuan,Lu Jun,Guo Wei. Public metadata configuration management platform design[J]. Application of Electronic Technique,2020,46(1):100-103.
Public metadata configuration management platform design
Ren Lijuan,Lu Jun,Guo Wei
Software Engineering Institute,Chengdu University of Information Technology,Chengdu 610225,China
Abstract: With the rapid development of the Internet, each platform often uses metadata to organize and manage system data resources. The system within the platform is closed so that metadata resources are dispersed and stored repeatedly, which increases the difficulty of metadata sharing and reduces the utilization of metadata. In order to solve this problem, this paper proposes a public metadata configuration management platform, which provides unified configuration and management of public metadata, provides configuration and shared metadata services by using Web Service technology, and improves data sharing efficiency by using Redis memory database. At present, a configuration management platform based on meteorological public metadata has been used in the meteorological big data platform, which not only improves the utilization of the platform common metadata, saves storage, but also improves the response speed of the service. This article abstracts the main functions of the configuration management platform, making the system design applicable to other similar metadata-based data sharing platforms.
Key words : metadata;Web Service;configuration;sharing;Redis

0 引言

    隨著信息技術(shù)不斷發(fā)展,各領(lǐng)域數(shù)據(jù)資源不斷擴大,數(shù)據(jù)量呈幾何增長,數(shù)據(jù)呈現(xiàn)多樣性。不同平臺之間元數(shù)據(jù)資源分散、資源反復存儲,使得數(shù)據(jù)共享難的問題日益嚴重。元數(shù)據(jù)是實現(xiàn)科學數(shù)據(jù)共享的4種方式之一[1],因此集中配置管理公共元數(shù)據(jù)為解決這一問題提供了有效途徑。元數(shù)據(jù)(Metadata)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”或“關(guān)于信息的信息”[2]。如年齡、身高、性格等就是描述人的元數(shù)據(jù),可根據(jù)其推測人的樣子。元數(shù)據(jù)可以記錄數(shù)據(jù)的來龍去脈,可以把整個業(yè)務的工作流、信息流有效地管理起來,提高平臺的可擴展性[3]。而公共元數(shù)據(jù)是指在領(lǐng)域中可通用的并具有重要參照意義的元數(shù)據(jù),其需要滿足一定的行業(yè)標準,標準中除要詳細列出實體與元素集以外,還要說明元數(shù)據(jù)標準適用范圍、參考標準、術(shù)語與定義、元數(shù)據(jù)分級、元數(shù)據(jù)性質(zhì)、標識、格式和類型以及元數(shù)據(jù)擴展原則等[4]。元數(shù)據(jù)在科學數(shù)據(jù)領(lǐng)域中的研究與應用取得了較大進展,科學元數(shù)據(jù)標準的逐漸豐富和發(fā)展為元數(shù)據(jù)在科學數(shù)據(jù)不同領(lǐng)域的應用提供較為充分的工具和標準[5]。

    目前,元數(shù)據(jù)存儲分散使各平臺中元數(shù)據(jù)難以共享,元數(shù)據(jù)反復存儲浪費了存儲空間。為解決此問題,本文提出將公共元數(shù)據(jù)集中管理,通過Web Service技術(shù)提供對外的公共元數(shù)據(jù)配置服務與共享服務,并利用Redis內(nèi)存數(shù)據(jù)庫來提高服務速度。實際上,平臺不僅保證了元數(shù)據(jù)的統(tǒng)一管理和高速共享,也簡化各平臺數(shù)據(jù)交換的流程,使平臺間只需開發(fā)簡單的接口調(diào)用和數(shù)據(jù)解析功能即可完成數(shù)據(jù)交互。

1 元數(shù)據(jù)配置管理研究現(xiàn)狀

    SUFI S等[6]認為元數(shù)據(jù)描述框架相比元數(shù)據(jù)內(nèi)容標準,其承擔的指導性和框架性作用更強,不局限于特定領(lǐng)域的術(shù)語平臺限制,強調(diào)了數(shù)據(jù)描述框架在領(lǐng)域中的重要性,對元數(shù)據(jù)配置管理在領(lǐng)域中的指導性與框架性給予肯定。同時,Jian Qin等[7]指出,龐大的、復雜的標準和廣泛多樣的命名實踐是構(gòu)建元數(shù)據(jù)基礎(chǔ)設(shè)施的主要障礙,而可移植是元數(shù)據(jù)方案“基礎(chǔ)結(jié)構(gòu)”的必要條件或先決條件,因此在元數(shù)據(jù)配置管理上統(tǒng)一元數(shù)據(jù)標準是構(gòu)建平臺的基礎(chǔ)。

    元數(shù)據(jù)的應用不僅能提高平臺的靈活性與適應性,強化其穩(wěn)定性,也使平臺更易維護[8],同時利用元數(shù)據(jù)的整合,可提高平臺靈活性與適應性,提高數(shù)據(jù)質(zhì)量控制力度[9]。在元數(shù)據(jù)的配置管理上,王國復等[10]對元數(shù)據(jù)在科學數(shù)據(jù)共享平臺的作用、元數(shù)據(jù)的分類、元數(shù)據(jù)的管理、元數(shù)據(jù)平臺和元數(shù)據(jù)的應用模型進行了闡述。隨后,張英俊[11]提出利用元數(shù)據(jù)的標準化來統(tǒng)一管理分布式的數(shù)據(jù)資源,通過網(wǎng)絡(luò)實現(xiàn)數(shù)據(jù)共享與服務,使得用戶能夠快速準確地獲取所需科學數(shù)據(jù)。進一步地,周寶平[12]提出元數(shù)據(jù)匯交、數(shù)據(jù)發(fā)布、元數(shù)據(jù)檢索以及多種方式的數(shù)據(jù)共享等功能。

    總的來說,國內(nèi)外學者都已十分重視元數(shù)據(jù)的應用。目前,在統(tǒng)一元數(shù)據(jù)標準與跨平臺數(shù)據(jù)共享上的研究比較充分,但在元數(shù)據(jù)跨平臺配置管理與高效服務上的研究仍然不足。本文利用Web Service與Redis技術(shù),設(shè)計了一種可跨平臺配置管理公共元數(shù)據(jù)并提供高效共享服務的平臺,有助于組織和管理海量數(shù)據(jù)資源,提高數(shù)據(jù)利用率。

2 元數(shù)據(jù)配置管理特點

    元數(shù)據(jù)配置管理平臺應具有以下特點:

    (1)數(shù)據(jù)適用性。平臺數(shù)據(jù)應采用行業(yè)通用標準,數(shù)據(jù)標準化可提高數(shù)據(jù)適用性,易與不同平臺進行數(shù)據(jù)交換。如氣象大數(shù)據(jù)平臺中,配置管理平臺采用國家氣象信息中心制定的我國氣象數(shù)據(jù)集元數(shù)據(jù)格式標準(草案)將元數(shù)據(jù)標準化,以適用于氣象大數(shù)據(jù)平臺建設(shè)和數(shù)據(jù)集的編目、歸檔、發(fā)布和交換等。

    (2)跨平臺性。平臺應具有跨平臺的特性,為數(shù)據(jù)匯交、數(shù)據(jù)共享提供可行性。元數(shù)據(jù)配置管理平臺作為平臺的基礎(chǔ)部分,元數(shù)據(jù)匯交與元數(shù)據(jù)的共享都依賴平臺跨平臺性。

    (3)高效性。平臺應具有高速響應并發(fā)訪問的能力,為不同平臺提供高效的在線元數(shù)據(jù)支持。元數(shù)據(jù)配置管理的目的是集中元數(shù)據(jù)資源,實現(xiàn)公共元數(shù)據(jù)的共享,提高元數(shù)據(jù)利用率。平臺的高效性提高了元數(shù)據(jù)共享效率,是平臺穩(wěn)定運行的保障。

3 元數(shù)據(jù)配置管理平臺設(shè)計

    元數(shù)據(jù)是數(shù)據(jù)的基本信息,有助于數(shù)據(jù)的分類標注[13]。元數(shù)據(jù)的配置管理不僅能集中資源與節(jié)省存儲,還能幫助組織和管理平臺數(shù)據(jù)資源。公共元數(shù)據(jù)的配置管理是一個動態(tài)過程,既需要滿足公共元數(shù)據(jù)跨平臺的匯交,同時需要對配置信息進行審核,審核成功后的元數(shù)據(jù)需要通過接口為其他平臺提供數(shù)據(jù)共享服務。

3.1 平臺架構(gòu)

    平臺是針對元數(shù)據(jù)集中化配置管理與共享而設(shè)計的,主要功能包括個人信息管理、配置管理、審核管理、接口管理、用戶管理。平臺架構(gòu)圖如圖1所示。

jsj3-t1.gif

    管理員根據(jù)平臺中人員的安排,在用戶管理功能中對用戶信息進行維護,可以增加、刪除、修改和查詢用戶。當平臺人員離職后,管理員需要將該用戶狀態(tài)修改為離職,限制其登錄平臺以保證平臺數(shù)據(jù)的安全性。當平臺人員權(quán)限有所變化時,管理員需要及時修改信息,以便用戶正常使用平臺。

    審核員主要負責對配置后的公共元數(shù)據(jù)進行審核,也可以查看整個審核流程。審核員可分為多個級別,應具有一定的專業(yè)知識,以保證公共元數(shù)據(jù)的正確性。

    操作員可增加、刪除、修改、查看公共元數(shù)據(jù),對元數(shù)據(jù)配置后,操作員可查看審核進度。操作員可以在接口管理中查看、配置、監(jiān)測公共元數(shù)據(jù)采集接口與共享接口,也可以修改接口的發(fā)布狀態(tài)。其中,接口狀態(tài)為打開時其他平臺可以調(diào)用,狀態(tài)為關(guān)閉時其他平臺不可調(diào)用。

3.2 主要功能

3.2.1 配置管理

    配置管理分為配置元數(shù)據(jù)與查看審核功能。配置元數(shù)據(jù)功能中,配置方式分為新增、變更、廢止。由平臺人員根據(jù)業(yè)務需求在數(shù)據(jù)配置頁面對元數(shù)據(jù)進行配置,配置成功可查詢流程信息。新增時,平臺生成流程單并將新增的元數(shù)據(jù)存入臨時表中,直到流程審批成功才會存入正式表。變更與廢止時,平臺會生成流程單并拷貝正式表中被配置的元數(shù)據(jù)到臨時表中,直到流程審批成功后,才會修改正式表中的數(shù)據(jù)。查看審核功能用于操作員查看審核狀態(tài),以便實時跟蹤元數(shù)據(jù)審核情況。

    配置成功后的待審批元數(shù)據(jù)將存入到臨時表中,等待流程審批人員審核通過后再將其存入正式表中。平臺使用臨時表存儲,既能實現(xiàn)對元數(shù)據(jù)配置進行監(jiān)控,也能減少數(shù)據(jù)誤配置造成的數(shù)據(jù)污染。配置管理流程圖如圖2所示。

jsj3-t2.gif

3.2.2 審核管理

    審核管理分為審核申請與查看審核流程功能。審核申請功能是具有相應權(quán)限的審核員對配置元數(shù)據(jù)后生成的申請進行審核。其中,元數(shù)據(jù)配置成功后便會對此配置信息生成對應的流程信息,每一級的審核員審核完成都會產(chǎn)生一條流程信息。查看審批流程功能用于跟蹤配置信息的審核過程,便于追溯配置過程。

    審核管理是元數(shù)據(jù)質(zhì)量的保證,需要十分熟悉業(yè)務的人員才能進行審核,不正確的數(shù)據(jù)易造成參照錯誤,產(chǎn)生不可逆的影響。審核管理流程圖如圖3所示。

jsj3-t3.gif

3.2.3 接口管理

    接口管理分為配置接口、狀態(tài)管理與監(jiān)測接口功能。配置接口功能主要用于管理接口的增加、刪除、修改、查詢操作。狀態(tài)管理功能是用于管理接口的狀態(tài),狀態(tài)分為打開狀態(tài)與關(guān)閉狀態(tài)。監(jiān)測接口用于操作員監(jiān)測接口調(diào)用情況,打開的狀態(tài)下可以進行實時監(jiān)控,關(guān)閉的情況下只能查看歷史監(jiān)控信息,一般有調(diào)用頻度、數(shù)據(jù)狀況等。

    平臺中接口主要分為數(shù)據(jù)采集接口與數(shù)據(jù)共享接口兩類。具體地,兩類接口由平臺操作人員配置并發(fā)布,使用Web Service技術(shù)實現(xiàn),使其他業(yè)務平臺通過網(wǎng)絡(luò)訪問,根據(jù)業(yè)務不同傳遞不同的參數(shù)。平臺發(fā)布接口后根據(jù)WSDL文檔,加入描述信息生成接口文檔,便于其他業(yè)務平臺使用。其中,WSDL文檔是用來描述Web 服務及Web服務通信過程的XML語言[14]。

    數(shù)據(jù)采集接口提供公共元數(shù)據(jù)配置服務,主要是供其他平臺調(diào)用以實現(xiàn)公共元數(shù)據(jù)的跨平臺配置。具體地,其他平臺根據(jù)接口文檔將需要配置的公共元數(shù)據(jù)信息拼接為XML格式并發(fā)送到Web服務器,Web服務器接收后根據(jù)請求參數(shù)后通過SOAP(Simple Object Access Protocol)發(fā)送數(shù)據(jù)包,并在分布式的服務器上調(diào)用相應Web Service。配置管理平臺服務器接收數(shù)據(jù)到請求數(shù)據(jù)后進行信息校驗,校驗成功后將配置的公共元數(shù)據(jù)存入臨時表中,并生成審核申請與流程信息,然后將結(jié)果集生成XML文檔返回[15]

    數(shù)據(jù)共享接口提供公共元數(shù)據(jù)共享服務,主要是供不同平臺調(diào)用以實現(xiàn)公共元數(shù)據(jù)的跨平臺高效共享。具體地,其調(diào)用過程與數(shù)據(jù)采集接口相似,不同之處在于請求參數(shù)與數(shù)據(jù)處理過程上。在數(shù)據(jù)共享接口中,請求參數(shù)是用于定位共享的公共元數(shù)據(jù),一般是數(shù)據(jù)分類等。同時,為提供高效共享服務,數(shù)據(jù)共享接口中的數(shù)據(jù)處理是先從Redis內(nèi)存數(shù)據(jù)庫中查詢數(shù)據(jù),不滿足時再讀取數(shù)據(jù)庫將數(shù)據(jù)取出并生成XML格式的查詢結(jié)果集返回,并將數(shù)據(jù)存入內(nèi)存數(shù)據(jù)庫中。接口管理流程圖如圖4所示。

jsj3-t4.gif

3.3 平臺主要支撐技術(shù)

    配置管理平臺主要采用Web Service技術(shù)實現(xiàn)跨平臺接口發(fā)布,利用Redis內(nèi)存數(shù)據(jù)庫來提高數(shù)據(jù)響應速度。

    Web Service是一種通過Web部署提供對業(yè)務功能訪問的技術(shù),具有跨平臺、簡單和高度可集成能力等特點[16]。通常被定義為一組模塊化的API,可通過網(wǎng)絡(luò)進行調(diào)用,執(zhí)行遠程平臺的請求服務。同時,Web Service為多層分布式應用平臺的構(gòu)建創(chuàng)造了條件,使開發(fā)人員可以將來自不同地方的Web Service組裝起來, 并在應用程序中使用[17]。依據(jù)Web Service規(guī)范實施的平臺之間即使開發(fā)語言、平臺或內(nèi)部協(xié)議不一致也可相互交換數(shù)據(jù)。Web Service的發(fā)現(xiàn)、訪問、集成和調(diào)用需要通過UDDI、WSDL、SOAP來完成[18]。具體地,Web服務客戶端應用程序通過名字、分類、標識符等從UDDI 注冊中心查詢所需的服務,一旦找到,客戶便從UDDI注冊中心獲取WSDL 文檔的位置信息,并按照WSDL 中發(fā)現(xiàn)的XML 模式生成一個SOAP 消息,發(fā)送給服務端。

    Redis是高性能的key-value數(shù)據(jù)庫,支持存儲類型有字符串、鏈表、集合、有序集合和哈希類型,為保證效率將數(shù)據(jù)緩存在內(nèi)存中[19]。Redis數(shù)據(jù)庫具有持久化、多數(shù)據(jù)結(jié)構(gòu)的支持、支持主從復制、Virtual Memory功能等特征[20]。Redis數(shù)據(jù)庫的數(shù)據(jù)模型是建立在外層,類似于其他結(jié)構(gòu)化存儲平臺。不同于其他結(jié)構(gòu)化存儲平臺的是,其支持在多種數(shù)據(jù)類型上做多種原子性操作,這也是Redis數(shù)據(jù)庫高效性的原因之一[21]。Redis基于內(nèi)存的特性使其具有高速讀的優(yōu)點,查詢響應時間為納秒級。

    平臺使用Web Service技術(shù),提供數(shù)據(jù)采集接口、數(shù)據(jù)共享接口,使網(wǎng)絡(luò)連接的不同平臺可通過接口進行數(shù)據(jù)交互,實現(xiàn)了公共元數(shù)據(jù)的統(tǒng)一配置管理。同時,利用Redis內(nèi)存數(shù)據(jù)庫的回收策略將超過設(shè)置的過期時間的數(shù)據(jù)淘汰,利用其基于內(nèi)存的特性實現(xiàn)高速共享元數(shù)據(jù),利用其持久化的特性也能提高數(shù)據(jù)的安全性。

4 結(jié)論

    公共元數(shù)據(jù)配置管理平臺使用Web Service技術(shù)解決跨平臺配置數(shù)據(jù)與共享數(shù)據(jù),利用Redis內(nèi)存數(shù)據(jù)庫提高公共元數(shù)據(jù)共享效率。平臺將公共元數(shù)據(jù)統(tǒng)一配置管理,提供統(tǒng)一參照,提供高效數(shù)據(jù)共享服務,解決元數(shù)據(jù)重復存儲難以共享的問題,節(jié)省硬件資源,節(jié)約人力。同時,平臺的設(shè)計有助于了解組織和管理平臺數(shù)據(jù)資源、提供數(shù)據(jù)發(fā)現(xiàn)、檢索服務。實際上,平臺的設(shè)計滿足跨平臺、可擴展性的要求,對其他類似的基于元數(shù)據(jù)的數(shù)據(jù)共享平臺具有一定參考意義。

參考文獻

[1] 王培正,張志強,吳一民.科學數(shù)據(jù)共享方式研究[J].科技管理研究,2010(17):201-204.

[2] 吳增祥,臧海佳,王國復.氣象科學數(shù)據(jù)與氣象數(shù)據(jù)集元數(shù)據(jù)[C]科學數(shù)據(jù)管理與共享.北京:中國科學技術(shù)出版社,2002.

[3] 謝益武,何宇峰,曹志英.基于模式的CWM元數(shù)據(jù)交換方法的研究[J].電子技術(shù)應用,2007,33(11):114-116,120.

[4] 王國復,徐楓,吳增祥.氣象元數(shù)據(jù)標準與信息發(fā)布技術(shù)研究[J].應用氣象學報,2005,16(1):115-121.

[5] 黃如花,邱春艷.國內(nèi)外科學數(shù)據(jù)元數(shù)據(jù)研究進展[J].圖書與情報,2014(6):102-108.

[6] SUFI S,MATTHEWS B.A metadata model for the discovery and exploitation of scientific studies[M].Knowledge and Data Management in GRIDs.Springer US,2007.

[7] Jian Qin,Li Kal.How portable are the metadata standards for scientific data? A proposal for a metadata infrastructure[EB/OL].[2014-08-09].http://jianqin.metadataetc.org/wp-content/uploads/2013/08/DC2013-metadatad-portability.pdf.

[8] 王小奇,王英.分析電信資源管理的主要問題及元數(shù)據(jù)的應用策略[J].數(shù)據(jù)庫技術(shù),2017(20):187-188.

[9] 余葉蘭.基于銀行數(shù)據(jù)倉庫的元數(shù)據(jù)管理體系研究[J].湖北第二師范學院學報,2017,34(2):38-40.

[10] 王國復,涂勇,王卷樂,等.科學數(shù)據(jù)共享中的元數(shù)據(jù)技術(shù)研究[J].中國科技資源導刊,2008,40(1):30-36.

[11] 張英俊.基于元數(shù)據(jù)技術(shù)的科學數(shù)據(jù)共享平臺設(shè)計與實現(xiàn)[J].太原科技,2008,177(10):9-11.

[12] 周寶平.論科學數(shù)據(jù)共享平臺的設(shè)計與實現(xiàn)[J].山西科技,2010,25(2):48-49.

[13] 趙卓寧,李湘,舒紅平,等.氣象大數(shù)據(jù)資源匯交可視化分析研究[J].氣象科技進展,2018,8(1):203-207,263.

[14] 于洪波,劉鴻飛,方麗英,等.基于Web服務的物聯(lián)接入系統(tǒng)設(shè)計[J].電子技術(shù)應用,2015,41(7):33-36,43.

[15] 焦圣明,嚴明良,郭靜,等.基于WebService的分布式交通氣象信息共享技術(shù)研究[J].計算機工程與科學,2012,24(3):196-200.

[16] 胡澤,廖聞劍,彭艷兵.WebService技術(shù)研究及應用[J].硅谷,2009(5):48.

[17] 龔小勇,羅軍.Web Service技術(shù)在開發(fā)多層分布式數(shù)據(jù)庫系統(tǒng)中的應用研究[J].計算機應用研究,2004,21(8):55-57.

[18] 甄少鵬.淺談WebService與主流實現(xiàn)技術(shù)框架[J].湖南農(nóng)機,2012,39(1):62,64.

[19] 曾超宇,李金香.Redis在高速緩存系統(tǒng)中的應用[J].微型機與應用,2013,32(12):11-13.

[20] 楊曉軍,臧飛,李春雷.云計算在軍事領(lǐng)域中的應用分析[J].電子技術(shù)應用,2018,44(6):129-132,137.

[21] 馬豫星.Redis數(shù)據(jù)庫特性分析[J].物聯(lián)網(wǎng)技術(shù),2015(3):105-106.




作者信息:

任李娟,盧  軍,郭  維

(成都信息工程大學 軟件工程學院,四川 成都610225)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。