《電子技術應用》
您所在的位置:首頁 > 通信與網(wǎng)絡 > 設計應用 > 治安信息五要素智能搜索引擎研究及應用
NI-LabVIEW 2025
治安信息五要素智能搜索引擎研究及應用
來源:微型機與應用2011年第14期
楊令省1,唐金文2
(1.曲靖師范學院 數(shù)學與信息科學學院,云南 曲靖655011; 2.曲靖師范學院 計算機科學與工程
摘要: 如何把分散的信息有效組織起來,實現(xiàn)跨部門、跨地區(qū)的信息共享,是金盾工程建設必須解決的一個關鍵問題。主要介紹如何圍繞“人、地、物、事件、組織”治安信息五要素的業(yè)務模型,利用Web Services、UDDI等技術創(chuàng)建智能搜索引擎,實現(xiàn)全省范圍內治安信息五要素關聯(lián)查詢及異構系統(tǒng)間的全網(wǎng)漫游。
Abstract:
Key words :

摘  要: 如何把分散的信息有效組織起來,實現(xiàn)跨部門、跨地區(qū)的信息共享,是金盾工程建設必須解決的一個關鍵問題。主要介紹如何圍繞“人、地、物、事件、組織”治安信息五要素的業(yè)務模型,利用Web Services、UDDI等技術創(chuàng)建智能搜索引擎,實現(xiàn)全省范圍內治安信息五要素關聯(lián)查詢異構系統(tǒng)間的全網(wǎng)漫游。
關鍵詞: 治安信息五要素;關聯(lián)查詢;異構系統(tǒng);數(shù)據(jù)漫游

    近年來,公安信息系統(tǒng)從簡單的信息處理向以數(shù)據(jù)為中心的數(shù)據(jù)共享和關聯(lián)的復雜應用轉變,治安信息五要素智能搜索引擎就是采用先進的計算機技術如Web Services、SOAP、UDDI、XML、WSDL、分布式技術等構建的應用系統(tǒng),旨在實現(xiàn)全省范圍內人、地、物、組織、事件的關聯(lián)查詢及異構系統(tǒng)間的全網(wǎng)漫游;實現(xiàn)分布在全省不同地方的不同系統(tǒng)間或系統(tǒng)本身的五要素關聯(lián)查詢,并能實現(xiàn)定義與發(fā)現(xiàn)異構數(shù)據(jù)源,能自定義搜索條件與搜索結果的展現(xiàn)方式,容易和其他系統(tǒng)對接。治安信息智能搜索引擎的成功實施推動全省公安信息化的發(fā)展。
1 治安信息五要素模型
1.1 五要素關系模型

    隨著全國公安信息化建設的深入,國內各級公安在實踐的基礎上,總結出治安信息的五要素模型為[1]:人、地、物、組織、事件。人指自然人;地指地理位置;物指生物或非生物;組織是一種社會實體,它是人、地、物等要素之間的一種穩(wěn)態(tài)關系;事件是導致人、地、物、組織等要素關系發(fā)生變化的特殊要素,即事件使各要素從一種相對穩(wěn)態(tài)關系轉變?yōu)榱硪环N相對穩(wěn)態(tài)關系。事件是體現(xiàn)動態(tài)和關聯(lián)的重要環(huán)節(jié),只有處理好事件的表述方式,才可以將五要素信息進行有機的組織,達到體現(xiàn)“動態(tài)全息”的目的。五要素關系模型見圖1。

    理想情況下,同一實體在全省公安系統(tǒng)(甚至在全國公安系統(tǒng))中應只有一個對應要素,所有要素可以唯一標識,要素之間的各種聯(lián)系是有機和完整的。但在實際條件約束下,由于種種原因導致要素的重復創(chuàng)建:公安不同的應用系統(tǒng)可能對同一實體分別在本系統(tǒng)內重復創(chuàng)建對應要素;以地市級為中心建立治安信息系統(tǒng)時,導致同一實體在不同城市系統(tǒng)內創(chuàng)建對應要素等。所以,為簡單起見,這里假定治安管理信息“五要素”業(yè)務模型為:地市內各治安業(yè)務之間做到要素唯一創(chuàng)建、唯一標識、末態(tài)屬性唯一、有機關聯(lián);地市之間,要素可以重復創(chuàng)建,通過唯一標識彼此識別,進一步獲取要素的各方面信息;提供與數(shù)據(jù)庫、文件服務器間的交互支持,提供數(shù)據(jù)存儲與業(yè)務對象的映射,通過“五要素”業(yè)務模型協(xié)助解決數(shù)據(jù)庫在性能與訪問平衡中的問題,實現(xiàn)數(shù)據(jù)庫組織策略調整對業(yè)務系統(tǒng)的無關性。
1.2 五要素數(shù)據(jù)分布
    目前全省范圍內治安信息系統(tǒng)分布在省廳、各地州、各縣區(qū)和各派出所。有些系統(tǒng)是使用省中心庫,如省級人口信息系統(tǒng);有些是使用地市集中庫,如重點人口系統(tǒng);有些是工作數(shù)據(jù)庫分布在派出所,再將數(shù)據(jù)庫集中到區(qū)縣庫和地州庫,如現(xiàn)有的實有人口管理系統(tǒng)。五要素數(shù)據(jù)分布網(wǎng)絡結構模型見圖2。
    從圖2可以看出,五要素數(shù)據(jù)可能分布在不同的地理位置和存儲于不同的系統(tǒng)中,公安機關各職能部門通常都有自己的應用系統(tǒng),而且建設模式基本上覆蓋了省、地市、區(qū)縣、派出所四級應用。智能搜索引擎就是要實現(xiàn)跨部門、跨區(qū)域和異構數(shù)據(jù)的漫游查詢,以Web Service的方式為治安工作人員提供統(tǒng)一的操作界面,屏蔽平臺的差異性。

 

 

2 治安信息五要素智能搜索引擎體系結構
    從上述模型來看,如此龐大的治安管理信息系統(tǒng),各自的實現(xiàn)方式是不同的,如何有效地控制調用這些不存在主從關系的子系統(tǒng)、事務和模塊,如何組織動態(tài)的鏈接、模塊之間如何通信等,是智能搜索引擎需解決的主要問題,因此提出如圖3所示的體系結構。

    整個搜索引擎分為3個層次:用戶層、應用層和數(shù)據(jù)層。其中,用戶層只和用戶交互,不進行任何業(yè)務處理,實際上就是只有客戶端。應用層包含系統(tǒng)中業(yè)務邏輯的實現(xiàn)和數(shù)據(jù)訪問控制。應用層由.net程序及XML Web Services 實現(xiàn),并使用SOAP協(xié)議與客戶端連接。應用層中的事務日志、用戶狀態(tài)管理、五要素數(shù)據(jù)源與數(shù)據(jù)表現(xiàn)定義、管理工具、主搜索引擎、五要素資源注冊中心等都在省中心應用服務器上運行,搜索數(shù)據(jù)庫分布在省中心數(shù)據(jù)庫服務器上運行。智能搜索引擎中,應用層的主要功能如下[2]。
    (1)單點登錄和用戶狀態(tài)管理:用戶只需一次登錄系統(tǒng),就能操作權限范圍內的功能菜單,并為每一個登錄的用戶保存狀態(tài)信息和記錄用戶的查詢操作信息。
    (2)五要素數(shù)據(jù)源配置與數(shù)據(jù)表現(xiàn)自定義管理:對新接入的系統(tǒng)進行數(shù)據(jù)源配置,系統(tǒng)不用修改程序代碼便可掛接新系統(tǒng),用戶可自定義查詢結果展現(xiàn)方式。
    (3)分析處理器:接收并分析用戶的查詢請求,訪問UDDI注冊中心,調用搜索引擎,并返回數(shù)據(jù)。
    (4)主搜索引擎:搜索任務分配的中心調度器。系統(tǒng)從客戶端接收到查詢請求后,主搜索引擎便對查詢請求進行分析,把任務分發(fā)到對應的子搜索引擎,從子搜索引擎接收數(shù)據(jù),并返回客戶端數(shù)據(jù)。主搜索引擎與各子搜索引擎定時互發(fā)路由消息,以便主搜索引擎掌握各子搜索引擎的路由情況。
    (5)子搜索引擎:實現(xiàn)用戶定義系統(tǒng)的接入,并把相關信息發(fā)送到中心;承擔主搜索引擎發(fā)送來的查詢任務,并返回主搜索引擎所需數(shù)據(jù);定時發(fā)送路由信息給主搜索引擎,以便主搜索引擎掌握各子搜索引擎的路由情況。
    (6)五要素同級分布搜索:對該子搜索引擎管轄范圍內的同一地區(qū)級的數(shù)據(jù)庫進行搜索。
    (7)系統(tǒng)間和子系統(tǒng)五要素關聯(lián)查詢:系統(tǒng)與系統(tǒng)間的關聯(lián)查詢,統(tǒng)一系統(tǒng)內五要素的關聯(lián)查詢,并返回數(shù)據(jù)。
    (8)數(shù)據(jù)源適配器:調用與目標數(shù)據(jù)庫對應的驅動程序,直接與數(shù)據(jù)庫打交道,向數(shù)據(jù)庫發(fā)送查詢命令,并取得數(shù)據(jù)的模塊。
    (9)五要素漫游搜索:有異步返回數(shù)據(jù)功能,當子搜索引擎接收到漫游查詢后,啟動五要素漫游搜索線程,在足夠多的時間內搜索目標數(shù)據(jù)庫,將搜索所得的數(shù)據(jù)放入漫游數(shù)據(jù)隊列,并返回給主搜索引擎。
    (10)五要素資源注冊中心:對主搜索引擎注冊,使得主搜索引擎通過注冊中心被系統(tǒng)程序發(fā)現(xiàn)和調用。
    采用Web Services[3,4]技術將功能組件封裝成一個整體的服務,以UDDI的方式注冊發(fā)布。通過五要素引擎把所有的程序組織起來,把物理位置分布不同、運行環(huán)境不同、功能相對獨立的系統(tǒng)信息統(tǒng)一起來,模塊之間的搭線連接由搜索引擎去實現(xiàn);系統(tǒng)對用戶而言以瀏覽器為表現(xiàn)方式,網(wǎng)絡就是一個面向服務的大計算機,這就突破了傳統(tǒng)的分布式計算模型在通信、應用范圍等方面的限制。這就是五要素智能搜索引擎“無所不在的計算”的核心思想。
3 智能搜索引擎關鍵技術介紹
3.1 分布式數(shù)據(jù)適配器

    治安信息智能搜索引擎涉及的業(yè)務數(shù)據(jù)量大,而且這些數(shù)據(jù)廣泛分布在不同的應用系統(tǒng)中,每個系統(tǒng)采用的數(shù)據(jù)庫可能不相同,要訪問這些數(shù)據(jù)庫,不可能為每種數(shù)據(jù)庫分別編寫數(shù)據(jù)訪問代碼,而且搜索引擎有時需要同時訪問多種數(shù)據(jù)庫。為此,專門設計實現(xiàn)了一個數(shù)據(jù)適配器,用于訪問分布式的異構數(shù)據(jù)庫[5],其實現(xiàn)框架如圖4所示。

    分布式數(shù)據(jù)適配器綜合利用線程技術、Web Service技術和搜索引擎提供的統(tǒng)一數(shù)據(jù)訪問器和路由表服務實現(xiàn)五要素信息的漫游查詢。
3.2 系統(tǒng)之間接口標準和五要素元數(shù)據(jù)標準
    系統(tǒng)把各種異構數(shù)據(jù)按五要素模型標準建模,由各種異構數(shù)據(jù)自身體現(xiàn)五要素的內外聯(lián)系,使得搜索引擎以統(tǒng)一的接口處理各種異構業(yè)務數(shù)據(jù)。首先,將各種系統(tǒng)按五要素分類,并以某些關鍵字的組合關聯(lián)起來;再次,將系統(tǒng)中的各種表信息按五要素分類,并以系統(tǒng)內部的某些關鍵字關聯(lián)起來;最后,用特定的標準描述各種系統(tǒng)需要表現(xiàn)的具體信息,并予以定義。
3.3 分布式數(shù)據(jù)庫處理技術
    搜索引擎提供通用數(shù)據(jù)訪問適配技術解決分布式異構數(shù)據(jù)庫訪問難題,本技術可以有效、安全地訪問部署在防火墻后的各種異構數(shù)據(jù)庫,并支持統(tǒng)一的標準數(shù)據(jù)庫語言,使系統(tǒng)在統(tǒng)一數(shù)據(jù)庫語言標準下,從而簡化了開發(fā)難度。采用同步和異步Web Service提取數(shù)據(jù)的技術來實現(xiàn)。
3.4 搜索算法
    搜索引擎算法主要有:關鍵字搜索、智能搜索路徑、智能搜索深度優(yōu)化算法等。關鍵字搜索就是利用系統(tǒng)間的關聯(lián)關鍵字對相關系統(tǒng)進行分布式抓取數(shù)據(jù),并在主搜索引擎重組數(shù)據(jù)并表現(xiàn);智能搜索路徑是基于系統(tǒng)之間的關聯(lián),如??谙到y(tǒng)與派出所綜合系統(tǒng)的關聯(lián),派出所綜合系統(tǒng)與重點人口的關聯(lián)等,也就是說可以形成很多關系鏈,而這些關系鏈也許是閉合的,也許是開放的,錯綜復雜,所以采用智能搜索路徑,從主搜索系統(tǒng)開始,排列不同的分支系統(tǒng),并按順序搜索數(shù)據(jù);智能搜索深度優(yōu)化根據(jù)系統(tǒng)的多少和執(zhí)行快慢,自由定義分支系統(tǒng)的搜索路徑深度,因為搜索引擎的搜索是按照一定的搜索路徑搜索的。
3.5 治安五要素信息UDDI注冊中心
    使用微軟的UDDI注冊中心作為治安五要素信息注冊中心來公布主搜索引擎服務接口。通過該接口,其他系統(tǒng)認證后可以發(fā)現(xiàn)并使用搜索引擎的服務并得到所需要的信息。
    鑒于全省治安信息數(shù)據(jù)的分布特性和各系統(tǒng)數(shù)據(jù)標準的不統(tǒng)一性,本文分析了五要素數(shù)據(jù)模型和元數(shù)據(jù)標準,提出基于Web Service技術的治安信息五要素智能搜索引擎體系結構,并利用線程、UDDI、SOAP等技術實現(xiàn)五要素信息的關聯(lián)查詢和漫游查詢,實現(xiàn)全省范圍內治安信息的“一站式”搜索。智能搜索引擎的設計和實現(xiàn)充分考慮系統(tǒng)的靈活性,把業(yè)務組件封裝成Web Service與可重用性構件,這樣系統(tǒng)具有易擴展性。目前系統(tǒng)已投入運行,并取得了一定的成效。但怎樣定義元數(shù)據(jù)標準才能使查詢更有效還有待進一步研究,對多線程的管理控制也有待改進。由于是基于Web Service技術實現(xiàn)的,如果把SOAP的思想用到設計中,系統(tǒng)是否更健壯等是下一步工作的內容。
參考文獻
[1] 云南省公安廳.五要素引擎可行性研究報告[R].昆明:2003.
[2] 昆明世科網(wǎng)絡技術有限公司.五要素系統(tǒng)需求分析[R].昆明:2004.
[3] PAPAZOGLOU M.Web Services:principles and technology[M].Prentice Hall, 1 editon(September 23,2007).
[4] HONZLER S.XML完全探索[M].陶陽,嵩敬波,王鋒,譯.北京:中國青年出版社,2000.
[5] COYLE F P.XML、WEB服務和數(shù)據(jù)革命[M].袁勤勇,吳青,譯.北京:清華大學出版社,2003.
 

此內容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。