摘 要: 本文提出了一種網(wǎng)格環(huán)境中基于代理的語(yǔ)義資源發(fā)現(xiàn)模型,結(jié)合代理技術(shù)和P2P網(wǎng)絡(luò)技術(shù),實(shí)現(xiàn)語(yǔ)義上的資源發(fā)現(xiàn)。
關(guān)鍵詞: 網(wǎng)格 資源發(fā)現(xiàn) 本體 代理 P2P
網(wǎng)格技術(shù)用于實(shí)現(xiàn)廣泛的分布資源共享和協(xié)同工作。網(wǎng)格中潛在著巨大數(shù)量的資源和用戶以及具有資源的異構(gòu)性、動(dòng)態(tài)性和自治性等特點(diǎn),這使得資源發(fā)現(xiàn)頗具挑戰(zhàn)性。如何高效準(zhǔn)確地發(fā)現(xiàn)網(wǎng)格資源已成為網(wǎng)格研究中的一個(gè)重要問(wèn)題。目前已有的網(wǎng)格資源發(fā)現(xiàn)方式大都是基于句法、集中式的匹配。這種方式?jīng)]有對(duì)其語(yǔ)義進(jìn)行解析,不能根據(jù)資源的能力發(fā)現(xiàn)資源。而且網(wǎng)格系統(tǒng)中的資源規(guī)模巨大,如果采用集中式信息管理方式,在某一個(gè)或某幾個(gè)結(jié)點(diǎn)維護(hù)整個(gè)系統(tǒng)的信息是不現(xiàn)實(shí)的,資源的動(dòng)態(tài)更新、系統(tǒng)的擴(kuò)展等也成為問(wèn)題。
目前,基于本體的資源發(fā)現(xiàn)機(jī)制研究剛剛邁出第一步,如OMM[1]仍然是一種集中式的資源組織模式,適用于本地的資源匹配。本文提出了一種網(wǎng)格環(huán)境下基于代理的語(yǔ)義資源發(fā)現(xiàn)模型(ASRDM),它使用本體來(lái)實(shí)現(xiàn)請(qǐng)求者和資源的語(yǔ)義描述。為維護(hù)各組織內(nèi)的資源管理自治性,在組織內(nèi)部采取集中式資源發(fā)現(xiàn)模式;在系統(tǒng)各組織之間采取基于P2P的分布式資源發(fā)現(xiàn)模式。
1 典型的網(wǎng)格資源發(fā)現(xiàn)方式
Condor的MatchMaking不依賴全局資源命名,它是一種集中式的依靠資源屬性進(jìn)行匹配的資源共享系統(tǒng)。它將資源和用戶請(qǐng)求間的匹配過(guò)程和建立聯(lián)系過(guò)程分開(kāi)。請(qǐng)求者和提供者按照分類廣告(ClassAds)公開(kāi)其各自的特點(diǎn)和請(qǐng)求。匹配服務(wù)將滿足條件的請(qǐng)求和用戶進(jìn)行匹配,并通知雙方。匹配雙方既可直接建立聯(lián)系,也可以進(jìn)行進(jìn)一步的協(xié)商。這種資源發(fā)現(xiàn)方式缺乏靈活性,并且集中式的資源組織模式會(huì)成為系統(tǒng)擴(kuò)展的瓶頸。
Globus MDS是Globus Toolkit提供的信息服務(wù)組件,它提供網(wǎng)格資源的信息和狀態(tài)。MDS包含網(wǎng)格資源信息服務(wù)GRIS(Grid Resource Information Service)和網(wǎng)格索引信息服務(wù)GIIS(Grid Index Information Service)。MDS實(shí)現(xiàn)了基于LDAP的樹(shù)狀元數(shù)據(jù)目錄服務(wù),實(shí)體描述為屬性/值對(duì)。每個(gè)組織內(nèi)通常都有一個(gè)集中的索引服務(wù),組織規(guī)模比較大時(shí),需要形成樹(shù)狀層次結(jié)構(gòu)。這種發(fā)現(xiàn)機(jī)制的缺點(diǎn)為:(1)被動(dòng)更新。如果查詢近期沒(méi)有執(zhí)行,則GIIS服務(wù)器必須更新它的LDAP registry。因?yàn)镚IIS不能主動(dòng)得知機(jī)器以及服務(wù)的當(dāng)前狀態(tài)。(2)非分布式管理。GIIS服務(wù)器要聯(lián)系所有注冊(cè)的主機(jī)檢查當(dāng)前狀態(tài)。顯然,這種操作是不可伸縮的。
OMM的主要思想是利用語(yǔ)義網(wǎng)技術(shù)RDF(資源描述框架,本體,規(guī)則)進(jìn)行網(wǎng)格資源匹配。本體是用于描述或表達(dá)某一領(lǐng)域知識(shí)的一組概念或術(shù)語(yǔ),可用于組織知識(shí)庫(kù)中較高層次的知識(shí)抽象,也可用于描述特定領(lǐng)域的知識(shí);本體通過(guò)知識(shí)表示元語(yǔ)捕獲某個(gè)領(lǐng)域的語(yǔ)義,使得機(jī)器能夠(部分)理解該領(lǐng)域中概念間的關(guān)系,通過(guò)公理或規(guī)則還可以捕獲其他知識(shí),如領(lǐng)域背景知識(shí)等。OMM包括三部分:(1)本體。記錄域模型及詞匯,以表達(dá)資源公布和任務(wù)請(qǐng)求。(2)域背景知識(shí)。記載本體中沒(méi)有捕獲的域的其他知識(shí)。(3)匹配規(guī)則。定義資源和請(qǐng)求相匹配的規(guī)則。它仍然是一種集中式的資源組織模式,適用于本地的資源匹配。
2 基于代理的語(yǔ)義資源發(fā)現(xiàn)模型
2.1 組織內(nèi)集中式資源發(fā)現(xiàn)模式
2.1.1 基于代理的集中式資源發(fā)現(xiàn)模式
網(wǎng)格中各組織內(nèi)部有著不同的資源管理策略。例如在哪個(gè)時(shí)間段,內(nèi)部資源對(duì)于組織外的用戶是可共享的,哪些用戶可以訪問(wèn)內(nèi)部資源等。每個(gè)組織需要擁有對(duì)其資源管理的自治性。在ASRDM中,組織內(nèi)部的資源采取集中式的管理模式,便于組織對(duì)其資源實(shí)施統(tǒng)一的管理策略,也利于提高本地資源發(fā)現(xiàn)的效率。資源發(fā)現(xiàn)模式如圖1所示。
2.1.2 集中式資源發(fā)現(xiàn)模式中的各代理
代理是一種復(fù)雜的計(jì)算機(jī)程序,采取自治的行為,協(xié)同應(yīng)用與環(huán)境交互,完成給定的目標(biāo)。代理技術(shù)是適應(yīng)網(wǎng)絡(luò)平臺(tái)的一種新型軟件技術(shù),為網(wǎng)格計(jì)算思想的實(shí)現(xiàn)提供了一種有力的手段。
組織內(nèi)用戶、資源以及匹配服務(wù)等都有專門(mén)的代理,代理間協(xié)作處理用戶的請(qǐng)求,使得系統(tǒng)功能可以方便地進(jìn)行動(dòng)態(tài)重組。例如,添加一個(gè)新的資源僅僅只需要添加一個(gè)新的代理并公布其服務(wù)能力。各代理功能如下:
(1)用戶代理:用戶進(jìn)入系統(tǒng)的智能接口。它使用系統(tǒng)的通用域模型(本體)來(lái)幫助用戶規(guī)范查詢和輸出結(jié)果。
(2)本體代理:提供有關(guān)本體的信息并回答有關(guān)本體的查詢。
(3)資源代理:提供本體和本地?cái)?shù)據(jù)方案與語(yǔ)言間的映射,執(zhí)行對(duì)于資源的具體請(qǐng)求,對(duì)外公布資源的服務(wù)能力。
(4)匹配代理:接受并存儲(chǔ)組織內(nèi)所有代理的公告信息,對(duì)資源請(qǐng)求做出回答。匹配代理使用一個(gè)公開(kāi)的地址監(jiān)聽(tīng)查詢或者公布信息。每個(gè)代理都要基于組織內(nèi)的域模型(本體)向匹配代理公布其地址和服務(wù)能力。
2.1.3 組織內(nèi)資源發(fā)現(xiàn)過(guò)程
在ASRDM組織內(nèi)用戶通過(guò)瀏覽器和它的用戶代理進(jìn)行交互。用戶提交一個(gè)查詢,用戶代理向匹配代理查詢本體代理的地址,然后向本體代理查詢適合于該請(qǐng)求的本體?;诜祷氐恼?qǐng)求域模型,用戶代理向匹配代理查詢當(dāng)前合適的資源代理。如果匹配代理在組織內(nèi)發(fā)現(xiàn)了資源,則直接將結(jié)果返回給用戶代理;如果組織內(nèi)沒(méi)有合適的資源,則向其他組織的匹配代理發(fā)出請(qǐng)求,在更廣泛的范圍進(jìn)行資源查找。
由于網(wǎng)絡(luò)資源具有動(dòng)態(tài)性,所以不同時(shí)間返回的結(jié)果不同。用戶代理根據(jù)返回結(jié)果,直接和資源代理建立連接。每個(gè)資源代理將基于本體的請(qǐng)求轉(zhuǎn)換為本地模式,并將結(jié)果返給用戶代理,用戶代理通過(guò)瀏覽器將結(jié)果返給用戶。
考慮到單點(diǎn)失效的問(wèn)題,可以有一個(gè)冗余匹配結(jié)點(diǎn)作為備份。
2.2 組織間基于移動(dòng)代理的分布式資源發(fā)現(xiàn)模式
與組織內(nèi)部資源相比,網(wǎng)格這個(gè)大環(huán)境中的資源數(shù)量巨大,資源的變化更加不可預(yù)測(cè)。集中式的資源發(fā)現(xiàn)模式已經(jīng)不適用,需要一種扁平的、分布式的、自組織的體系結(jié)構(gòu)。P2P系統(tǒng)和網(wǎng)格具有很多共同特性,如動(dòng)態(tài)性、廣域環(huán)境以及異構(gòu)性等。P2P系統(tǒng)具有自適應(yīng)、自組織性和容錯(cuò)等特性,使用P2P協(xié)議能夠提高網(wǎng)格系統(tǒng)的效率以及可擴(kuò)展性。在ASRDM中,各組織間的資源管理采用P2P的模式,如圖2所示。
2.2.1 結(jié)點(diǎn)本體
每個(gè)組織作為這個(gè)P2P網(wǎng)絡(luò)上的一個(gè)結(jié)點(diǎn),都有自己的對(duì)外索引結(jié)點(diǎn)(即匹配結(jié)點(diǎn))。結(jié)點(diǎn)本體(peer ontology,即上述的Local ontology)包括兩部分:(1)結(jié)點(diǎn)能力描述:結(jié)點(diǎn)自身及其所提供資源的元信息、鄰居結(jié)點(diǎn)信息等,如結(jié)點(diǎn)ID、資源ID 及類型、鄰居結(jié)點(diǎn)的IP地址等;(2)結(jié)點(diǎn)的域模型。
2.2.2 語(yǔ)義覆蓋網(wǎng)SON的建立
傳統(tǒng)的P2P資源發(fā)現(xiàn)定位方法,或者需要大的目錄服務(wù)器的支持,系統(tǒng)的健壯性不好;或者向所有信息結(jié)點(diǎn)廣播,消耗大量帶寬,不利于系統(tǒng)的擴(kuò)展。在ASRDM中,基于上述P2P網(wǎng)絡(luò)各結(jié)點(diǎn)間的語(yǔ)義聯(lián)系,構(gòu)建一個(gè)語(yǔ)義覆蓋網(wǎng)絡(luò)SON。根據(jù)各結(jié)點(diǎn)的能力描述,SON將提供類似主題的結(jié)點(diǎn)進(jìn)行聚集,以縮小請(qǐng)求轉(zhuǎn)發(fā)空間。
ASRDM借鑒內(nèi)容可尋址網(wǎng)絡(luò)CAN的思想構(gòu)建SON,模擬一個(gè)虛擬的d維笛卡爾空間,動(dòng)態(tài)地將這個(gè)d維笛卡爾空間分成多個(gè)區(qū)(zone),給每個(gè)結(jié)點(diǎn)分配一個(gè)區(qū)。結(jié)點(diǎn)知識(shí)的索引由一個(gè)哈希函數(shù)生成,表示為二元組<key,value>,由每個(gè)結(jié)點(diǎn)本體的語(yǔ)義向量作為key,它被映射到坐標(biāo)空間的某個(gè)點(diǎn)P,這樣擁有P點(diǎn)所在的那個(gè)區(qū)的結(jié)點(diǎn)將存儲(chǔ)對(duì)應(yīng)的二元組<key,value>。資源定位時(shí),就可以使用同一哈希函數(shù)將key映射到點(diǎn)P,然后從點(diǎn)P獲取相應(yīng)值。
2.2.3 基于移動(dòng)代理的資源請(qǐng)求的轉(zhuǎn)發(fā)
每個(gè)索引結(jié)點(diǎn)有自己的代理管理模塊,負(fù)責(zé)移動(dòng)代理的生成和派發(fā)。基于移動(dòng)代理的資源管理策略不但可以優(yōu)化資源管理,而且可以科學(xué)地解決資源沖突、擁塞、網(wǎng)絡(luò)時(shí)延、降低網(wǎng)絡(luò)負(fù)載等。
當(dāng)組織內(nèi)部的某資源請(qǐng)求需要在更廣泛的領(lǐng)域進(jìn)行轉(zhuǎn)發(fā)時(shí),由該結(jié)點(diǎn)向鄰居結(jié)點(diǎn)派發(fā)一組移動(dòng)代理, SON決定了其鄰居結(jié)點(diǎn)。SON中的鄰居定義為具有相似主題的兩個(gè)結(jié)點(diǎn),結(jié)點(diǎn)之間的距離越近,語(yǔ)義相似度越高。每個(gè)資源請(qǐng)求也被映射到語(yǔ)義空間的某個(gè)點(diǎn),將請(qǐng)求的轉(zhuǎn)發(fā)鎖定在該點(diǎn)周圍一個(gè)小范圍內(nèi)。每個(gè)代理將資源請(qǐng)求和其他結(jié)點(diǎn)本體進(jìn)行比較,實(shí)現(xiàn)資源的語(yǔ)義匹配。完成匹配任務(wù)后,移動(dòng)代理將結(jié)果返回給發(fā)出請(qǐng)求的結(jié)點(diǎn)。
3 ASRDM的特點(diǎn)
ASRDM與傳統(tǒng)資源發(fā)現(xiàn)方式相比具有以下特點(diǎn):(1)改變了以往基于關(guān)鍵詞搜索的方式,實(shí)現(xiàn)了基于語(yǔ)義的資源發(fā)現(xiàn);(2)采取集中式和分布式P2P相結(jié)合的資源發(fā)現(xiàn)模式,有利于系統(tǒng)的擴(kuò)展,提高了資源發(fā)現(xiàn)的效率;(3)結(jié)合代理技術(shù),實(shí)現(xiàn)了資源發(fā)現(xiàn)的自治性和智能性;(4)在組織間基于SON進(jìn)行資源請(qǐng)求的轉(zhuǎn)發(fā),縮小了搜索空間,同時(shí)各結(jié)點(diǎn)間可以動(dòng)態(tài)地進(jìn)行語(yǔ)義聚合。
4 結(jié)束語(yǔ)
網(wǎng)格資源的復(fù)雜性使得以往傳統(tǒng)式的資源發(fā)現(xiàn)機(jī)制已不能滿足要求。本文針對(duì)以往資源發(fā)現(xiàn)機(jī)制的問(wèn)題,利用代理技術(shù)以及語(yǔ)義本體論的理論和技術(shù)實(shí)現(xiàn)網(wǎng)格資源的語(yǔ)義發(fā)現(xiàn),提出了網(wǎng)格環(huán)境中一種基于代理的語(yǔ)義資源發(fā)現(xiàn)模型ASRDM。ASRDM目前尚屬于探索性研究階段,還存在許多不夠成熟和需要進(jìn)一步解決、完善的問(wèn)題,如建立完善的包含多種物理資源和抽象服務(wù)的本體庫(kù),擴(kuò)展匹配能力以支持更復(fù)雜的語(yǔ)義匹配等。
參考文獻(xiàn)
1 Tangmunarunkit H,Decker S,Kesselman C.Ontologybased ResourceMatching in the Grid-The Grid meets the Semantic Web.In:Proc.of the 2nd International Seman- tic Web Conference.Sanibel Island,F(xiàn)lorida,USA,2003
2 Alliance G.GT Information Services:Monitoring & Discovery System(MDS).http://www.globus.org/mds,2005
3 William S,Austin T.Ontologies.IEEE Intelligent Systems,1999;(1)
4 Foster I,Kesselman C.brain-meets-brawn-why Grid and Agents Need Each Other.AAMAS,2004;(7)
5 Ratnasamy S,F(xiàn)rancis P,Handley M et al.A scalable content addressable network.In:Proc of ACM SIGCOMM 2001,San Diego,California,USA,2001
6 韓光法,王汝傳,徐小龍.網(wǎng)格計(jì)算環(huán)境下基于移動(dòng)代理資源管理模型的研究.光電技術(shù)應(yīng)用,2003;(5)