??? 摘??要: 分析了基于規(guī)則推理" title="規(guī)則推理">規(guī)則推理和案例推理" title="案例推理">案例推理的人工智能推理技術(shù)存在的一些問題及推理過程,提出了技術(shù)優(yōu)勢互補的集成推理方案,設(shè)計了集成推理的系統(tǒng)結(jié)構(gòu)和工作流程,并引入到疫情預警" title="疫情預警">疫情預警信息系統(tǒng)中,對疫情案例的表示、案例庫組織結(jié)構(gòu)、案例檢索、案例適配與系統(tǒng)學習等部分關(guān)鍵技術(shù)進行了探討,最后在湛江市城市公共衛(wèi)生" title="公共衛(wèi)生">公共衛(wèi)生疫情預警系統(tǒng)" title="預警系統(tǒng)">預警系統(tǒng)中得以驗證。
????關(guān)鍵詞: 疫情預警? 規(guī)則推理? 案例推理? 公共衛(wèi)生
?
??? 現(xiàn)實世界中存在的大量不確定因素(如自然災害、恐怖事件、交通事故、疫情爆發(fā)等)引起的突發(fā)事件對人們正常的生活構(gòu)成了嚴重的威脅,如2003年的SARS疫情危機和2004的高致病性禽流感H5N1疫情給我國的經(jīng)濟建設(shè)、社會穩(wěn)定造成了極大的損害。所以,預警系統(tǒng)的建設(shè)得到各國政府組織的高度重視,如日本常設(shè)了部一級的危機管理中心;印度專門設(shè)有危機管理小組。我國針對地震、臺風、公共衛(wèi)生等已建立了應(yīng)急系統(tǒng)。這些系統(tǒng)大多數(shù)是基于規(guī)則推理RBR(Rule-Based Reasoning)的系統(tǒng)。這種模式存在知識獲取的“瓶頸”問題,系統(tǒng)建立和維護困難,不具有自動的學習能力,而且不能利用另一重要的知識資源——以往的成功經(jīng)驗或典型案例數(shù)據(jù)。而基于案例推理CBR(Case-Based Reasoning)是一種類比推理方法,它可以方便地利用過去的成功經(jīng)驗或案例數(shù)據(jù)來求解與之相似的新的問題。對于很少或不能形成通用規(guī)則的問題領(lǐng)域,采用CBR最為有效。然而,CBR雖然克服了RBR知識獲取的“瓶頸”問題,但CBR不適用于當前存在的領(lǐng)域知識,并且決策過程有時顯得過于牽強(intuitively)[1-2]。
本文將基于規(guī)則與基于案例集成推理技術(shù)、專家系統(tǒng)和數(shù)據(jù)挖掘等技術(shù)結(jié)合起來,構(gòu)造一套RBR與CBR集成的決策推理方案,并應(yīng)用于公共衛(wèi)生疫情預警系統(tǒng)中。利用兩種推理各自的推理優(yōu)勢,形成優(yōu)勢互補系統(tǒng),消除了RBR和CBR結(jié)果之間的沖突,提高了系統(tǒng)求解問題的效率,增強了系統(tǒng)對不良結(jié)構(gòu)問題的適應(yīng)性,實現(xiàn)了經(jīng)驗豐富領(lǐng)域的推理。針對疫情爆發(fā),建立一套科學高效的公共衛(wèi)生疫情預警系統(tǒng),增強突發(fā)事件中實施疫情控制和醫(yī)療救治工作的快速反應(yīng)能力,減輕突發(fā)公共衛(wèi)生事件對居民健康、生命安全造成的威脅和財產(chǎn)損失,具有重要的經(jīng)濟價值和社會意義。
1 基于案例與規(guī)則集成推理的技術(shù)概述
1.1 基于規(guī)則推理技術(shù)
??? ?RBR適合應(yīng)用于對領(lǐng)域有充分認識,能以完備和健全的形式表示領(lǐng)域理論的場合,它是一種鏈式推理,其簡單的推理可能觸發(fā)多條規(guī)則[3]。許多成功的專家系統(tǒng)都采用產(chǎn)生式系統(tǒng)的典型結(jié)構(gòu),用產(chǎn)生式規(guī)則表達知識。通常,產(chǎn)生式系統(tǒng)由下面幾個基本部分組成:
????(1)事實庫(也稱綜合數(shù)據(jù)庫):存儲有關(guān)問題的狀態(tài)、性質(zhì)等事實的敘述性知識。
??? (2)規(guī)則集(或稱“規(guī)則庫”):存儲有關(guān)問題的狀態(tài)轉(zhuǎn)移、性質(zhì)變化等規(guī)則的過程性知識,可描述成:IF條件THEN結(jié)論。條件可以是任意子句的邏輯組合,結(jié)論可以是多個子結(jié)論或操作的組合。
??? (3)控制器:根據(jù)有關(guān)問題的控制性知識,選擇控制策略,將規(guī)則與事實進行匹配,控制利用知識推理求解問題的過程。
???? 產(chǎn)生式規(guī)則的優(yōu)點是知識表示自然、通用靈活,易于模塊化和結(jié)構(gòu)化,但這種模式存在知識獲取的“瓶頸”問題。
1.2 基于案例推理技術(shù)
??? ?CBR是一種類比推理方法,它可以方便地利用過去的成功經(jīng)驗或案例數(shù)據(jù)來求解與之相似的新問題?;诎咐评淼南到y(tǒng)設(shè)計技術(shù)可以被歸納為五個部分:案例檢索、案例匹配、案例修改、案例學習和案例維護?;窘忸}步驟如下:
??? (1)案例檢索:根據(jù)當前的問題通過一系列的搜索和相似度的計算,將案例庫中的案例過濾,取出與目標案例相似的若干案例組成相關(guān)案例集。
(2)案例匹配:從檢索出的案例集中提取最佳案例,即從已檢索出的相關(guān)案例集中抽取特征最為相似的案例或案例片斷,用相似度表征待解問題和相關(guān)案例集中案例的相似程度。根據(jù)相似度,判斷已經(jīng)存在的解決方案是否符合當前問題的求解需要,以便調(diào)整案例集的解決方案,從而獲得待解問題的建議方案。
(3)案例修改:根據(jù)案例庫中已存案例與待解問題之間的差異,若用戶對系統(tǒng)給出的方案不滿意,推理系統(tǒng)將就此方案進行修改或重新設(shè)計后再提交給用戶。如果用戶認為差異太大,則求解過程終止。
(4)案例學習:對當前問題的解進行評價分析,若認為求解結(jié)果有價值,則將新解保存到案例庫中,擴充案例庫的案例種類與數(shù)量,并進一步地從新問題的解中提取淺層規(guī)則知識或修改深層模型知識;否則,重新匹配和修正。
(5)案例維護:求解方案經(jīng)過實際應(yīng)用后,根據(jù)實際應(yīng)用效果和一定的策略,分析新案例的經(jīng)驗和知識是否有保留的價值,若有則按一定的存儲策略將其納入案例庫中,實現(xiàn)案例庫的不斷更新、完善。
案例推理技術(shù)借鑒以往的經(jīng)驗,更符合領(lǐng)域?qū)<液驮O(shè)計人員的設(shè)計思維過程。它也存在前面所講的優(yōu)缺點。
1.3 以CBR和RBR集成推理的系統(tǒng)結(jié)構(gòu)?
? 由于CBR與RBR各有缺陷,它們無論是作為兩種推理方式還是作為知識表示方式都不能相互替代。這是因為案例集合無法充分表達編碼歸納后的規(guī)則,案例中包含的分布廣泛的粗知識也極難或不可能提取歸納為規(guī)則。如果將CBR和RBR集成在一起,就能夠克服兩種推理體系各自的缺點,增強系統(tǒng)的靈活性和綜合推理能力[4]。CBR和RBR集成的最通用方式有二種:第一種是以RBR為主導,CBR后置補充的(RC)混合模型;第二種是以CBR為前導,RBR后置補充的(CR)混合模型。其他的組合方式都是以這兩種方式為基礎(chǔ)組成的。
對于已經(jīng)在相關(guān)領(lǐng)域建立了較完善的RBR系統(tǒng),由于對該領(lǐng)域知識的理解仍是很不充足的弱理論領(lǐng)域,使用第一種方式有較好的效果。而對于領(lǐng)域知識模型、案例和RBR系統(tǒng)己充分建立但還要求系統(tǒng)有很高實時性和效率的情況,則宜采用第二種方式[2]。在實際應(yīng)用中,應(yīng)該根據(jù)領(lǐng)域的不同特點和實際情況,靈活地選擇不同的集成方式。根據(jù)公共衛(wèi)生疫情的特征,本文選擇以CBR為前導,RBR后置補充的(CR)推理模式,實現(xiàn)在豐富而精確的知識庫基礎(chǔ)上的高效推理。其集成推理的系統(tǒng)結(jié)構(gòu)如圖1所示。圖中,規(guī)則庫和案例庫共同構(gòu)成了專家系統(tǒng)的知識庫。
????????????????????????????
(1)人機交互界面:完成人機交互、問題表示、結(jié)果顯示和和系統(tǒng)的總體控制,即分析用戶提交的問題并加以分解綜合后轉(zhuǎn)化成系統(tǒng)可以理解的知識表示形式送至學習機。
(2)案例庫:是CBR的核心。提供支持問題求解的一組案例,它是問題求解經(jīng)驗的集合。案例源的豐富程度是問題求解的關(guān)鍵。因此,必須利用豐富領(lǐng)域知識建立較為完善的案例庫。在組織案例庫時本文采用兩層結(jié)構(gòu),第一層為典型案例庫,第二層為被分類的子案例庫,且第二層中的每一個子案例庫對應(yīng)著典型案例庫中的一個典型案例。這樣可有效提高案例檢索效率。
(3)規(guī)則庫:用于存儲領(lǐng)域?qū)<艺J可的各應(yīng)用領(lǐng)域的主要規(guī)則知識和技術(shù)指標,是以規(guī)則的形式表示的、正確的、能夠完全表達領(lǐng)域的知識,相當于傳統(tǒng)產(chǎn)生式系統(tǒng)中的知識庫,是系統(tǒng)綜合數(shù)據(jù)庫的基礎(chǔ)。對問題定義和案例適配提供背景知識,同時也提供查詢和咨詢服務(wù)。
(4)學習機:主要負責創(chuàng)建和維護案例庫,包括啟用解釋模塊調(diào)用RBR來完成由規(guī)則到案例的實際的推理過程。
(5)推理機:根據(jù)問題,利用知識庫中的知識,用集成的CBR和RBR推理規(guī)則進行推理,求得問題的解。推理機是本系統(tǒng)的核心模塊之一。
1.4 以CBR和RBR集成推理的系統(tǒng)模塊協(xié)同工作過程
采用集成推理的系統(tǒng)各模塊協(xié)同工作過程如下:在推理時,通常把人們以往的經(jīng)驗儲存成一個個案例形成的案例庫。當新問題出現(xiàn)時,通過搜索算法可直接在案例庫中搜索,找到合適案例作為新問題處理的參考,即實案例重用;如果找到的案例不滿意或沒有結(jié)果,此時就啟動學習機內(nèi)部的解釋模塊到規(guī)則庫中檢索相關(guān)知識,得到基于規(guī)則推理的結(jié)果以備進行間接匹配。若經(jīng)過修改后的案例間接匹配成功,得到問題的解,經(jīng)過案例評價機構(gòu)評價后,認為問題的解有價值,便可保存在案例庫中以備下次使用,即實現(xiàn)了案例自學習。若在推理過程中有不止一個舊案例與新的輸入案例相匹配,此時還要啟用評價機構(gòu),以便于對匹配情況做出裁決,從中選出最佳匹配。案例集成推理的控制流程圖如圖2所示。
?????????????????????????
2 基于CBR和RBR集成推理的公共衛(wèi)生疫情預警系統(tǒng)主要實現(xiàn)技術(shù)
2.1案例的表示
案例的表示過程即是將權(quán)威領(lǐng)域?qū)<业闹R轉(zhuǎn)化為計算機系統(tǒng)可以識別的信息過程。案例是知識表示的一種模式,它將專家的知識與經(jīng)驗用描述案例的數(shù)據(jù)結(jié)構(gòu)和眾多的案例表示出來,實際上它就是專家求解問題的一個具體例子[2]。適當?shù)闹R表示方法有助于提高在案例庫中檢索到與當前欲求解問題相似案例的精度和速度。本文采用面向?qū)ο蟮幕诳蚣芊ǖ闹R表示方法來表示疫情預警案例,因為框架法的知識表示方法適合于將某特定時期的疫情預警指標、行為知識和專家經(jīng)驗等有機地結(jié)合起來。而且采用框架法的知識結(jié)構(gòu)描述方法,將所搜集到的疫情案例存放到一系列相互關(guān)聯(lián)的數(shù)據(jù)庫中,利用關(guān)系數(shù)據(jù)庫的索引技術(shù),可以方便地建立案例索引。借鑒相關(guān)參考文獻所建立的疫情預警案例結(jié)構(gòu)框架如表1所示。
???????????????????????????????
2.2 案例庫的組織
對案例庫進行組織索引是為了方便案例庫的檢索,因此如何組織案例庫取決于系統(tǒng)所采取的檢索策略。如果在設(shè)計時不采取有效的檢索策略,將直接影響案例檢索效率和系統(tǒng)響應(yīng)時間。本系統(tǒng)對案例庫組織時采用兩層結(jié)構(gòu),第一層為典型案例庫,第二層為被分類的子案例庫,且第二層中的每一個子案例庫對應(yīng)著典型案例庫中的一個典型案例。具體地說,首先對案例進行分類,每一類組成一個較小的子案例庫并在其中選出一個典型案例,作為對該類案例的索引,所有類的典型案例構(gòu)成一個典型案例庫。檢索時,先在典型案例庫中找到最相近的典型案例(此步驟相當于對新問題進行分類,看它屬于哪一類案例),然后在最相似的典型案例所對應(yīng)的那類案例中進行進一步的檢索,案例庫的兩層結(jié)構(gòu)可以更方便地檢索案例。
2.3 案例的檢索和匹配
案例檢索是指從案例庫中尋找與新問題相似的案例的過程,案例的匹配檢索是實現(xiàn)案例推理的關(guān)鍵步驟。查找以案例類別為第一檢索條件,以案例特征為第二檢索條件,在案例庫中查找出可能與新問題有關(guān)的舊案例,形成候選案例集合,使以后匹配過程僅在候選案例集中進行??商岣甙咐龣z索效率的常用檢索方法有:最近相鄰策略、歸納推理策略、知識引導策略和模板檢索策略[2],這些方法可以單獨或聯(lián)合地運用。本文檢索采用的策略為目前常用的最近相鄰策略[5]對案例進行匹配。
2.4 案例適配
從檢索出的案例集中提取最佳案例,即從已檢索出的相關(guān)案例集中抽取特征最為相似的案例或案例片斷,用相似度表征待解問題和相關(guān)案例集中案例的相似程度。根據(jù)相似度,判斷已經(jīng)存在的解決方案是否符合當前問題的求解需要,以便調(diào)整案例集的解決方案,從而獲得待解問題的建議方案。然而,大多數(shù)情況因為系統(tǒng)知識不夠豐富,檢索到的案例并不能滿足問題的求解,這就需要學習機進行學習。本系統(tǒng)采用轉(zhuǎn)換型的適配策略(transformational adaptation)和參數(shù)調(diào)整(parameter adjustment)適配技術(shù)。其基本思想是:比較檢索到的案例與新問題所關(guān)心屬性的差異,從而將解決方案適當?shù)卣{(diào)整。
2.5 集成推理系統(tǒng)自學習
集成推理系統(tǒng)的優(yōu)點在于其自學習的能力,即系統(tǒng)在運行過程中能夠不斷地將新問題及解決方案作為新的案例加入到案例庫中豐富系統(tǒng)。但如果這種行為不加以控制,案例庫中的案例質(zhì)量就會下降;同時案例庫的規(guī)模就會膨脹,降低系統(tǒng)的推理效率[6]。故本系統(tǒng)采用相似度δ進行評價控制:δ=(δ1t,δ2t,δ3t,…,δnt)式中,n為舊案例數(shù),δit為新案例與舊案例的相似度。如果所有δit均小于某一設(shè)定閥門時,則認為有價值,送入案例庫;否則,被認為是無價值案例,將該案例丟棄。
3 基于CBR和RBR集成推理的公共衛(wèi)生疫情預警系統(tǒng)應(yīng)用
下面以湛江市城市公共衛(wèi)生預警系統(tǒng)為例闡述該系統(tǒng)的應(yīng)用,案例和規(guī)則放在SQL數(shù)據(jù)庫中?,F(xiàn)在取其中疫情預測分析模塊為例,工作過程描述如下:
把在湛江市石頭村2005年7~11月各月份的鼠疫調(diào)查數(shù)據(jù),如疫情地區(qū)、疫情名稱、疫情癥狀、起始時間、發(fā)病人數(shù)等,經(jīng)過特征抽取轉(zhuǎn)換成機器可以識別的案例輸入系統(tǒng),點擊預測按鈕,可在2005年份7~11月各個月份的發(fā)病數(shù)基礎(chǔ)上進行預測計算,便可得到鼠疫在2005年12月份的發(fā)病數(shù)預測值。疫情預測分析界面圖如圖3所示。
????????????????????
??? 此外,系統(tǒng)還可根據(jù)疫情的屬性與空間數(shù)據(jù)庫相關(guān)聯(lián),實現(xiàn)疫情預警信息分布地圖呈現(xiàn)給用戶,并及時通報疫情信息,做好應(yīng)對方案,可有效防止疫情的蔓延。
目前國內(nèi)已建立起為數(shù)不多的公共衛(wèi)生疫情預警系統(tǒng),多數(shù)是基于規(guī)則推理的系統(tǒng),系統(tǒng)建立和維護困難,并且不具有自學習能力。本文將基于案例推理與基于規(guī)則推理的兩種技術(shù)相結(jié)合,研究出智能高效的公共衛(wèi)生疫情預警系統(tǒng),這不僅使系統(tǒng)的建立和維護變得容易,且提高了系統(tǒng)的運行效率,呈現(xiàn)出更強的智能化特征。提高對公共衛(wèi)生疫情的預防能力、增強在疫情爆發(fā)中的組織搶險和快速反應(yīng)能力以及推進公共衛(wèi)生疫情預警系統(tǒng)的科學化和智能化具有重要意義。該系統(tǒng)已投入使用,有一定的應(yīng)用推廣價值。
參考文獻
[1]?YANG Hao, WEN Flu, ALAN Clin. Procase: A casedbased process planning system for machining of rotational
?parts[J]. Journal of Intelligent Manufacturing.1994,(5):441-430.
[2]?CSER L. Three kinds of case-based learning sheet rnanufacturin[J]. Computer in Industry,1991,(17):195-206.
[3]?蔡自興,徐光祐.人工智能及其應(yīng)用[M]. 北京:清華大學出版社,2003.
[4]?張建華,劉仲英.案例推理和規(guī)則推理結(jié)合的緊急預案信息系統(tǒng)[J]. 同濟大學學報,2002,30(7):890-894.
[5]?SCHAAF J W. Fish and shrink: A next step towards efficient case retrieval in large scaled case bases[A].
?Advances in Case-based Reasoning[C].Lausanne: Third?European Workshop, 1996:362-376.