摘 要: 對計(jì)算機(jī)硬件故障的診斷維修進(jìn)行深入分析歸納,總結(jié)了計(jì)算機(jī)硬件故障維修特點(diǎn),給出硬件故障診斷系統(tǒng)的框架。運(yùn)用計(jì)算機(jī)硬件故障歷史數(shù)據(jù)建立案例庫,在案例檢索中采用最近相鄰法計(jì)算相似度,給出相似度的計(jì)算實(shí)例,建立了故障診斷系統(tǒng)。
關(guān)鍵詞: 案例推理; 硬件; 維修
基于案例推理CBR(Case-Based Reasoning)最早由美國耶魯大學(xué)Roger Schank教授在其1982年的著作《Dynamic Memory》中提出,是根據(jù)故障機(jī)的表現(xiàn)與特征而得到歷史記憶中的源案例,并由源案例指導(dǎo)解決故障機(jī)求解的一種策略[1]。主要包括表示與存儲(chǔ)、檢索與匹配、重用與修改、學(xué)習(xí)與評價(jià)4部分。
目前,中國的計(jì)算機(jī)用戶接近2億,而維修技師普遍缺乏。計(jì)算機(jī)各種硬件故障中,主板故障率較高。據(jù)2010年法國硬件網(wǎng)站Hardware.fr統(tǒng)計(jì),以華碩為例,硬件故障達(dá)到2.49%,該品牌部分型號(如P5ND)達(dá)到7.8%。可見計(jì)算機(jī)故障數(shù)量巨大。這些故障的解決全靠數(shù)量嚴(yán)重不足的計(jì)算機(jī)維修人員及其經(jīng)驗(yàn),使得維修出錯(cuò)率及成本居高不下。在計(jì)算機(jī)故障診斷中引入CBR方法,可有效提高診斷準(zhǔn)確率,減少維修人員數(shù)量,降低對維修人員經(jīng)驗(yàn)上的要求,進(jìn)而降低成本,提高維修質(zhì)量。
1 系統(tǒng)總體結(jié)構(gòu)
維修經(jīng)驗(yàn)在維修技師的知識(shí)構(gòu)成中占有十分重要的地位,而這又往往是一些維修技師所缺乏的。構(gòu)建診斷系統(tǒng)可幫助維修人員建立案例庫,為缺乏經(jīng)驗(yàn)的維修人員提供參考,提高故障定位的準(zhǔn)確率。
在參考整個(gè)計(jì)算機(jī)故障診斷過程的基礎(chǔ)上,把系統(tǒng)的工作過程定義為以下4步:
(1)維修技師將計(jì)算機(jī)故障值輸入系統(tǒng);
(2)系統(tǒng)根據(jù)得到的故障值,判斷它屬于何種故障類型,給出故障單元部位建議及進(jìn)一步檢測部位和檢測建議;
(3)維修技師將檢測到的參數(shù)、數(shù)據(jù)輸入系統(tǒng);
(4)系統(tǒng)根據(jù)輸入的參數(shù)和數(shù)據(jù),檢索出之前最為類似的案例,并給出維修方案供維修人員參考。
圖1描述了這一過程。在系統(tǒng)設(shè)計(jì)中,把系統(tǒng)案例庫分成兩個(gè)部分:確定故障大范圍的類型庫和具體到小范圍甚至到元件級別的維修庫。類型庫是指針對某些故障現(xiàn)象,大致將其劃分到某一單元電路,是對某一類故障的抽象;維修庫是在單元電路內(nèi)具體故障元件的確定,是元件級維修建議的基礎(chǔ)。
2 系統(tǒng)的建立
2.1設(shè)備故障案例表示方式
案例表示是對故障現(xiàn)象的具體情況盡可能地完整描述,是CBR運(yùn)行的基礎(chǔ)。在系統(tǒng)設(shè)計(jì)中,把案例信息表示成故障信息表。這里,故障信息表有兩個(gè):(1)故障部位表,由故障名稱、故障現(xiàn)象、故障部位和檢測建議組成;(2)檢測項(xiàng)目表,由檢測項(xiàng)目、檢測值、權(quán)重組成。以不開機(jī)故障為例,故障部位表設(shè)計(jì)結(jié)構(gòu)如表1所示,檢測項(xiàng)目表如表2所示。
2.2 案例庫的建立
利用以往計(jì)算機(jī)硬件故障的歷史數(shù)據(jù)建立案例庫,根據(jù)上述案例的框架表示方法,單個(gè)案例可以采用SQL Server的關(guān)系型數(shù)據(jù)庫技術(shù),通過設(shè)計(jì)一張主表和一系列關(guān)聯(lián)表來存儲(chǔ)相關(guān)知識(shí)。即案例由n個(gè)可能產(chǎn)生的故障單元組成,每個(gè)單元里面又有多個(gè)需要檢測的部位。將這些單元內(nèi)檢測項(xiàng)目用一個(gè)表來描述,如上述南橋檢測項(xiàng)目表示如下:檢測編號(varchar)、檢測項(xiàng)目(varchar)、檢測值(varchar)、權(quán)重(float)、詳細(xì)說明(varchar)、備注(varchar)。
檢測項(xiàng)目的檢測值有兩種情況:一種是用文字表述,如“<80 ?贅”,“燙手(無法忍受)”等;另一種是具體值,如“3.3 V”,“80 ?贅”。這些值可通過測量得到,看其落入哪一區(qū)間,從而得到診斷結(jié)果。
由于每一檢測值的可能程度不一樣,因此必須考慮它們的權(quán)重。權(quán)重的確定通??梢圆扇《喾N方法,如專家主觀確定法、GUM(Good-Up-Matching)方法和層次分析法AHP(Analytic Hierarchy Process)。這里,選擇AHP法。
2.3 案例的檢索
案例的檢索就是在案例庫中,依據(jù)故障機(jī)的檢測值尋找與之相似的案例?;诎咐耐评磉^程本質(zhì)上是計(jì)算兩個(gè)案例相似度的過程。相似度是根據(jù)兩個(gè)案例的測量值計(jì)算出來。兩個(gè)案例的測量值越接近,其相似度越高,案例庫中案例的故障信息就越有參考價(jià)值[2]。
推理之前要輸入故障機(jī)的必要信息,即故障機(jī)的檢測值及相應(yīng)權(quán)值。然后檢索案例庫中相關(guān)案例,計(jì)算兩者的相似度,取相似度大于0的前10組案例,就能獲得有效的診斷信息。目前使用的檢索方法主要有最近相鄰法、歸納索引法和知識(shí)引導(dǎo)法等??紤]到主板故障特點(diǎn),這里采用最近相鄰法進(jìn)行檢索,方法如下:
(1)輸入當(dāng)前故障機(jī)I的測量值,確定權(quán)值:
使用上述計(jì)算方法得出的案例相似度比較好地表示了案例的相似程度。案例的相似度以檢測項(xiàng)目結(jié)果為計(jì)算依據(jù)。這里采用的基于案例的推理過程,實(shí)際上就是根據(jù)檢測項(xiàng)目結(jié)果分析得到可能發(fā)生故障部件的過程。其前提是案例信息的表示,包括故障描述信息和檢測項(xiàng)目信息,以及檢測項(xiàng)目的權(quán)值。
2.4 案例的修正重用
CBR采用增量式學(xué)習(xí),能不斷地增加知識(shí)量和解題能力,這要?dú)w因于對新案例的保存。在行業(yè)中,一般會(huì)設(shè)置一個(gè)相似度閾限(s1,s2)。即新案例與檢索到的案例相似度大于s2時(shí),表示新案例與檢索到的案例很相似,信息量和知識(shí)含量不高,參考價(jià)值不大,不對這些案例進(jìn)行保存;如果新案例與檢索到的案例相似度小于s1,表示新案例信息量和知識(shí)含量有較大參考價(jià)值,對該案例進(jìn)行存儲(chǔ)[3]。
3 實(shí)例分析
由上文給出的案例表示以及案例相似度的計(jì)算方法,在案例庫中選取3個(gè)典型主板故障案例作為檢索案例,選取1個(gè)已經(jīng)發(fā)生的主板故障作為故障機(jī),假設(shè)在具體原因未知的情況下, 根據(jù)故障主板測量值與選取的3個(gè)案例進(jìn)行比較,以此來檢驗(yàn)系統(tǒng)的檢索機(jī)制,見表3。
應(yīng)用上述計(jì)算方法計(jì)算出故障機(jī)與案例庫中3個(gè)案例的總體相似度分別為0.9、0.4和0.45??梢?,故障機(jī)與案例1最為相似。在實(shí)際故障維修過程中,維修人員可參考案例提供的維修方法進(jìn)行維修。
CBR是世界前沿技術(shù),其應(yīng)用還要經(jīng)過深入研究。這里將CBR應(yīng)用在計(jì)算機(jī)硬件故障維修領(lǐng)域,通過故障案例的表示,將專家的經(jīng)驗(yàn)知識(shí)存儲(chǔ)起來;通過案例的檢索和查詢,部分替代了人的經(jīng)驗(yàn)判斷;通過案例的推理,初步完成了故障的診斷。本系統(tǒng)在計(jì)算機(jī)硬件故障診斷中取得了較好的效果,提高了故障診斷的準(zhǔn)確度和效率,降低了維修人員的勞動(dòng)強(qiáng)度。隨著案例庫的不斷完善,系統(tǒng)將能獲得更好的診斷效果。
參考文獻(xiàn)
[1] 朱文博,劉莎,甘屹.基于案例推理的故障診斷系統(tǒng)軟件開發(fā)[J] .上海電氣技術(shù),2010,3(3):29-33.
[2] 顧東曉.案例檢索及權(quán)重優(yōu)化方法研究及應(yīng)用[J]. 系統(tǒng)工程學(xué)報(bào),2009,24(6):764-766.
[3] 趙勇,趙厚仁. 數(shù)據(jù)倉庫技術(shù)在飛行事故中的應(yīng)用研究[J].微計(jì)算機(jī)信息,2009,25(9):143-145.