摘 要: 針對復方作用特點,為提高臨床療效,提出采用支持向量機SVM建模、非支配排序遺傳算法NSGA-II多目標優(yōu)化、熵權TOPSIS法多屬性決策優(yōu)選復方劑量配比的方法,最后以苓桂術甘湯為例驗證方法的有效性。
關鍵詞: 復方配比;多目標優(yōu)化;支持向量機;非支配排序遺傳算法;熵權TOPSIS法
實際優(yōu)化問題大多數(shù)是多目標優(yōu)化問題MOP(Multi-Objective optimization Problems),多目標優(yōu)化問題最主要的特點是目標間的矛盾性和不可共度性,即一個目標的改善可能會使得另一個目標值變劣,目標間一般沒有統(tǒng)一的度量標準,因而不能直接比較[1]。多目標問題的最優(yōu)解是一組最優(yōu)解的集合,稱為非劣解集,即Pareto解集。
藥物研究中的許多問題都是多目標優(yōu)化問題。例如,在藥物的藥效評價研究中,如何確定最佳方案,以使各治療效應目標都處于較好水平并且副作用相對最小等。這樣的多目標評價問題在中藥制劑、生產(chǎn)工藝、藥理和藥效中比比皆是。在中藥復方藥物的研究中,中藥復方的量效關系具有非線性特征,不同劑量的組方藥效可能存在著差異,且中藥藥效具有多途徑、多靶點特征[2],選取不同的藥效指標及指標權重,復方組分配比及組分間相互作用機制也不同,因而有必要尋找能夠提升復方療效、使多個藥效指標達到綜合最優(yōu)的藥味劑量。本研究以苓桂術甘湯為例,采用遺傳算法優(yōu)化支持向量機建立量效關系多目標優(yōu)化模型,基于非支配排序遺傳算法進行模型求解,得出一組分配均勻的Paeto解,熵權法結(jié)合專家經(jīng)驗確定指標組合權重,依據(jù)逼近于理想解的多屬性決策技術(TOPSIS)對Pareto方案排序并擇優(yōu)。
1 算法簡介
1.1 支持向量機
中藥復方量效關系是一個非線性、確定的多變量輸入輸出關聯(lián)系統(tǒng),涉及到的動力學過程極為復雜,很難用確定的數(shù)學模型來描述。配比的多目標優(yōu)化需要有可靠的、能夠反映各參數(shù)變化規(guī)律及相互作用關系的數(shù)學模型。支持向量機SVM(Support Vector Machine)理論是一種專門研究有限樣本預測的學習方法,具有嚴格的理論和數(shù)學基礎,是一種新型的結(jié)構(gòu)化學習方法。它能很好地解決有限數(shù)量樣本的高維模型構(gòu)造問題,小樣本學習使它具有很強的泛化能力,且SVM算法是一個凸優(yōu)化問題,因此局部最優(yōu)解一定是全局最優(yōu)解。其原理為:對于給定的樣本集{(xi,yi)|i=1,2,…,k},其中xi為輸入向量,yi為期望輸出,尋求一個樣本的最優(yōu)函數(shù)關系y=f(x),采用適當?shù)暮撕瘮?shù)K(xi,x)確定回歸模型[3]。
1.2 非支配排序遺傳算法
非支配排序遺傳算法NSGA-II(Nondominated Sorting Genetic Algorithm)是帶精英策略的非支配排序遺傳算法,它是Deb等人在NSGA的基礎上加入快速非支配排序算法、引入精英策略、采用擁擠度和擁擠度比較算子發(fā)展起來的,是一種基于Pareto最優(yōu)概念的遺傳算法,是眾多的多目標優(yōu)化算法中體現(xiàn)Goldberg思想最直接的方法[4]。傳統(tǒng)多目標優(yōu)化方法將多目標問題轉(zhuǎn)化為單目標問題,如綜合評分法、綜合平衡法、線性加權法等,此類方法只能找出一個Pareto最優(yōu)解,且需要較多的專家經(jīng)驗,而NSGA-II算法可以求出一組分布均勻的Pareto最優(yōu)解集,用來逼近多目標優(yōu)化問題的所有Pareto最優(yōu)解,為決策者提供了較多的備選方案。
1.3 熵權Topsis法
熵是熱力學中重要概念,是物質(zhì)系統(tǒng)無序狀態(tài)的量度,系統(tǒng)越亂,熵就越大,系統(tǒng)越有序,熵就越小。將熵的概念引入信息論,則表示一個信息源發(fā)出的信號狀態(tài)的不確定程度[5]。中藥復方劑量配比研究中,以往決策模型大部分只考慮決策者(專家)的主觀判斷權重,沒有體現(xiàn)決策目標擁有的決策信息。本研究采用熵值來度量所獲得決策信息,將主觀權重與復方量效關系的客觀情況相結(jié)合,依據(jù)TOPSIS法求解最佳配比方案。步驟[6]如下:
由表2可知,所建SVM模型對數(shù)據(jù)具有良好的擬合效果和預測效果,可用于多目標優(yōu)化Pareto方案的求解。分別控制其他藥味劑量為原方水平考察茯苓、桂枝、白術和甘草對利尿、抗缺氧和抗室顫三藥效指標的影響,結(jié)果如圖1所示。
由圖2可以看出,當種群進化到50代時,所得的Pareto最優(yōu)解具有良好的多樣性。這些解在不同的目標上各占優(yōu)勢,決策者可以根據(jù)不同的偏好,在這些解折中直接選擇,但直接選擇法具有較強的主觀隨意性。研究者還可對優(yōu)化參數(shù)進行限定并修改算法中的一些條件進而使算法使用范圍得到拓展,例如可將搜索范圍設置在藥效增加較快的水平等。
2.5 熵權TOPSIS法進行Pareto方案排序
在多目標優(yōu)化獲得一組Pareto解后,還需要對解集決策以挑選出基于方案的最優(yōu)解。在Pareto最優(yōu)解集基礎上構(gòu)造決策矩陣,決策屬性定義為所考慮的3個目標函數(shù),因此決策矩陣的大小為500×3。依據(jù)熵權法計算各指標熵值分別為0.989 7、0.992 5和0.941 3,熵權分別為 0.135 2、0.097 4和0.767 3,說明抗室顫指標在Pareto方案中所含信息量最大,是影響最佳配比選擇的主要因素。主觀權重可由研究者根據(jù)臨床經(jīng)驗及病人個體化差異確定,本研究將因子分析法[10]確定的三指標權重作為主觀權重,分別為0.332 8、0.331 3、0.335 9。按照TOPSIS方法對Pareto解進行排序,表4給出了貼近度從大到小的前10個方案。
以貼近度最大的方案為最終的優(yōu)化解,得到:茯苓=16.974 8 g,桂枝=11.890 9 g,白術=12.081 4 g,甘草=1.370 4 g。
3 討論
3.1 支持向量機參數(shù)的選擇
SVM和大多數(shù)機器學習算法一樣,其性能的優(yōu)劣與參數(shù)和特征的選擇有關。不同的參數(shù)優(yōu)化方法其擬合和預測效果有一定的差異。常用的參數(shù)優(yōu)化方法有網(wǎng)格搜索法[11]、粒子群優(yōu)化算法和遺傳算法[12-13]。本研究分別比較了三種參數(shù)優(yōu)化方法,研究表明,網(wǎng)格搜索作為一種非啟發(fā)式搜索,運算量較大,粒子群算法開始尋優(yōu)迅速,但容易陷入局部最小,而遺傳算法尋優(yōu)速度逐漸變快,并且沒有陷入局部最小,可有效實現(xiàn)參數(shù)尋優(yōu)。
3.2 采用組合權重的優(yōu)點
熵權并不是在決策問題中某指標實際意義上的重要性系數(shù),而是在給定被評價方案集后各種評價指標值確定的情況下,各指標在競爭意義上的相對激烈程度系數(shù),只代表該指標在該問題中提供有用信息量的多寡程度。單純采用熵權計算權重,屬性權重只能反映數(shù)據(jù)本身的特點,不能代表屬性的重要程度[14]。本文利用客觀熵權結(jié)合主觀專家權重的方法進行組合賦權,可以有效地避免傳統(tǒng)方法中權重系數(shù)確定過程的主觀色彩,同時更注重了評價體系指標本身的重要程度,充分利用了被評判指標的信息量,綜合權重既可以反映客觀的決策信息,又可以體現(xiàn)決策者對決策指標的偏好,因而使決策結(jié)果具有更高的準確性和實用性。
3.3 復方標準劑量的確定
本研究中確定的苓桂術甘湯劑量不能作為標準劑量,由表3可知,當選取的藥效指標不同時,其最佳劑量也不同。即使選擇相同的藥效指標,研究者還應根據(jù)病人的個體化差異靈活確定不同的主觀權重,進而從Pareto方案中擇優(yōu)。因此,復方最佳劑量的確定應結(jié)合不同的藥效指標及臨床經(jīng)驗共同確定。
3.4 存在問題及解決辦法
由圖1可知,在一定范圍內(nèi),藥效指標隨著苓桂術甘湯各藥味劑量的增加改善不明顯,即投入的劑量并未轉(zhuǎn)化為理想的藥效輸出。后續(xù)工作將采用數(shù)據(jù)包絡分析DEA(Data Envelopment Analysis)[15-16],即將復方量效關系視為一個投入產(chǎn)出系統(tǒng),藥效指標的改善視為復方各藥味劑量投人轉(zhuǎn)化后的直接和間接產(chǎn)出,產(chǎn)出的多少不僅依賴于投入(藥味劑量)的多少,還依賴于投入產(chǎn)出的效率。擬采用基于投入的C2R模型以決策單元DMU(Decision Making Units)的效率評價指數(shù)θ、投入產(chǎn)出冗余松弛變量s+及s-進行量效關系評價,計算投入產(chǎn)出比(研究結(jié)果將另文發(fā)表)。
支持向量機作為一種專門研究小樣本情況下機器學習規(guī)律的理論,比傳統(tǒng)的統(tǒng)計學習理論和神經(jīng)網(wǎng)絡具有更好的泛化推廣能力,能夠很好地解決中藥復方量效關系非線性建模問題。非支配排序遺傳化算法作為一種模擬自然進化過程的隨機優(yōu)化方法,同時也是一種全局性概率優(yōu)化方法,用于多目標優(yōu)化不僅可以一次性獲得大量Pareto最優(yōu)解,而且其優(yōu)化結(jié)果具有良好的一致性。熵權TOPSIS法可在某種程度上反映決策指標含有的信息的多少,充分表現(xiàn)不同配比之間的指標差異,避免了決策過程的主觀性和盲目性。支持向量機建模、非支配排序遺傳算法多目標優(yōu)化、熵權TOPSIS多屬性決策三者結(jié)合可較好解決復方劑量配比多目標優(yōu)化問題。
參考資料
[1] 張志剛,馬光文.基于NSGA-II算法的多目標水火電站群優(yōu)化調(diào)度模型研究[J].水力發(fā)電學報,2010,29(1):215-216.
[2] 田景振,王厚偉.基于中藥方劑的中藥多維組合藥物研究模式探討[J].山東中醫(yī)藥大學學報,2011,35(2):99- 101.
[3] 范玉妹,郭春靜.支持向量機算法的研究及其實現(xiàn)[J].河北工程大學學報:自然科學版,2010,27(4):106-112.
[4] HERIS S M, KHALOOZADEHH. Open-and closed-loop multiobjective optimal strategies for HIV therapy using NSGA-II.[J]. IEEE Transaction Biomed Engineering,2011,58(6):1678-1685.
[5] 劉曉,張宇.基于熵權和層次分析法的宿舍綜合評價[J].科學技術與程,2011,11(2):304-307.
[6] 王國全,馮光文.熵權TOPSIS法在優(yōu)選低放射性裝飾建筑材料中的應用[J].環(huán)境科學與管理,2011,36(1):22-25.
[7] 宋宗華,馮東.苓桂術甘湯配伍機制及藥效物質(zhì)基礎研究[J].中成藥,2003,25(2):133-138.
[8] LIN H T, LIN C J. A study on sigmoid kemels for SVM and the training of non-PSD kemels by SMO-type methods [EB], 2003.
[9] 劉璐,劉愛倫.基于改進的遺傳算法優(yōu)化支持向量機的精餾塔故障診斷[J].華東理工大學學報:自然科學版,2011,37(2):228-233.
[10] 何君,石城,楊思波,等.基于因子分析和AHP的水資源可持續(xù)利用綜合評價方法[J].南水北調(diào)與水利科技,2011,9(1):75-79.
[11] 張向東,馮勝洋,王長江.基于網(wǎng)格搜索的支持向量機砂土液化預測模型[J].應用力學學報,2011,28(1):24-28.
[12] 高昆侖,劉建明,徐茹枝.基于支持向量機和粒子群算法的信息網(wǎng)絡安全態(tài)勢復合預測模型[J].電網(wǎng)技術, 2011,35(4):176-182.
[13] 武海巍,于海業(yè),張蕾.基于參數(shù)優(yōu)化支持向量機的林下參凈光合速率預測模型[J].光譜學與光譜分析, 2011,31(5):1414-1418.
[14] 王國全,馮光文.熵權TOPSIS法在優(yōu)選低放射性裝飾建筑材料中的應用[J].環(huán)境科學與管理,2011,36(1):22-25.
[15] 張鵬,秦毓毅,唐茂林,等.基于數(shù)據(jù)包絡分析的水電企業(yè)節(jié)能調(diào)度效益評價[J].四川電力技術,2011,34 (2):91-94.
[16] MOUSAVI A S, RAFIEE S, JAFARI A, et al. Improving energy productivity of sunflower production using data envelopment analysis (DEA) approach[J]. J Sci Food Agric,2011,91(10):1885-1892.