文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.172872
中文引用格式: 劉雪峰,馬州生,趙艷陽,等. 基于MSE-PCA的腦電睡眠分期方法研究[J].電子技術(shù)應(yīng)用,2017,43(9):22-24,29.
英文引用格式: Liu Xuefeng,Ma Zhousheng,Zhao Yanyang,et al. Research on sleep staging method of EEG based on MSE-PCA[J].Application of Electronic Technique,2017,43(9):22-24,29.
0 引言
隨著現(xiàn)代生活節(jié)奏的逐步加快,人們生活壓力的不斷加大,由睡眠問題引起的疾病越來越多,所以基于交叉學(xué)科發(fā)展起來的睡眠醫(yī)學(xué),得到了很多醫(yī)學(xué)研究機(jī)構(gòu)以及高校的關(guān)注,致力于了解機(jī)體睡眠過程并解決睡眠功能障礙[1]。目前,在睡眠醫(yī)學(xué)領(lǐng)域內(nèi)有人工睡眠分期和自動睡眠分期兩種方法來分析睡眠過程,人工睡眠分期方法需要專家親臨現(xiàn)場分析,該方法會因?yàn)榭陀^原因以及專家主觀原因?qū)е抡`判率高。自動睡眠分期方法是目前睡眠醫(yī)學(xué)領(lǐng)域內(nèi)主要的睡眠分析方法,該方法需要建立算法處理模型,對睡眠過程進(jìn)行有效的特征提取和分類,常用的方法有樣本熵(Sample Entropy,SE)[2]、Hilbert-huang變換(HHT)[3]、離散小波變換(Discrete Wavelet Transform,DWT)[4]等,但是SE運(yùn)行速度較慢,不適合大量數(shù)據(jù)的處理;HHT存在端點(diǎn)效應(yīng)、模態(tài)混疊;DWT無法提取信號的非線性特征等問題。所以本文提出使用多尺度熵(Multi-scale Entropy,MSE)和主成分分析(Principe Component Analysis,PCA)的復(fù)合算法進(jìn)行特征提取和降維,并在此基礎(chǔ)上采用反饋神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)實(shí)現(xiàn)對EEG睡眠狀態(tài)的非線性映射和高分期準(zhǔn)確率,同時(shí),多尺度熵和主成分分析融合方法也是首次應(yīng)用到自動睡眠分期領(lǐng)域,為自動睡眠分期提供了新的思路。
1 材料與方法
1.1 數(shù)據(jù)的獲取和預(yù)處理
仿真數(shù)據(jù)來自MIT-BIH生理信息庫中Sleep-EDF的8組腦電(Electroencephalogram,EEG)實(shí)測數(shù)據(jù),其中4組健康志愿者的睡眠數(shù)據(jù)(sc4002e0,sc4012e0,sc4102e0,sc4112e0),另外4組是有輕微失眠志愿者的睡眠數(shù)據(jù)(st7022j0,st7052j0,st7121j0,st7132j0),均采用Fpz-Cz導(dǎo)聯(lián)方式。受試者包括男性和女性,年齡在21~35歲,未使用任何藥物干擾,采樣率均為100 Hz。數(shù)據(jù)庫中每30 s EEG信號的睡眠分期結(jié)果已由經(jīng)驗(yàn)豐富的睡眠專家人工標(biāo)注[5]。
本文首先使用小波濾波方法實(shí)現(xiàn)對原始EEG信號去噪,根據(jù)EEG頻率范圍0.5~40 Hz,采用db4小波基和分解層數(shù)為8的自適應(yīng)小波濾波。濾波完成后根據(jù)專家的分期結(jié)果將睡眠EEG數(shù)據(jù)(30 s)分為清醒期(Awake)、淺睡期(Light Sleep,LS)、深睡期(或慢波睡眠期Slow Wave Sleep,SWS)和快速眼動期(Rapid eyes movement,REM)共4個(gè)集合,為模式分類提供先驗(yàn)知識[6]。
1.2 多尺度熵
多尺度熵(MSE)是基于樣本熵(SE)在不同尺度下的非線性分析方法,它能夠描述信號在不同尺度下的復(fù)雜度和相關(guān)性[7]。在睡眠分期特征提取中,通過計(jì)算EEG不同尺度的熵值來反映不同睡眠期之間的非線性特征。
假設(shè)數(shù)據(jù)樣本為N的某一離散時(shí)間序列{Xi}={x1,x2,…,xN},嵌入維數(shù)m和相似容限r(nóng)(根據(jù)MSE的應(yīng)用研究,在實(shí)驗(yàn)中優(yōu)先選擇m=2,r=0.15SD[8]),原始數(shù)據(jù)的樣本熵為:
1.3 PCA降維
上述方法中采集到的多尺度熵值為睡眠期(30 s睡眠數(shù)據(jù))在增加單位尺度的樣本熵值,即一個(gè)維數(shù)。而EEG信號中包含大量的睡眠期,當(dāng)增加過多尺度時(shí),MSE維度過高將導(dǎo)致睡眠期的自動識別和運(yùn)行速度上存在較大難度,因此本文采用主成分分析法(PCA)對MSE特征進(jìn)行降維處理。
PCA作為一種多元統(tǒng)計(jì)分析技術(shù),首先對數(shù)據(jù)去相關(guān),根據(jù)方差最大化原理,通過正交變換將原變量轉(zhuǎn)換為一組線性不相關(guān)的主成分變量,壓縮變量個(gè)數(shù),最大化保存有效信息的同時(shí)剔除冗余信息,實(shí)現(xiàn)對數(shù)據(jù)的降維,一般主成分的選取標(biāo)準(zhǔn)是累計(jì)貢獻(xiàn)率達(dá)到80%以上[9-10]。
1.4 分類算法
反饋神經(jīng)網(wǎng)絡(luò)(BPNN)的基本思想是根據(jù)最速下降法,對網(wǎng)絡(luò)權(quán)值和閾值的不斷調(diào)整,得到最小的網(wǎng)絡(luò)誤差平方和實(shí)現(xiàn)反向傳播。在分類模型中,BPNN將PCA所包含主要信息的主成分作為輸入?yún)?shù),通過BP算法訓(xùn)練和實(shí)現(xiàn)對4種睡眠期的自動識別分類。
BPNN的節(jié)點(diǎn)輸出為:
式(1)中xi是節(jié)點(diǎn)輸入,wij為輸入節(jié)點(diǎn)j至隱含層節(jié)點(diǎn)i的連接權(quán)值,θj是隱含層節(jié)點(diǎn)的閾值,f是激活函數(shù),一般選用Sigmoid函數(shù),yj是隱含層節(jié)點(diǎn)的輸出,其結(jié)果為4種睡眠狀態(tài)。
2 實(shí)驗(yàn)結(jié)果
2.1 多尺度熵結(jié)果
序列的熵指數(shù)可以表征序列的復(fù)雜程度[9],圖1為樣本(sc4002e0,sc4012e0,st7022j0,st7052j0)的Awake、LS、SWS和REM四種睡眠期的多尺度熵值曲線,其結(jié)果在整體趨勢上區(qū)別相對明顯。同時(shí),在相同尺度下,Awake、REM、LS、SWS的熵值逐漸遞減,說明睡眠程度的加深與腦電信號的復(fù)雜程度呈負(fù)相關(guān)的變化趨勢,其在特定尺度t下的主要統(tǒng)計(jì)分布如圖2所示。圖2顯示出4種尺度下睡眠期的統(tǒng)計(jì)分布與MSE的結(jié)果保持一致,并且睡眠階段之間存在顯著性差異,因此多尺度熵可以區(qū)分四種不同的睡眠階段。根據(jù)統(tǒng)計(jì)結(jié)果,為了不丟失信號的有效成分,采用尺度1-13的MSE值表征腦電EEG不同睡眠期的主要非線性動力學(xué)特征。
2.2 PCA降維結(jié)果
為實(shí)現(xiàn)進(jìn)一步對四種睡眠期的識別分類,采用PCA對MSE特征進(jìn)行降維分析[11]。通過MSE方法對EEG信號進(jìn)行非線性特征提取,得到13個(gè)尺度下Awake、LS、SWS和REM的熵值特征,利用PCA對該特征進(jìn)行降維,保證降低數(shù)據(jù)冗余的同時(shí)保留絕大多數(shù)EEG非線性特征,各成分所對應(yīng)的累計(jì)貢獻(xiàn)率如圖3所示。
由圖3可知PCA前兩個(gè)主成分的累計(jì)貢獻(xiàn)率達(dá)到93.1%,表明它們已經(jīng)包含了原變量的主要信息。因而選用PCA的前兩個(gè)向量作為新的特征向量,代替原變量13個(gè)尺度的MSE特征,實(shí)現(xiàn)特征降維。
當(dāng)利用前2個(gè)主成分向量取代MSE特征,測試集樣本為sc4002e0,sc4012e0,st7022j0,st7052j0的60組熵值特征,其中包含Awake、LS、SWS和REM各15組,PCA降維后的前2個(gè)主成分得分圖如圖4所示[10]。圖4顯示四種睡眠階段的熵值特征分布區(qū)域較為明顯,說明通過前兩個(gè)主成分已可以完全區(qū)分四種睡眠狀態(tài)。
2.3 BPNN分類結(jié)果
將受試者的1500個(gè)測試睡眠期輸入已訓(xùn)練的BPNN分類模型,自動睡眠分期與專家人工分期的對比如圖5所示,其結(jié)果的詳細(xì)數(shù)據(jù)如表1。其中,專家分期結(jié)果在數(shù)據(jù)庫中已由臨床經(jīng)驗(yàn)豐富的專家人工識別分類標(biāo)注,該結(jié)果可以作為自動睡眠分期模型的性能評測依據(jù)。
3 討論
本研究通過MSE算法提取EEG信號的非線性動力學(xué)特征,利用PCA降維和BPNN分類,建立一種有效的自動睡眠分期方法。在表1中顯示出本文模型相對于專家人工分期結(jié)果,自動分期模型Awake、LS、SWS和REM的識別準(zhǔn)確率均在85%以上,平均準(zhǔn)確率為87.9%,相比同類研究,達(dá)到較高的分期準(zhǔn)確率。通過與專家分期結(jié)果的一致性檢測,模型的kappa系數(shù)保持在了0.77,表明本文方法的自動分期結(jié)果相對于專家分期結(jié)果已達(dá)到高度的一致性,系統(tǒng)魯棒性強(qiáng)。
本文主要對比了AARON等人[2]、GUO等人[3]、謝等人[4]提出的自動睡眠分期方法,自動睡眠分期方法的對比如表2所示。發(fā)現(xiàn)本文所提方法對EEG信號睡眠階段的分類準(zhǔn)確性較高,同時(shí)PCA降低了系統(tǒng)的復(fù)雜性,模型的結(jié)構(gòu)更為簡單提升了系統(tǒng)的穩(wěn)定性。
4 結(jié)論
由于生理信號的特征提取和分類算法較為復(fù)雜,自動睡眠分期的準(zhǔn)確率沒有得到較大的提升。本文將MIT-BIH腦電EEG信號作為睡眠分期的生理數(shù)據(jù)樣本,通過MSE-PCA模型將前2個(gè)主成分向量替代睡眠階段的多尺度熵特征,不僅提取了EEG的非線性動力學(xué)特征,降低了模型的復(fù)雜性,而且更利于BPNN分類器對睡眠期的訓(xùn)練和分類。同時(shí),自動分期的結(jié)果與數(shù)據(jù)庫中的專家判定達(dá)到高度的一致性,說明MSE-PCA的融合方法能有效實(shí)現(xiàn)對EEG非線性特征的提取和降維,對睡眠過程的分析和研究有較大幫助。
參考文獻(xiàn)
[1] 高群霞,周靜,吳效明.基于腦電信號的自動睡眠分期研究進(jìn)展[J].生物醫(yī)學(xué)工程學(xué)雜志,2015,32(05):1155-1159.
[2] AARON R S,LIANG C K.A study on sleep EEG using sample entropy and power spectrum analysis[C].Defense Science Research Conference and Expo(DSR),Singapore,2011:1-4.
[3] GUO C,LU F,LIU S,et al.Sleep EEG staging based on Hilbert-Huang Transform and Sample Entropy[C].International Conference on Computational Intelligence and Communication Networks(CICN),Jabalpur,2015:442-445.
[4] 謝宏,施小南.基于離散小波變換的腦電信號睡眠分期研究[J].微型機(jī)與應(yīng)用,2015,34(432):18-20.
[5] KEMP B.The sleep-edf database online.[Online].Available:http://www.physionet.org/physiobank/database/sleep-edf/
[6] STOCHHOLM A,MIKKELSEN K,KIDMOSE P.Automatic sleep stage classification using EEG[C].Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC),Orlando,2016:4751-4754.
[7] FRAIWAN L,LWEESY K.Newborn sleep stage identification using multi-scale entropy[C].IEEE 2nd Middle East Conference on Biomedical Engineering,Doha,2014:361-364.
[8] LIANG S F,KUO C E,HU Y H,et al.Automatic stage scoring of single-channel sleep EEG by using multi-scale entropy and autoregressive models[J].IEEE Transactions on Instrumentation and Measurement,2012,42(13):1649-1657.
[9] 周鵬,李向新,張翼,等.基于主成分分析和支持向量機(jī)的睡眠分期研究[J].生物醫(yī)學(xué)工程學(xué)雜志,2013,30(6):1176-1179.
[10] 楊靜,王成,謝成穎,等.基于主成分分析和反向傳播神經(jīng)網(wǎng)絡(luò)的肝癌細(xì)胞后向散射顯微光譜判別[J].生物醫(yī)學(xué)工程學(xué)雜志,2017,34(2):246-252.
[11] 王金甲,周麗娜.基于PCA和LDA數(shù)據(jù)降維的腦磁圖腦機(jī)接口研究[J].生物醫(yī)學(xué)工程學(xué)雜志,2011(6):1069-1074.
作者信息:
劉雪峰1,馬州生2,趙艷陽3,余傳奇1,范文兵1
(1.鄭州大學(xué) 信息工程學(xué)院,河南 鄭州450001;2.河南省經(jīng)貿(mào)學(xué)院,河南 鄭州450046;
3.河南工業(yè)大學(xué) 電氣工程學(xué)院,河南 鄭州450001)