目前,全球每年近2000萬(wàn)人死于心血管疾病及相關(guān)疾病,包括心臟病發(fā)作、中風(fēng)、腦動(dòng)脈梗塞和其他循環(huán)系統(tǒng)功能障礙。為了預(yù)測(cè)這些疾病,許多醫(yī)生使用美國(guó)心臟病學(xué)會(huì)(ACC)和美國(guó)心臟學(xué)會(huì)(AHA)提供的指南,包括評(píng)估年齡、膽固醇水平、血壓等8個(gè)風(fēng)險(xiǎn)因素。但這些指標(biāo)過(guò)于簡(jiǎn)單,無(wú)法解釋患者服用多種藥物、其他疾病及生活方式等因素的影響。
諾丁漢大學(xué)流行病學(xué)家史蒂芬·翁帶領(lǐng)團(tuán)隊(duì),詳細(xì)比較了ACC/AHA預(yù)測(cè)指南與4種機(jī)器學(xué)習(xí)算法——隨機(jī)森林、邏輯回歸、梯度增強(qiáng)和神經(jīng)網(wǎng)絡(luò)之間的數(shù)據(jù)分析效率,并希望在沒(méi)有人為指導(dǎo)的情況下創(chuàng)建預(yù)測(cè)工具。
機(jī)器學(xué)習(xí)被“投喂”了大量數(shù)據(jù),包括英國(guó)378256名患者的電子病歷,目的是在與心血管疾病發(fā)作有關(guān)的記錄中找到共同模式。首先,人工智能算法利用大約78%的病歷記錄,建立自己的內(nèi)部“指導(dǎo)方針”,然后對(duì)剩余的記錄進(jìn)行測(cè)試;人工智能考慮的變量比ACC/AHA指南多出22個(gè),包括種族、關(guān)節(jié)炎和腎臟疾病等因素;基于2005年的可用記錄數(shù)據(jù),預(yù)測(cè)在未來(lái)10年內(nèi)哪些患者心血管疾病會(huì)首次發(fā)作,并對(duì)照檢查了2015年的記錄數(shù)據(jù)。
結(jié)果顯示,機(jī)器學(xué)習(xí)方法表現(xiàn)明顯優(yōu)于ACC/AHA指南。表現(xiàn)最好的神經(jīng)網(wǎng)絡(luò)算法,比ACC/AHA方法的正確預(yù)測(cè)率高出7.6%,還降低了一定的錯(cuò)誤預(yù)警率,相當(dāng)于在8.3萬(wàn)名患者中額外挽救了355人的生命。其中,對(duì)預(yù)測(cè)結(jié)果影響最強(qiáng)的變量包括是否有嚴(yán)重精神疾病、是否服用口服皮質(zhì)類固醇,以及是否罹患糖尿病。
英國(guó)曼徹斯特大學(xué)數(shù)據(jù)科學(xué)家認(rèn)為,如果“投喂”更多的數(shù)據(jù)給新的人工智能算法,可能會(huì)帶來(lái)更大的收益。