近日,《Nature》雜志在封面發(fā)表一篇文章:利用深度學(xué)習(xí)算法診斷皮膚癌,準(zhǔn)確度達(dá)到91%,可以與醫(yī)生比肩。
不知道大家是否還記得谷歌神經(jīng)網(wǎng)絡(luò)是如何辨別貓和狗的?人工智能和人不同,一個(gè)小孩見了幾次貓以后他就知道貓是什么樣子的,但是對(duì)于一個(gè)機(jī)器,人們需要給它喂數(shù)以萬計(jì)的圖片以后,它經(jīng)過深度學(xué)習(xí)才能識(shí)別出什么是貓。
同樣的,如果人給人工智能系統(tǒng)提供高質(zhì)量的皮膚癌圖片,系統(tǒng)經(jīng)過機(jī)器學(xué)習(xí)也可以識(shí)別出什么是皮膚癌,最近斯坦福大學(xué)在《Nature》上發(fā)表了一篇與此相關(guān)的研究成果,并將該人工智能系統(tǒng)與24位資深的皮膚病專家相對(duì)比,發(fā)現(xiàn)系統(tǒng)的準(zhǔn)確率在91%左右。
該文章第一作者,斯坦福大學(xué)的研究生Andre Esteva說:“我們做了一個(gè)非常強(qiáng)大的人工智能算法,可以從數(shù)據(jù)中進(jìn)行學(xué)習(xí),通過寫代碼,讓系統(tǒng)自己去發(fā)現(xiàn)該去識(shí)別、尋找什么內(nèi)容。”
這個(gè)算法被稱為卷積神經(jīng)網(wǎng)絡(luò),它最開始出現(xiàn)在谷歌大腦中,利用自身驚人的計(jì)算能力可以強(qiáng)化算法的決策能力。通過斯坦福大學(xué)研究以后,神經(jīng)網(wǎng)絡(luò)已經(jīng)能夠從大約1000個(gè)不同類別中識(shí)別128萬幅圖像,但是,研究人員需要從一個(gè)良性的脂溢性角化病了解惡性腫瘤。
從一堆波斯貓中分辨出狗來,準(zhǔn)確率無傷大雅,但是如何區(qū)別各種皮膚病的不同斑點(diǎn),并從中識(shí)別出皮膚癌,這是事關(guān)人命的大事,對(duì)準(zhǔn)確率要求極高。
皮膚上彩色的斑點(diǎn)是個(gè)大麻煩,算法如何區(qū)分是個(gè)難題
篩選圖像數(shù)據(jù)
該文章的共同作者斯坦福研究生Brett Kuprel表示:“該研究的另一個(gè)難點(diǎn)在于,當(dāng)時(shí)還沒有足夠大的高質(zhì)量皮膚癌圖像數(shù)據(jù)來訓(xùn)練人工智能算法,我們必須自己來解決?!鄙踔猎谔幚韴D片之前,他們還要做一些翻譯工作,“我們?cè)诨ヂ?lián)網(wǎng)上搜集了一些圖片,與醫(yī)學(xué)院合作,將這些圖片分類整理,并打上標(biāo)簽——這些標(biāo)簽包括德語、阿拉伯語、拉丁語等等”
不僅要翻譯整理,還要對(duì)圖像進(jìn)行處理。皮膚病專家經(jīng)常使用一種叫皮膚鏡的儀器來仔細(xì)檢查病人,所以,醫(yī)療人員基本都是通過放大率和透視角度大體一致的醫(yī)學(xué)圖像診斷疾病。但是互聯(lián)網(wǎng)的圖片千差萬別,有的是用手機(jī),有的是用儀器,有的用照相機(jī)等,并且環(huán)境不同效果也不一樣,角度、焦距和照明方面也各不相同。
最后,研究人員還是收集到了約130000幅皮膚病變的圖像,包含了超過2000種不同的疾病。他們使用這些圖像創(chuàng)建了一個(gè)圖像庫(kù),并將其作為原始像素提供給算法,每個(gè)像素都帶有標(biāo)簽,描述了相關(guān)疾病的附加數(shù)據(jù)。然后研究人員研究出一套算法,讓算法弄清楚了這些圖片的內(nèi)在聯(lián)系:即疾病經(jīng)由組織傳播在外觀上所遵循的規(guī)則。
這就是人工智能如何分割它所看到的不同類別皮膚病圖片
研究結(jié)果出來以后,為了驗(yàn)證算法的準(zhǔn)確性,研究人員從斯坦福大學(xué)醫(yī)學(xué)院請(qǐng)來了21為皮膚病專家,從三個(gè)角度來對(duì)算法進(jìn)行驗(yàn)證:角質(zhì)細(xì)胞癌分類、黑色毒瘤分類和使用皮膚鏡檢查的結(jié)果對(duì)黑色素瘤進(jìn)行分類。
在最后的測(cè)試中,研究人員只是使用了高質(zhì)量、并且活性被驗(yàn)證的惡性黑色毒瘤和惡性腫瘤圖像,并標(biāo)記哪些需要治療、活檢或者僅僅是安慰一下。當(dāng)研究人員將人工智能系統(tǒng)得到的診斷結(jié)果與21名醫(yī)生診斷的結(jié)果相對(duì)照的時(shí)候發(fā)現(xiàn),所有癌性病變和不得到假陽性結(jié)果兩方面都表現(xiàn)良好,準(zhǔn)確率在91%,這已經(jīng)與醫(yī)生的水平相當(dāng)了。
利用手機(jī)做診斷
Esteva表示:“雖然團(tuán)隊(duì)尚未做出一個(gè)上線的APP,但是這已經(jīng)達(dá)到我們的預(yù)期,我們的本意就是想讓民眾獲得更優(yōu)質(zhì)、方便的醫(yī)療服務(wù)。更讓我興奮的是,現(xiàn)如今智能手機(jī)已經(jīng)無處不在了,每個(gè)手機(jī)上都含有各種各樣的傳感器和相機(jī),我們可以通過手機(jī)圖像直接用人工智能系統(tǒng)判斷是否患皮膚癌,同時(shí)如果皮膚癌的問題解決了,那么其他疾病還會(huì)遙遠(yuǎn)了嗎?”
無論怎樣,在進(jìn)入商業(yè)化之前,下一步還需要進(jìn)行更多的測(cè)試,并細(xì)化算法?!爸匾氖俏覀冎懒巳斯ぶ悄転榱藚^(qū)分圖片是如何做決策的。良性和惡性皮膚病變計(jì)算機(jī)輔助分類研究的進(jìn)展,可以幫助皮膚病醫(yī)生提高診斷具有挑戰(zhàn)性的病病變的能力,并為患者提供更好的管理方案。”論文作者斯坦福大學(xué)皮膚科教授Susan Swetter表示,“不過在在臨床實(shí)踐中實(shí)施之前,嚴(yán)格的前瞻性驗(yàn)證算法是必要的。”