如果有一天,你突然發(fā)現(xiàn)身上的一顆痣變得有些奇怪,你會(huì)怎么做?雖然這可能是一個(gè)危險(xiǎn)的信號(hào),但很多人因?yàn)楣ぷ髅?、去醫(yī)院不便等種種原因,往往不會(huì)及時(shí)去檢查?,F(xiàn)在,人工智能為這個(gè)問題提供了更好的解決方案:在未來,我們或許可以在手機(jī)上下載一個(gè)APP,開個(gè)攝像頭讓機(jī)器醫(yī)生幫我們看一看,這是不是皮膚癌的早期癥狀。
斯坦福大學(xué)一個(gè)聯(lián)合研究團(tuán)隊(duì)開發(fā)出了一個(gè)皮膚癌診斷準(zhǔn)確率媲美人類醫(yī)生的人工智能,相關(guān)成果刊發(fā)為了1月底《自然》雜志的封面論文,題為《達(dá)到皮膚科醫(yī)生水平的皮膚癌篩查深度神經(jīng)網(wǎng)絡(luò)》(Dermatologist-level classification of skin cancer with deep neural networks)。他們通過深度學(xué)習(xí)的方法,用近13萬張痣、皮疹和其他皮膚病變的圖像訓(xùn)練機(jī)器識(shí)別其中的皮膚癌癥狀,在與21位皮膚科醫(yī)生的診斷結(jié)果進(jìn)行對(duì)比后,他們發(fā)現(xiàn)這個(gè)深度神經(jīng)網(wǎng)絡(luò)的診斷準(zhǔn)確率與人類醫(yī)生不相上下,在91%以上。
深度學(xué)習(xí)為醫(yī)學(xué)添磚加瓦
在中國,皮膚癌并不是癌癥家族中特別矚目的成員,這是因?yàn)辄S種人的皮膚癌發(fā)病率要低于白種人。但在美國,皮膚癌卻是最常見的癌癥之一。每年約有540萬美國人罹患皮膚癌。以黑色素瘤為例,如果在五年之內(nèi)的早期階段檢測(cè)并接受治療,生存率在97%左右;但在晚期階段,存活率會(huì)劇降到14%。因而,早期篩查對(duì)皮膚癌患者來說生死攸關(guān)。
一般情況下,來到醫(yī)院或診所后,醫(yī)生會(huì)基于視覺診斷進(jìn)行臨床篩查,再對(duì)疑似病變部位依次進(jìn)行皮膚鏡檢查、活體組織切片檢查和病理學(xué)診斷。
醫(yī)生使用皮膚鏡進(jìn)行檢查。但由于各種各樣的原因,很多人并不會(huì)及時(shí)為皮膚上出現(xiàn)的一些細(xì)小癥狀而跑一趟醫(yī)院。因而,基于人工智能的家用便攜式皮膚癌診斷設(shè)備將大大提高早期皮膚癌的篩查覆蓋率,挽救更多人的生命。但是,癌癥診斷,差之毫厘,謬以千里,人工智能能夠勝任將黑色素瘤從普通的痣中篩選出來的任務(wù)?斯坦福大學(xué)這個(gè)聯(lián)合研究團(tuán)隊(duì)的結(jié)論是:基于深度學(xué)習(xí)的機(jī)器醫(yī)生診斷準(zhǔn)確率十分驚人。
“我們意識(shí)到這是可行的,機(jī)器不僅能做,而且能做得和人類一樣好”,斯坦福人工智能實(shí)驗(yàn)室助理教授Sebastian Thrun說道,“這時(shí)候我們的想法完全變了。我們說,‘瞧吧,這不僅僅是個(gè)學(xué)生作業(yè),這可能有益于全人類’。”
這種視覺處理算法基于時(shí)下大熱的深度學(xué)習(xí),即通過大量的數(shù)據(jù)作為示例來訓(xùn)練機(jī)器完成某些特定任務(wù)。近來深度學(xué)習(xí)不僅在視覺處理方面大放異彩,也在其他不同的領(lǐng)域碩果累累,譬如谷歌(微博)的圍棋AI阿爾法狗,就是在學(xué)習(xí)完3000萬張人類棋譜后擊敗世界圍棋冠軍李世石的。在機(jī)器學(xué)習(xí)過程中,開發(fā)者不再需要對(duì)解題方法進(jìn)行編碼,而是任由計(jì)算機(jī)通過學(xué)習(xí)示例數(shù)據(jù)自己“摸索”出解法。具體到皮膚癌診斷這個(gè)案例中,就是研究者不再需要自己總結(jié)中皮膚癌在外觀上的一些規(guī)律性特征來教會(huì)計(jì)算機(jī),而是由它自己總結(jié)其中的模式。
以谷歌一個(gè)區(qū)別貓狗的算法為藍(lán)本
研發(fā)者們沒有自己另起爐灶,而是以谷歌的一個(gè)能在128萬張圖像中識(shí)別1000種物體的算法為藍(lán)本進(jìn)行加工。谷歌的這個(gè)算法原本是用來區(qū)分喵星人和汪星人的,現(xiàn)在,研究者們需要訓(xùn)練它區(qū)別良性脂溢性角化?。╞enign seborrheic keratosis)和角化細(xì)胞癌(keratinocyte carcinomas)、普通的痣和惡性黑色素瘤(malignant melanomas)。
但是,在數(shù)據(jù)方面,研究團(tuán)隊(duì)面臨的第一個(gè)問題就是并不存在一個(gè)現(xiàn)成可用的龐大皮膚癌數(shù)據(jù)庫。所以,斯坦福人工智能實(shí)驗(yàn)室從互聯(lián)網(wǎng)上收集數(shù)據(jù),與斯坦福醫(yī)學(xué)院進(jìn)行合作,給這一大堆混亂的照片分類貼標(biāo)簽。這工作并不容易,畢竟,原始數(shù)據(jù)里的語言就有好幾種,光把這些翻譯統(tǒng)一就很耗時(shí)。
接著,聯(lián)合研究團(tuán)隊(duì)再一起對(duì)這鍋大雜燴進(jìn)行篩選。專業(yè)的皮膚科醫(yī)生會(huì)使用皮膚鏡,一種手持的顯微鏡,對(duì)相關(guān)部位的皮膚進(jìn)行放大觀察,形成的醫(yī)學(xué)影像具有一些固定標(biāo)準(zhǔn)。但這里的大多數(shù)照片不是專業(yè)的醫(yī)學(xué)影像,角度、尺寸和亮度五花八門。最后,他們選出了129450張皮膚病變圖片,其中包含2032種不同的疾病。每張照片是作為一個(gè)帶有相關(guān)疾病標(biāo)簽的像素輸入進(jìn)算法的。這樣,研發(fā)者省去了許多前期的圖像分組工作,大大提高了數(shù)據(jù)量。
圖片樣本:良性和惡性的上皮細(xì)胞/黑色素細(xì)胞/皮膚鏡下的黑色素細(xì)胞。經(jīng)過訓(xùn)練后,研究者們使用由愛丁堡大學(xué)和國際皮膚影像合作項(xiàng)目(International Skin Imaging Collaboration Project)提供的高質(zhì)量的、經(jīng)活檢證實(shí)的照片來檢測(cè)機(jī)器的學(xué)習(xí)成果,照片涉及兩種最常見、也最致命的皮膚癌:惡性黑色素瘤和角質(zhì)形成細(xì)胞癌。21位人類皮膚科醫(yī)生被要求觀察其中的370多張圖片,并對(duì)每一張作出判斷:是要進(jìn)一步進(jìn)行活檢或治療,還是告訴病人一個(gè)好消息。
在測(cè)試中,人工智能被要求完成三項(xiàng)診斷任務(wù):鑒別角化細(xì)胞癌、鑒別黑色素瘤,以及使用皮膚鏡圖像對(duì)黑色素瘤進(jìn)行分類。研究者通過建構(gòu)敏感性(sensitivity)-特異性(specificity)曲線對(duì)算法的表現(xiàn)進(jìn)行衡量。敏感性體現(xiàn)了算法正確識(shí)別惡性病變的能力,特異性體現(xiàn)了算法正確識(shí)別良性病變,即不誤診為癌癥的能力。在所有三項(xiàng)任務(wù)中,該人工智能表現(xiàn)與人類皮膚科醫(yī)生不相上下,敏感性達(dá)到91%。
算法診斷不同數(shù)量的角化細(xì)胞和黑色素細(xì)胞圖片時(shí)的敏感性,均在91%以上。除了媲美人類醫(yī)生的診斷敏感性之外,該算法還有一大亮點(diǎn),它的敏感性是可以調(diào)節(jié)的。研究者可以依據(jù)想要的診斷效果對(duì)敏感性進(jìn)行調(diào)整。
未來的掌上醫(yī)生
這個(gè)算法現(xiàn)在還需要依托一個(gè)計(jì)算機(jī)運(yùn)行,但斯坦福的這個(gè)團(tuán)隊(duì)會(huì)努力把它縮小到可以在手機(jī)上裝載的地步。他們覺得這種改裝還是挺容易的,只是還需要更多實(shí)打?qū)嵉呐R床檢驗(yàn)。在不遠(yuǎn)的未來,也許人們手指輕輕一點(diǎn),就可以進(jìn)行靠譜的皮膚癌診斷。
Thrun實(shí)驗(yàn)室的研究生Esteva說道,“當(dāng)我想到智能手機(jī)強(qiáng)大的存在感后,我真是靈光一閃。未來每個(gè)人口袋里都會(huì)裝著一個(gè)超級(jí)計(jì)算機(jī)。如果我們用它來篩查皮膚癌,或者其他疾病呢?“
誠然,深度學(xué)習(xí)這塊土壤培植了太多可能性。斯坦福大學(xué)針對(duì)皮膚癌篩查的這個(gè)算法只是打開了通往新世界的一個(gè)小口子,在未來,基于深度學(xué)習(xí)的人工智能將在更廣闊的醫(yī)療領(lǐng)域內(nèi)與人類大夫們并肩作戰(zhàn)。