《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 顯示光電 > 業(yè)界動態(tài) > 從基因診斷到醫(yī)療影像分析,11個案例幫你讀懂深度學(xué)習(xí)的應(yīng)用

從基因診斷到醫(yī)療影像分析,11個案例幫你讀懂深度學(xué)習(xí)的應(yīng)用

2018-09-10

  7月24日,智東西公開課推出的超級公開課NVIDIA專場進行完第十二講,由NVIDIA深度學(xué)習(xí)解決方案架構(gòu)師羅晟主講,主題為《醫(yī)療領(lǐng)域的深度學(xué)習(xí)》。羅晟老師系統(tǒng)講解了深度學(xué)習(xí)在醫(yī)療影像、基因分析、藥物研發(fā)及疾病診斷等醫(yī)療領(lǐng)域的應(yīng)用及其背后所使用的深度學(xué)習(xí)技術(shù)特點。

  以下是羅晟老師的主講實錄和提綱,共計13549字,預(yù)計14分鐘讀完。

  大綱:

  1.深度學(xué)習(xí)在醫(yī)療領(lǐng)域發(fā)展現(xiàn)狀及常見應(yīng)用場景

  2.深度學(xué)習(xí)加速藥物研發(fā)

  3.深度學(xué)習(xí)加速基因研究

  4.深度學(xué)習(xí)加速疾病診斷

  5.醫(yī)療領(lǐng)域英偉達解決方案平臺

  主講實錄

  羅晟:大家好,我叫羅晟,來自NVIDIA的深度學(xué)習(xí)解決方案架構(gòu)師。今天很高興能夠在這里和大家分享醫(yī)療領(lǐng)域的深度學(xué)習(xí)應(yīng)用,以及NVIDIA為醫(yī)療領(lǐng)域提供的解決方案平臺,希望今天的分享能給大家?guī)韼椭?,也希望本次分享可以起到拋磚引玉的作用,讓各位能夠為整個行業(yè)帶來新的創(chuàng)意,幫助大家用AI和GPU加速醫(yī)療行業(yè)的應(yīng)用,為醫(yī)療領(lǐng)域提供新的方案。

  在正式開講之前,我想先給大家分享一個關(guān)于醫(yī)療領(lǐng)域創(chuàng)業(yè)的故事,為什么要用深度學(xué)習(xí)做醫(yī)療呢?大家知道現(xiàn)在深度學(xué)習(xí)很火,但是并不是火什么,我們就應(yīng)該做什么,我們用深度學(xué)習(xí)來做醫(yī)療,肯定有其背景原因,有它帶來的好處。在美國,有這樣一個深度學(xué)習(xí)應(yīng)用的案例,就是一個工程師,帶著自己的父親去看病,醫(yī)生診斷出他父親是癌癥的第四期,也就是尾期,醫(yī)生直接讓他父親進行化療,之后大概經(jīng)歷了一到兩個禮拜的化療期,化療之后,他父親也掉了很多頭發(fā),人也覺得很辛苦。后來,他正好有一個朋友是醫(yī)生,然后這個醫(yī)生就為他爸爸做了第二次診斷,才發(fā)現(xiàn)上一個醫(yī)生的診斷是錯誤的,其實他父親只是在癌癥的第一期。而癌癥第一期不需要化療,只通過藥物就可以控制住。這位AI工程師就下定決心,要用AI技術(shù)來改善醫(yī)療領(lǐng)域,去解決由于醫(yī)生的一些失誤導(dǎo)致的醫(yī)療問題,這也是為什么我們要用AI做醫(yī)療的原因。

  對NVIDIA不熟悉的朋友,可能對NVIDIA的印象還停留在GPU的計算卡和游戲卡上,但其實從2007年NVIDIA提出CUDA用于作為GPU計算的編程語言開始,我們已經(jīng)在醫(yī)療行業(yè)耕耘了十年??梢詰?yīng)用的領(lǐng)域除了計算之外,還有可視化,而現(xiàn)在,我們還可以用來做深度學(xué)習(xí)。有寶寶的小伙伴應(yīng)該知道,做嬰兒三維超聲波檢查的時候,看到嬰兒的那些圖像,其實從2009年西門子的超聲波機器已經(jīng)用NVIDIA的GPU來做渲染方面的工作。

  不僅如此,GE的CT掃描儀,也用到了GPU的技術(shù),實現(xiàn)實時重建,直接把傳感器的數(shù)據(jù)映射到圖像上,這樣帶來的好處就是我們能直接去看到相關(guān)的圖像,不僅如此,還能夠?qū)D像進行優(yōu)化,我們可以使用更低劑量的x射線來實現(xiàn)相同質(zhì)量的圖像,從而減少診斷對健康帶來的損害。

  2012年,由于AlexNet的出現(xiàn),深度學(xué)習(xí)證明了其在計算機視覺方面具有非常好的性能,也就是從這個時候開始醫(yī)療行業(yè)的各個領(lǐng)域也逐漸開始利用深度學(xué)習(xí),也擴展了GPU的應(yīng)用領(lǐng)域,比如在2013年,GPU驅(qū)動的深度學(xué)習(xí)的方法,在病理切片上檢測并統(tǒng)計有絲分裂數(shù),擊敗了其他所有的技術(shù),這個統(tǒng)計數(shù)據(jù)是癌癥的早期指標(biāo),換句話說,用GPU之后我們能夠獲得更好的準(zhǔn)確性,同時也能降低漏診的風(fēng)險。

  隨著技術(shù)的發(fā)展,DL在醫(yī)學(xué)影像領(lǐng)域獲得過很多的成功,其實我們現(xiàn)在聽到的大多數(shù)關(guān)于深度學(xué)習(xí)的應(yīng)用都是在醫(yī)療領(lǐng)域。比如2014年,我們做的大腦腫瘤分析,2016年肺癌檢測,這些都是在醫(yī)療領(lǐng)域的應(yīng)用。而這些深度學(xué)習(xí)應(yīng)用不僅是在商業(yè)應(yīng)用、搜索里面取得的成功,而且在一些數(shù)據(jù)科學(xué)競賽方面也取得了很好的成績,并且兩次打敗其他隊伍,成功完成了任務(wù)。

  這兩次成功,一次是基于心臟MI成像自動注射量的計算,可以用來衡量心臟的運行狀態(tài)。另一次是關(guān)于CT掃描中肺癌的早期檢測。這些都是DL在醫(yī)學(xué)影像領(lǐng)域取得的成功。不僅如此,最讓我興奮的是在去年NVIDIA首次參加北美放射學(xué)會,吸引了大概五萬名的與會者,大部分都是放射科醫(yī)師,其中有四十八個初創(chuàng)公司都在用深度學(xué)習(xí)或者機器學(xué)習(xí)進行醫(yī)學(xué)成像。而且其中百分之九十的公司都在使用GPU。在本次會議上,DL相關(guān)文章的數(shù)量,相比往年增加了十倍,NVIDIA在會議期間進行了為期5天的DLI(NVIDIA深度學(xué)習(xí)學(xué)院)培訓(xùn),平均每天培訓(xùn)200人。

  2018年NVIDIA發(fā)起了Project Clara,它的名稱來源于紅十字會的創(chuàng)立人,他的名字就是Clara 。我們希望通過Clara項目 ,幫助醫(yī)療行業(yè)利用NVIDIA GPU技術(shù),改善人們的生活。

  大家知道,2012年AlexNet網(wǎng)絡(luò)出來之后,首先在ImageNet上取得了非常好的結(jié)果,戰(zhàn)勝了傳統(tǒng)記憶學(xué)習(xí)的方法,當(dāng)時AlexNet性能有10%的提升。而在往年,每年都是1%的性能提升。這樣飛躍的性能提升確實能夠豐富我們的應(yīng)用種類,比如人臉識別,自然語言處理。同時對于一些商業(yè)應(yīng)用來說,能夠獲得更精準(zhǔn)的推薦,比如大家平時使用的今日頭條新聞推薦,系統(tǒng)會根據(jù)你自身的的喜好為你推薦相應(yīng)的內(nèi)容,這就是基于深度學(xué)習(xí)來做的。對于深度學(xué)習(xí)來說,這樣的精確意味著什么呢?

  對于其他的行業(yè)來說,準(zhǔn)確度確實很重要,但也不是很關(guān)鍵,因為推薦錯了,并不會對生命造成影響,但在醫(yī)療行業(yè)則不然,用更好的方法不僅僅只是提高準(zhǔn)確度。比如在藥物發(fā)現(xiàn)領(lǐng)域,可以縮短藥物的整個研發(fā)周期,在醫(yī)療診斷領(lǐng)域,可以在最早期進行醫(yī)療診斷,減少病人的痛苦。而此時能夠提高的準(zhǔn)確度,不只是數(shù)字上的十個百分點,在醫(yī)療領(lǐng)域,可能會為每一個人帶來更好的生活,為整個社會帶來更好的未來。

  整個深度學(xué)習(xí)的流程,就如右邊這張圖所示,通過訓(xùn)練數(shù)據(jù)和深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練生成一個深度學(xué)習(xí)的模型,之后對模型進行評估,再用一些新的數(shù)據(jù)來確認,驗證以及測試,從而得知模型是否準(zhǔn)確,而且通過這樣一個模型,可以解決醫(yī)療領(lǐng)域的很多問題,至于怎么解決、未來怎么做,我會在后面詳細給大家介紹。

  深度學(xué)習(xí)在醫(yī)療領(lǐng)域的應(yīng)用不僅為個人帶來了新的變化,同時也為社會和人類未來的發(fā)展帶來了新的動力。對整個行業(yè)和研究社區(qū)來說也有一些新的變化。我們也可以看到一些趨勢,也是我們所謂的深度學(xué)習(xí)動量,上圖左邊展示的是SPIE、ISBI、MICCAI這三個頂級會議醫(yī)學(xué)影像圖片領(lǐng)域使用深度學(xué)習(xí)文章數(shù)量這幾年的比例變化,從2014年不到5%,到2017年,尤其是在ISBI上面,其比例已經(jīng)超過20%,從而證明了深度學(xué)習(xí)確實能夠為研究社區(qū)帶來新的幫助,也確實成為了一個有用的工具。

  研究機構(gòu)利用AI帶來了新的應(yīng)用和思路,解決了之前在醫(yī)療方面遇到的問題,現(xiàn)在有一百零六個初創(chuàng)公司,他們也在推動整個醫(yī)療行業(yè)去使用AI。他們可能在各個領(lǐng)域,比如藥物發(fā)現(xiàn)、醫(yī)學(xué)圖像以及相關(guān)的自然語言處理等,豐富了整個生態(tài)環(huán)境,也希望今天的分享能夠給大家?guī)硪恍┬碌乃悸?,去打造在中國醫(yī)療行業(yè)的人工智能生態(tài)環(huán)境,幫助改善在未來醫(yī)療服務(wù)。

  說起醫(yī)療行業(yè)的深度學(xué)習(xí),不得不考慮對醫(yī)生和病人來說,他們在哪些方面可以用到深度學(xué)習(xí)。比如在看病的時候,醫(yī)生怎么為病人制定治療方案。一方面,可以了解病人的基因,因為很多疾病其實是基因的變異引起的,如果知道有基因變異的情況,就可以在最開始做一些人為干預(yù)和早期的治療。在看病時,醫(yī)生會去看病人以前的健康記錄,了解病人以前的健康狀況,從而幫助醫(yī)生診斷病情。

  對患者來說,要去了解病人之間的差異,以及為什么會患病。比如有些人會患一種疾病,另外一些人不會患這種病,這樣就可以用深度學(xué)習(xí)做一些基礎(chǔ)的研究,加速藥物的發(fā)現(xiàn)過程,因為這些疾病只出現(xiàn)在了一些病人身上,通過篩選,以達到更好的治療效果。

  其實醫(yī)生在工作期間不僅僅是為病人看病,也要去了解一些文獻和法規(guī)、寫論文,因為他們也需要去了解醫(yī)療行業(yè)最新的出版物,才能知道一些新的治療方式。今年關(guān)于癌癥的出版物有93393篇,到目前為止已經(jīng)有350萬篇論文,此時我們可以用深度學(xué)習(xí)從論文里挖掘出跟我們相關(guān)的信息,幫助醫(yī)生更好的了解到一些最新的研究動態(tài),尤其是在臨床方面,可以了解到最新的論文和研究狀態(tài),以及一些最新的治療方法,從而提出新的治療方案,來研究能不能通過新的方法,或者一些驗證過的方法去幫助病人獲得更好的治療效果。

  醫(yī)生和病人之間是應(yīng)該有互動的,醫(yī)生每天會看非常多的病人,他們看病的時候,其實也是一個經(jīng)驗學(xué)習(xí)的過程,醫(yī)生可能從A病人的治療過程得到這樣一個經(jīng)驗,從B病人的治療過程中得到另一個經(jīng)驗。對于醫(yī)生來說,他們看到了這么多東西,并不是每一個都會記住,因為人都會慢慢忘記以前的一些事情,因此我們可以用深度學(xué)習(xí)去記錄以前所有的經(jīng)驗,并通過以前醫(yī)生在看病時候的情況,去收集這些病人的信息,從而輔助醫(yī)生在下一次判斷中做出最優(yōu)的決定,幫助醫(yī)生更好把以前所看過病的經(jīng)驗利用起來,而不是會因為太過忙碌忘記了以前的經(jīng)驗去翻醫(yī)療記錄。

  現(xiàn)在來看下深度學(xué)習(xí)在醫(yī)療領(lǐng)域的應(yīng)用有哪些。首先在放射科領(lǐng)域,我們希望通過早期的篩選和檢測,減輕病人因為放療承受的痛苦。在國外,大家每年都會做體檢,希望在早期了解自己的身體狀況,把疾病治療提到早期階段,降低整個社會的負擔(dān),同時也減輕個人痛苦。Zebra就在做這樣的工作,通過深度學(xué)習(xí)提高篩選的準(zhǔn)確率,降低檢測整體的誤報率,獲得更好的早期判斷結(jié)果。早期診斷只是告訴我們有和無的問題,下一步要解決的問題就是有多少,如上圖中間照片所展示,當(dāng)診斷出腫瘤之后需要去判斷腫瘤所在的部位、大小等情況,即是定量的分析,這種方式,也可以用深度學(xué)習(xí)來獲得更準(zhǔn)確的結(jié)果,并且可以降低病人治療時的痛苦。

  另外一個讓人非常興奮的領(lǐng)域是精準(zhǔn)醫(yī)學(xué),上圖右邊展示的是腦部掃描圖片。在面對某些腦癌的時候,醫(yī)生有能力去判斷需要什么藥物,問題是醫(yī)生不可能在大腦上打個洞,然后去切片,再去分析,現(xiàn)在通過腦部的MI掃描方式,用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)去判斷和預(yù)測患者腫瘤突變的概率,目前準(zhǔn)確度也超過了90%,使得醫(yī)生可以用精準(zhǔn)的藥物去幫助病人做治療,減輕他們的痛苦。

  第二個領(lǐng)域是深度學(xué)習(xí)在診所里的應(yīng)用,三星和通用的掃描儀已經(jīng)在使用深度學(xué)習(xí)來優(yōu)化整個工作流,提高準(zhǔn)確性。比如嬰兒三維超聲波檢測時,可以凍結(jié)一些圖像進行測量。第二個ARTERYS公司,也是首批通過FDA認證的公司。通過與GE合作,把他們的工具帶到了心臟病專家那邊,進行所有相關(guān)的一些檢測,能夠進一步提高護理質(zhì)量。最后一個是PATHAI與飛利浦合作,也是第一個由FDA批準(zhǔn)的掃描儀診斷,通過將病理圖片與熱力圖結(jié)合,幫助病理學(xué)家分析腫瘤的情況,進一步降低病理學(xué)家診斷錯誤率,大約降低50%,使得病理學(xué)家在看圖的時候能夠更加方便。

  第三個是深度學(xué)習(xí)在藥物發(fā)現(xiàn)方面的應(yīng)用,第一個是deep genomics公司。他的成立要追溯到2002年,當(dāng)時Brendan Frey的妻子懷孕了,在做檢查的時候發(fā)現(xiàn)孩子有遺傳缺陷,雖然只是可能,但是他們不得不終止妊娠。Brendan Frey是計算機工程的教授,所以他開始嘗試把深度學(xué)習(xí)和醫(yī)療結(jié)合到一起,要解決的痛點是人群中的DNA的變異數(shù),突變概率大于1的SNP(單核苷酸多態(tài)性)有三百萬個左右,要完全的挨個調(diào)查SNP和疾病的關(guān)聯(lián)非常困難,因此要建立一個數(shù)學(xué)模型導(dǎo)入全部的健康基因組序列和SNP序列,對模型進行訓(xùn)練,讓模型能夠?qū)W習(xí)到健康的RNA(核糖核酸)的裁剪模式,然后用分子生物學(xué)的方法驗證模型,并加以校驗,同時用病理數(shù)據(jù),判斷模型輸出的準(zhǔn)確性,從而理解有害基因和基因突變病理之間關(guān)系,再做一些初步篩選,把有害基因和基因突變病理關(guān)系建立起來。

  第二個是做分子系統(tǒng)的研究,在做新藥研究時遇到很多挑戰(zhàn),HCS是指在保持細胞結(jié)構(gòu)和功能完整性的前提下,同時檢測被篩樣品對細胞形態(tài)、生長、分化、遷移、凋亡、代謝途徑及信號轉(zhuǎn)導(dǎo)各個環(huán)節(jié)的影響, 在單一實驗中獲取大量與基因、蛋白及其他細胞成分相關(guān)的信息, 確定其生物活性和潛在毒性的過程,就是PHENOMIC AI要解決的。

  第三個也是PathAI做的,通過熱力圖以及藥理的圖片,去幫助醫(yī)生更好的觀測現(xiàn)象。最后一個是CLOUD MEDX,他們拿到了很多醫(yī)療記錄,通過這些醫(yī)療的記錄,實時分析病人的信息,同時通過真實的病例數(shù)據(jù)和實驗數(shù)據(jù),做健康診斷的推薦,從而幫助醫(yī)生更好的做診斷,并合理進行藥物的配發(fā)。

  在各個方面的應(yīng)用講完之后,我想深入的講一下,目前這幾個領(lǐng)域,用到了什么樣的技術(shù)或者方法,可以幫助醫(yī)生改善診斷效果。最近有一部很火的電影叫《我不是藥神》,談到了醫(yī)藥公司的問題現(xiàn)狀,在最開始的專利期,他們的藥會價格非常高以收回投資成本。

  因為在醫(yī)藥研發(fā)的領(lǐng)域,需要非常大的投資,需要非常多的人才,做非常多的實驗,這些都是非常昂貴的成本。為了彌補企業(yè)成本并且達到盈利,只能在最開始的專利期收取高價,這也是為了讓藥物研發(fā)公司有動力繼續(xù)投入研發(fā)。如果可以用深度學(xué)習(xí)的方式,或者用GPU加速整個藥物的研發(fā)過程。將能夠在一定程度降低藥物的價格,從而去幫助整個醫(yī)療行業(yè)進入更加良性的發(fā)展階段。

  既然可以用GPU和深度學(xué)習(xí)來加速,到底該怎么具體操作呢?如果有做視覺的同學(xué),可能知道是從CNN開始,能夠取得一個好的效果,其實就是從圖片的分類開始。結(jié)果很簡單,就是用卷積核在圖片上面做卷積,然后經(jīng)過各種隱藏層的計算之后,可以判斷圖片內(nèi)容。圖片是一個很簡單、很規(guī)整的RGB數(shù)據(jù) ,但是對于藥物發(fā)現(xiàn)來說,藥物的結(jié)構(gòu)并不是一個規(guī)整的矩陣,該怎么來做呢?

  這個時候就有了所謂的Graph convolution,即圖卷積。通過圖卷積的方式,可以把藥物的結(jié)構(gòu)映射成卷積結(jié)構(gòu),映射成一個矩陣。然后就可以用CNN來做一些檢測判斷或者藥物的發(fā)現(xiàn)。那么圖上的卷積網(wǎng)絡(luò)從卷積方式來說,可以分為兩種,圖卷積和空間域卷積,在此只對空間域卷積進行簡單的介紹。圖卷積是將卷積網(wǎng)絡(luò)的濾波器和圖信號,同時搬到傅立葉域之后再處理,而空間域卷積是用圖中的節(jié)點在空間域進行相連達到層積的結(jié)構(gòu),從而進行卷積,獲得一個好的效果,具體怎么來操作呢?

  跟傳統(tǒng)方法相比,圖卷積有更低的計算開銷和更少的計算時間,但是也有一個難點,就是很難保證準(zhǔn)確性。常見的圖卷積算法包括NFP、Weave、GGNN以及SGCN。這些方法都已經(jīng)應(yīng)用到了醫(yī)療領(lǐng)域,并進行了一些基本的研究。

  空間域的卷積相對來說比較簡單。以藥物分子為例,其實每一個分子,都可以看成一個節(jié)點,對每個結(jié)點去尋找最開始旁邊的域,一個分子會有非常多的節(jié)點,到底哪個節(jié)點,對這個分子比較重要,那肯定是連接數(shù)越多的越重要,通過這樣的方式篩選出很多節(jié)點,找到每個節(jié)點鄰近的幾個分子;第二步,把臨近的分子拼成一個感知域,之后用卷積神經(jīng)網(wǎng)絡(luò),在感知域上做卷積操作,從而獲得該卷積域的特征。

  做卷積時,會執(zhí)行一些非線性的操作,生成一些新的特征,然后應(yīng)用到節(jié)點上,圖卷積的過程之后加上Batch normalization、Dropout和Relu,重復(fù)四次,就是整個圖卷積的結(jié)構(gòu)。通過這樣的結(jié)構(gòu),就能把分子的狀態(tài)應(yīng)用到CNN領(lǐng)域。不像以前,由于分子的結(jié)構(gòu)是非矩陣型的,不能夠進行應(yīng)用,而和應(yīng)用相比能不能帶來加速呢,下面我就會給大家講一下。

  這個是CPU和GPU在Tox21上使用GCN方法的性能比較,可以看到圖上最多有132個節(jié)點,每個節(jié)點有六十四個feature(特征),跑了二十個Epoch,Batchsize是一百二十八,使用Tesla V100 GPU或Xeon E5-2698CPU,在準(zhǔn)確率達到90%的情況下,用CPU訓(xùn)練的時間是260秒,而GPU只用了32秒,也就意味著GPU是10倍快于CPU,因此我們能夠更好地利用GPU來加速藥物的研究,從而降低藥物研發(fā)成本和社會負擔(dān),讓所有的患者用良心的價格獲得更好的藥物,其實還有很多方式可以把AI應(yīng)用到藥物發(fā)現(xiàn)領(lǐng)域。AI除了在藥物發(fā)現(xiàn)方面的應(yīng)用,也可以應(yīng)用于基因領(lǐng)域。

  很多疾病是由于基因突變或者基因缺陷引起的。人類曾經(jīng)有一個非常大的工程叫做基因測序,把人類的兩對染色體進行基因測序。具體怎么做基因測試的,不知道大家有沒有了解。那么我給大家介紹一下,首先將待測序的DNA進行擴增,復(fù)制出很多DNA,之后進行加熱變性,由于基因是雙螺旋結(jié)構(gòu),把雙鏈DNA分開之后,在里面加入引物,從而讓聚合酶發(fā)揮作用,這樣就可以復(fù)制這一段基因的信息。

  把DNA聚合酶加入到反應(yīng)容器,每個反應(yīng)容器里面放的都是前面所提取出來的單鏈DNA,利用ATGC基本的堿基酶原料,就可以復(fù)制整個基因序列,同時放一個特殊的堿基A進去,能夠停止復(fù)制。此時就可以開始進行整個DNA的反應(yīng)。

  在完成了DNA的反應(yīng)之后,因為有一個特殊的堿基A可以停止DNA的復(fù)制,在四個不同的樣本里,他們有很大的概率是在不同的時間停止,可以根據(jù)不同的停止情況,對其通電,較輕的DNA會在通電之后進行移動,通過熒光標(biāo)記的方式就可以在膠片上留下記號,從而得到整個DNA的順序。對于DNA測序有兩個難點需要解決,首先,染色體三十億對堿基,怎么去測序?其次是用什么辦法進行加速。

  對于人來說,兩對染色體包含30億個堿基對,包括了鳥嘌呤、胞嘧啶、腺嘌呤、胸腺嘧啶,組成二十三對染色體。但是我們這些儀器能夠產(chǎn)生十一個短序列,我們稱之為Read,每個read僅代表了三十億個堿基中的一百個,每個堿基的錯誤概率在0.1%-10% 之間,把單一的、小的基因序列完整而準(zhǔn)確的拼起來是很困難的。這個時候Google cloud platform提出了開源的方案叫做DeepVariant,通過以編碼HTS儀器數(shù)據(jù)的方式,生成了數(shù)千萬個訓(xùn)練樣本,然后用這個訓(xùn)練樣本,基于TensorFlow做圖像分類,以便從儀器生成

  的實驗數(shù)據(jù)中識別出真實的基因組序列。通過這樣的方式,可以很簡單的判斷哪個基因組序列是正確的。在右邊的圖上,有四種基因組序列:正常的染色體、有一個堿基出現(xiàn)問題的染色體、兩個染色體對都被刪除,還有一種情況就是由于一些其他因素,比如在最開始做生成的時候復(fù)制出錯等相關(guān)問題,就會出現(xiàn)最后一種圖像,通過這樣的方式,就能加速基因測試的過程。

  加速完基因測試之后,把每一個read的結(jié)果拼到一起,中間會有一個比對過程,把每一個小的單元都跟其對應(yīng)的序列作比對,從而判斷是否準(zhǔn)確,此時就有了新的Parabricks,他們在做加速DNA測序的工作,比如說用BWA MEM (比對的工具庫),支持較長的Read,然后做一些剪切性的比對。通過這樣的方式,用GPU來加速,可以看到跟32個CPU相比,其性能達到了25倍的提升,結(jié)果的準(zhǔn)確率達到100%。

  接下來跟大家分析下AI在醫(yī)療記錄分析方面的應(yīng)用,醫(yī)療記錄分兩個部分:醫(yī)療文本記錄和醫(yī)療圖片記錄,這兩個領(lǐng)域分別有怎樣的研究,他們具體是怎么操作的呢?

  第一個是依靠Icahn School提供的解決方案,他們通過12年的積累,總計700萬的醫(yī)療記錄,訓(xùn)練了一個深度學(xué)習(xí)模型,可以實現(xiàn)多疾病的預(yù)測,以前傳統(tǒng)的方法是收集醫(yī)療記錄做預(yù)測模型,但是只能預(yù)測一種疾病,現(xiàn)在可以預(yù)測七十八種疾病,并且能夠做到預(yù)防疾病的發(fā)生,可以很大程度上降低病人的痛苦。

  第二個應(yīng)用是CLOUD MEDX做的,他們做的內(nèi)容跟之前幾家公司不一樣。前面幾家公司是基于已有的醫(yī)療記錄,生成預(yù)測模型,去預(yù)測病人患病的可能性。CLOUD MEDX則是拿到了一些電子健康記錄,比如病史、藥物測試報告等數(shù)據(jù),里面有兩部分數(shù)據(jù),一部分是來自醫(yī)生記錄的,跟國內(nèi)一樣,大家都知道我們看自己的病例是看不懂的,當(dāng)拿到這些非結(jié)構(gòu)化數(shù)據(jù)之后,做數(shù)據(jù)結(jié)構(gòu)化的分析,然后直接結(jié)合NLP自然語言處理技術(shù);另一部分是實驗室的數(shù)據(jù),或者生命統(tǒng)計的數(shù)據(jù),通過這兩部分的數(shù)據(jù),開發(fā)了一個新的AI平臺。

  利用該平臺分析患者的整個病史、關(guān)聯(lián)的癥狀以及人口統(tǒng)計的數(shù)據(jù)和診斷,就可以看到該癥狀以及對應(yīng)其他臨床上的情況,從數(shù)據(jù)判斷患某種疾病的可能性,幫助醫(yī)生做一些推薦測試、藥物治療的方案以及輔助醫(yī)生修改治療方案等。

1536575378845830.jpg

1536575378874057.jpg

  第二個領(lǐng)域就是醫(yī)療圖片,大多是指圖片分割和檢測判斷,這里大概有五個例子,我會詳細給大家介紹一下他們是怎么做的。

  第一張圖是PathAI做的,把拿到的病例圖片以及識別出的結(jié)果做熱點圖,幫助醫(yī)生更好的判斷;第二個是由凱斯西儲大學(xué)做的,致力于常見的乳腺癌的研究,正常來說,女性發(fā)現(xiàn)乳腺癌之后,最開始醫(yī)生都會建議做化療,另一種方式是做病理切片,拿到切片的細胞信息之后才能判斷,該測試需要花費四千美金,對于大多數(shù)非發(fā)達國家的人來說,他們是付不起的,那這個時候怎么做,他們又提出可以用MRI的一些照片,依據(jù)現(xiàn)在的病理學(xué)照片做風(fēng)險評估。

  這張圖展示的是一個library,即醫(yī)學(xué)圖像數(shù)據(jù)庫,醫(yī)學(xué)圖像由于其敏感性和工作量,正規(guī)的注冊數(shù)據(jù)集很難得到,但在診斷和治療中非常關(guān)鍵, 是美國的國立研究院提出的一個注冊系統(tǒng),其實這就是一個獲得數(shù)據(jù)集的方法。

  上圖展示的是用SocialEyes,基于我們的NVIDIA SHIELD 平板電腦上,可以利用里面的GPU,運行深度學(xué)習(xí)的模型,去判斷眼部疾病,因為在一些偏遠地區(qū)看眼科是非常難的,通過這樣一些模型,就能夠解決這些問題。

  另外可以用深度學(xué)習(xí)做骨齡測試,傳統(tǒng)做法是用X射線圖片,和傳統(tǒng)的書里面的照片或者以前的圖像進行比對,從而判斷骨齡?,F(xiàn)在可以用深度學(xué)習(xí)的方式,使用了大概七千四百個X光射線的記錄訓(xùn)練了一個深度學(xué)習(xí)的模型,能夠很快地進行訓(xùn)練,通過這樣的方式,能夠很快的取得很好的結(jié)果,其實骨齡測量對小孩來說非常重要。尤其是在國內(nèi),很多時候小孩的發(fā)展跟他的骨齡完全是不一樣的,怎么選擇更快的獲得結(jié)果并進行干預(yù)是很重要的。

  最后一個是用ML發(fā)現(xiàn)腦腫瘤,以前的做法可能需要直接打開頭顱,然后打個孔,去看拿到的切片,看看里面是不是有腫瘤,及腫瘤狀況。現(xiàn)在MAYO CLINIC使用GPU加速,可以用MRI的信息,以前用非深度學(xué)習(xí)方法發(fā)現(xiàn)不了的數(shù)據(jù)信息,去做一些比對,進而判斷到底里面是不是有腫瘤,準(zhǔn)確率也超過了90%,所以通過這樣的方式,不僅可以把以前的結(jié)果做得更好,同時也可以做以前不能做的,而對于medical image(醫(yī)學(xué)圖像)我們需要怎樣的一個平臺呢?

  NVIDIA在2018年提出了CLARA平臺,我們叫做虛擬、通用、遠程、可擴展的平臺,所有的合作伙伴都可以加入進來,利用NVIDIA GPU計算資源和加速庫,為醫(yī)院和合作伙伴提供新的算法和方案,CLARA平臺可以做基于DL-BASED的Image重建、深度學(xué)習(xí)的圖像分割、圖像渲染等操作,該平臺最底層用的是DGX以及NVIDIA的GPU,也會提供非常多的軟件庫,包括CUDA、cuDNN、TensorRT加速庫以及Image和各種虛擬化的APP,幫助大家利用這個平臺,開發(fā)出各種各樣的應(yīng)用。

  首先從硬件開始,平臺底層需要做計算,我們使用了世界上第一臺GPU超級計算機DGX-1,里面配置了八塊32G Tesla V100 GPU以及NVLink Mesh。整個系統(tǒng)具有1 PetaFLOPS的計算性能,在做深度學(xué)習(xí)訓(xùn)練的同時,提供300 Gb/s的NVLink通信帶寬。從而保證在訓(xùn)練時能夠最快的取得效果。當(dāng)然這只是硬件方面,除了硬件之外,NVIDIA也提供了一整套的軟件支持。

  硬件沒有軟件的支撐,是運行不了的,雖然硬件達到了加速,軟件該如何操作呢?NVIDIA提供了一整套軟件棧,底層有我們的操作系統(tǒng),上面有英偉達的GPU驅(qū)動以及容器的Runtime,以保證在底層能夠調(diào)用GPU計算資源。

  在GPU之上,NVIDIA還提供各種GPU Docker容器,比如Caffe,Caffe2,TensorFlow,PyTorch,Chainer等,這些容器和驅(qū)動以及Docker,包括精簡過的OS,驅(qū)動都是專門為DGX配置的,而且上面的容器都基于GPU的特性做過優(yōu)化,從而保證大家能夠用到最好的計算性能,訓(xùn)練出自己的GPU模型,為客戶提供應(yīng)用。

  在DGX之上,我們有NGC(NVIDIA GPU Cloud),可以提供各種各樣容器鏡像,DGX也接入到了NGC,這樣用戶不需要再去配置硬件環(huán)境,通過NGC把容器鏡像拉下來,就可以開展深度學(xué)習(xí)的訓(xùn)練和Inference(推理)。

  目前NGC提供的容器鏡像有35個,分別在不同的領(lǐng)域,包括深度學(xué)習(xí)、HPC、HPC的視覺、Kubernetes以及我們的合作伙伴提供的各種容器鏡像。

  NGC提供的深度學(xué)習(xí)容器鏡像包括caffe、caffe2、CNTK,CUDA等,CUDA是NVIDIA提供 的一個基礎(chǔ)鏡像,包括DIGITS,對深度學(xué)習(xí)不熟悉的朋友,可以嘗試使用DIGITS,它是一個Web UL的界面,底層調(diào)用TensorFlow或者Caffe,在里面可以直接開始深度學(xué)習(xí)的訓(xùn)練,inference server是我們提供的一個Inference的API,它是一個推理的web框架范例。因為我們要做的就是把訓(xùn)練好的模型交付給客戶去使用,比如幫助醫(yī)生去做一些檢測。那么如何部署訓(xùn)練好的模型呢?就是使用inference server,它的作用就是把模型放進去,相當(dāng)于一個web框架,此時會對外暴露出一個API以供調(diào)用,從而簡化模型開發(fā)的過程。

  另外一個重要的容器鏡像叫做TensorRT,是NVIDIA提供的一個容器加速庫,里面已經(jīng)完成了相應(yīng)的配置,可以直接使用,能夠為深度學(xué)習(xí)模型帶來幾倍的加速,下面我會詳細介紹。

  所以基于DGX的硬件,我們提供了專用的OS以及Linux Kernel和CUDA驅(qū)動,在上面做各種各樣的容器化應(yīng)用,包括優(yōu)化好的TensorFlow、CNTK、caffe2、PyTorch等模型,以及各種各樣的軟件,包括之前提到的inference_ server,這樣一整套的軟件可以幫助大家更好的去開展深度學(xué)習(xí)訓(xùn)練,去應(yīng)用深度學(xué)習(xí)算法,或者開展一些算法的研究,同時大家也可以利用這些容器鏡像進行自己的算法部署。

  當(dāng)然除了DGX和NGC之外,還要考慮怎么使用GPU為深度學(xué)習(xí)加速?這里NVIDIA提供了DIGITS、深度學(xué)習(xí)框架以及深度學(xué)習(xí)的SDK。

  深度學(xué)習(xí)的SDK主要包括cuDNN、NCCL、cuBLAS、cuSPARSE、TensorRT以及DeepStream6個部分。cuDNN是用CUDA寫的DNN加速器。NCCL用于做多GPU的通信,一般來說,訓(xùn)練的時候會有參數(shù)服務(wù)器,因為GPU之間的數(shù)據(jù)是要通信的。怎么去加速GPU的通信呢?我們做了算法的實現(xiàn),做了底層的優(yōu)化,比如說使用NVLink,多節(jié)點之間用了RDMA等,通過這樣的方式加速了通信。cuBLAS做一些線性代數(shù)的計算;cuSPARSE用于做稀疏矩陣的計算,TensorRT是做inference的加速引擎,可以做到inference的加速,最后一個是DeepStream,提供視頻分析的一些方案,提供整套的pipeline,底層調(diào)用GPU里面硬件核心、解碼器以及CUDA核,從而完成一整套的計算過程。

  cuDNN是一個高性能深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)加速庫,被利用到所有的深度學(xué)習(xí)框架中,包括Caffe、Caffe2、CNTK、TensorFlow、PyTorch等,都在用cuDNN做加速。當(dāng)然如果需要寫自己的軟件,也可以用cuDNN來加速,從上圖可以看到從最開始的8個K80,到8個Maxwell,再到DGX-1和DGX-

  1V,在不同的cuDNN版本和不同的硬件上,其性能差距是非常大的。在深度學(xué)習(xí)的訓(xùn)練方面,從最開始的1000張不到,現(xiàn)在可以訓(xùn)練的圖片大概超過10000張,能夠進一步加速訓(xùn)練,帶來10倍的加速提升,而這樣的加速對于開發(fā)成熟的產(chǎn)品是非常重要的。

  NCCL用于多GPU之間的通信,使用通信算法,底層采用NVLink,PCIe和 InfiniBand,同時能夠去檢測到整個系統(tǒng)的拓撲結(jié)構(gòu)。從上圖可以看到最開始的Maxwell,以及兩個P100的比較,然后到1024個P100,可以看到用NCCL在GPU通訊方面能夠達到線性的加速,也意味著通信的開銷不會導(dǎo)致訓(xùn)練的延時,這個是非常難做的。有HPC (高性能計算) 背景的朋友都知道,能達到線性的加速是非常難的一個任務(wù),而NCCL在通信方面取得了這樣的效果。

  最后一個我想講的是TensorRT,訓(xùn)練好一個模型,最重要的是模型的準(zhǔn)確性和怎么把模型交付給客戶使用?推理和訓(xùn)練其實是不一樣的,訓(xùn)練時可能用的是FP32的精度,但在推理的時候,可以用更低的精度。訓(xùn)練時,各層之間的關(guān)系是固定的,而且需要把中間參數(shù)保存下來,從而進行反向迭代。但推理時,只有正向的迭代,此時可以通過使用TensorRT達到免費加速的效果。TensorRT可以做一些Layer fusion,同時也可以做些精度校準(zhǔn),對于不同的GPU卡,可以實現(xiàn)模型的自動調(diào)整,動態(tài)分配內(nèi)存,不管是在內(nèi)存、計算、網(wǎng)絡(luò)結(jié)構(gòu)以及參數(shù)精度方面,都可以用TensorRT達到更好的效果,取得一更好的性能。以P4為例,如果使用FP32精度的參數(shù)算力可以達到5.5T,如果使用Int 8精度的參數(shù)算力可以達到22T,所以說硬件的性能提升也需要通過軟件的優(yōu)化才能夠完成。

  最后我想講的是deep learning的菜單,在醫(yī)療領(lǐng)域最重要的就是數(shù)據(jù),當(dāng)然也需要強大的計算力。在此基礎(chǔ)上,我們可以用監(jiān)督學(xué)習(xí),或者增強學(xué)習(xí),訓(xùn)練各種模型。關(guān)于數(shù)據(jù)來源,我們有各種合作伙伴和研究機構(gòu),他們會為我們提供各種數(shù)據(jù)集。我們也在跟很多醫(yī)院展開合作,能夠提供這樣的數(shù)據(jù)。我們?yōu)榇蠹姨峁┳羁斓挠嬎闫脚_,以保證拿到這些數(shù)據(jù)之后,能夠最快的取得結(jié)果。而在算法方面,現(xiàn)在深度學(xué)習(xí)社區(qū),每年大概有幾萬甚至十幾萬篇論文發(fā)出來,他們提供了各種各樣的思路,比如做圖像分割,最開始從一個很簡單的網(wǎng)絡(luò)開始,后來用FCN來實現(xiàn),現(xiàn)在可能用GAN來做。

  通過不同的算法,完成各種各樣的應(yīng)用,解決醫(yī)療上各種各樣的難題。不管是對個人來講,還是對社會來講,都能帶來很大的幫助。

  以上就是我今天關(guān)于AI在醫(yī)療領(lǐng)域應(yīng)用的一些分享,謝謝大家!

  提問環(huán)節(jié)

  問題一

  郭家豪-上海應(yīng)用技術(shù)大學(xué)-研究助理

  針對傳統(tǒng)的在校醫(yī)學(xué)生,畢業(yè)后希望轉(zhuǎn)型到醫(yī)療領(lǐng)域的深度學(xué)習(xí)中,在這一轉(zhuǎn)型中,優(yōu)勢有哪些?劣勢有哪些?針對深度學(xué)習(xí)的技術(shù),最關(guān)鍵的核心技術(shù)是哪一塊兒?

  羅晟:你現(xiàn)在是在醫(yī)療行業(yè),如果你想要轉(zhuǎn)型到深度學(xué)習(xí),我們是非常歡迎的,同時我們也非常希望有專業(yè)的醫(yī)療行業(yè)的人才加入到深度學(xué)習(xí)的隊伍當(dāng)中,因為對于深度學(xué)習(xí)來說,它只是一個工具,怎么用這個工具,在哪個方向能夠用這個工具才是最關(guān)鍵的。你的優(yōu)勢在于知道怎樣應(yīng)用深度學(xué)習(xí)技術(shù),用在什么方向,你只要去加強深度學(xué)習(xí)方面的技術(shù),甚至可以讓專業(yè)的技術(shù)人員幫你做加速。我相信未來也會有相應(yīng)的工具,能夠讓人很快的使用,所以方向才是最重要的。

  其實,在深度學(xué)習(xí)領(lǐng)域,想要知道怎么應(yīng)用,確定好要用的醫(yī)療技術(shù)及方向之后,就可以用GPU技術(shù)來實現(xiàn),NVIDIA提供了所有框架的優(yōu)化,你可以使用這些框架來做數(shù)據(jù)整理,確認好方向之后,有各種各樣的research community提供的網(wǎng)絡(luò),都可以去嘗試,從而在確定的方向取得一定的成果,我相信在確定了方向之后,一切的技術(shù),都不會成為你的阻礙,而且這樣的技術(shù)肯定會隨著未來的發(fā)展也變得越來越普及,越來越有用。

  問題二

  高蓉彬-甘肅畜牧工程職業(yè)技術(shù)學(xué)院-教師

  深度學(xué)習(xí)對藥物藥理學(xué)研究能起到什么作用?

  羅晟:我前面的內(nèi)容已經(jīng)涉及到了怎么用深度學(xué)習(xí)做藥理學(xué)的研究以及在分子方面的研究。比如做藥物發(fā)現(xiàn)時使用GCN網(wǎng)絡(luò),通過該方法,可以去把藥物分子結(jié)構(gòu)做映射,從而知道不同的藥物之間互相的聯(lián)系,同時也可以判斷藥物之后的結(jié)果是什么樣的,這些都可以用深度學(xué)習(xí)來完成。

  問題三

  羅力川-大唐電信-芯片設(shè)計工程師

  該平臺是否用到了英偉達的 DLA加速器了嗎?如果用到了,可否詳細介紹下?

  羅晟:很高興聽你提到NVIDIA的DLA,DLA是一個深度學(xué)習(xí)加速器,目前實現(xiàn)是在Jetson Xavier上面,Xavier現(xiàn)在是在申請試用中。當(dāng)然不管是DLA也好, Xavier也好,Tesla GPU也好,還是Tensor Core也好,各種軟件在NVIDIA平臺都是統(tǒng)一的。任何軟件都可以運行在NVIDIA任何版本的GPU上,并且都可以取得很好的效果。

  同時這部分的加速都是用TensorRT來實現(xiàn),TensorRT可以去感知不同硬件的區(qū)別,比如P4有Int8的支持,而在P40和v100上有FP16的支持,這樣TensorRT就可以屏蔽底層任何硬件的信息來使用。但另一個方面,因為Xavier現(xiàn)在是剛開發(fā)出來。相信在未來,比如我有一個平板電腦,就跟我前面案例提及的平板電腦,提供這樣的解決方案,幫助貧困地區(qū)的人們使用到GPU加速,在醫(yī)療行業(yè)為邊遠地區(qū)的人民帶來新的希望。

  問題四

  秦智勇-北京微電子所-工程師

  醫(yī)療領(lǐng)域信息比較私密,訓(xùn)練怎樣解決數(shù)據(jù)源的問題?

  羅晟:這個問題問的非常好,醫(yī)療行業(yè)數(shù)據(jù)是比較私密的,怎么解決數(shù)據(jù)源的問題呢?其實我是這么理解的,首先在最開始訓(xùn)練的時候,會有各種各樣的開放的數(shù)據(jù)集,可以去使用。另一方面,也可以嘗試跟一些重要的醫(yī)療機構(gòu)進行合作,我相信隨著深度學(xué)習(xí)的發(fā)展,他們未來會需要用到深度學(xué)習(xí)的技術(shù),而通過合作,他們可以提供各種各樣的數(shù)據(jù),就像我前面的提到一個案例,美國的一個研究所,就在展開這樣的一個合作項目,去收集各樣各種各樣的數(shù)據(jù),并開放給大家,幫助大家把深度學(xué)習(xí)的技術(shù)更好的的應(yīng)用在醫(yī)療方面。

  問題五

  張承龍-中科院計算所-程序員

  醫(yī)療領(lǐng)域主要采用哪種深度學(xué)習(xí)模型,為什么這種模型效果要好,怎么進行小樣本學(xué)習(xí)?

  羅晟:深度學(xué)習(xí)模型有很多種,主要還是取決于應(yīng)用的領(lǐng)域。比如藥物發(fā)現(xiàn)領(lǐng)域,可能會用圖卷積的網(wǎng)絡(luò),兩種圖卷積的模型都可以使用。如果是一些文本的記錄,肯定會用到NLP以及相關(guān)的模型;而對于醫(yī)療圖片,目前來說比較前沿的都會用GAN(生成時對抗網(wǎng)絡(luò))來做,訓(xùn)練一個圖像分割器,以及一個生成器,來訓(xùn)練一個更好的模型。

  當(dāng)然對于medical image來說,現(xiàn)在是比較容易做的。但是因為GAN有一個很大的問題,就是訓(xùn)練比較難。對于圖像分割,用FCN可以取得一個好的效果。小樣本的學(xué)習(xí),可以通過數(shù)據(jù)增強的方式,把數(shù)據(jù)集擴大,同時訓(xùn)練時不要選擇太過復(fù)雜的網(wǎng)絡(luò),以避免一些問題,同時也可以進行一些數(shù)據(jù)的收集,以便在未來獲得一個通用性更強的模型。

  問題六

  潘宇-北航-微電子專業(yè)學(xué)生

  目前要實現(xiàn)深度學(xué)習(xí)在醫(yī)療領(lǐng)域更好的應(yīng)用還有哪些問題需要解決

  羅晟:我覺得有非常多的問題需要解決,比如拿到了數(shù)據(jù)如何解釋。很多年前我在跟清華的一個教授合作的時候,使用一些醫(yī)療的信息,比如用深度學(xué)習(xí)去挖掘診脈的信息,怎么讓診脈的結(jié)果出來之后可以做判斷?之前去拍MI和CT照片的時候,為什么醫(yī)生可以說這樣是有問題的,那樣是沒問題的呢?

  我相信在當(dāng)時也是通過數(shù)據(jù)統(tǒng)計的方法,因為有些病人MI和CT的照片里面有這樣的情況,所以我們就理解這個地方有這樣的問題。對深度學(xué)習(xí)或者在醫(yī)療行業(yè)做medical image來說,解決這個問題很簡單,我們能夠?qū)ψ詈蟮慕Y(jié)果給出一定的解釋。不管是經(jīng)驗也好,還是怎樣,我們能夠把它還原成類似MRI的照片從而告訴醫(yī)生這個地方是有問題的,通過這樣的方式,把可解釋性解決。從另一個方面就是我們的技術(shù)還有更多方面需要挖掘,在藥物發(fā)現(xiàn)里面怎么去做進一步的加速,在診斷系統(tǒng)里面,怎樣更好的提高系統(tǒng)的準(zhǔn)確性等,這些都是未來技術(shù)需要去解決的,也需要我們?nèi)橹Α?/p>

  問題七

  喬冠超-電子科技大學(xué)-微電子專業(yè)學(xué)生

  深度學(xué)習(xí)在醫(yī)療領(lǐng)域的應(yīng)用在技術(shù)方面和其他領(lǐng)域有什么區(qū)別?主要是算法的創(chuàng)新還是硬件平臺的創(chuàng)新?

  羅晟:從技術(shù)根本來說,很多領(lǐng)域,比如圖片與圖像領(lǐng)域是一樣的,沒有太多的區(qū)別,在深度學(xué)習(xí)領(lǐng)域,我們談?wù)摰氖峭ㄓ眯偷哪P?,雖然不是通用人工智能。像前面的例子,一個模型可以預(yù)測七十八種疾病,而之前只能識別一種,這樣一個通用的模型最重要一點就是數(shù)據(jù),能提供這樣的數(shù)據(jù),就需要一些數(shù)據(jù)的創(chuàng)新,也需要算法的創(chuàng)新和更強的算力。

  因為更多的數(shù)據(jù),意味著需要更強的算力來支撐計算,有更好的模型能夠提供更好的精確性,但是在一定程度上模型的復(fù)雜度肯定是在增加的,也是需要更大的算力來支持的。所以更強的算

  力能夠保證可以去做一些迭代和測試,從而推動模型的發(fā)展,收集更多的數(shù)據(jù),其實三者是相輔相成的。

  問題八

  劉汝洲-北京精真估-NLP技術(shù)部負責(zé)人

  NLP在疾病診斷方面有哪些落地的應(yīng)用

  羅晟:前面已經(jīng)講過關(guān)于NLP相關(guān)內(nèi)容,可以用NLP對一些病例的信息分析,對于病例的分析主要有兩個方面,首先我們可以拿到一些疾病的信息,去做預(yù)測,當(dāng)我們拿到一個最新的病人信息,把它放到模型里面,可以通過病歷記錄訓(xùn)練出一個模型,從而去判斷是否有潛在的疾病風(fēng)險;另一方面,拿到這些信息之后,跟真實的信息進行比對,可以去做些推薦,獲得更好的推薦結(jié)果,這兩方面也已經(jīng)落地應(yīng)用了。

  當(dāng)然還有很多,現(xiàn)在有各種各樣的機器人在醫(yī)院里面提供服務(wù),比如問診機器人,去醫(yī)院就診時,可以去問一下機器人,它會根據(jù)你的描述給出相應(yīng)的診斷反饋,這些都是未來需要提供的,也有一些項目已經(jīng)落地,我覺得是非常好的?,F(xiàn)在的三甲醫(yī)院是非常擁擠的,有了最開始的定位,才能更準(zhǔn)確的選擇相應(yīng)的科室,或者根據(jù)這些基本信息推薦解決方案等。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。