大多數(shù)人第一次了解IBM的機(jī)器人沃森,可能源于2011年美國(guó)熱門(mén)電視智力問(wèn)答節(jié)目——《危險(xiǎn)邊緣》(Jeopardy!)。當(dāng)時(shí),這個(gè)神秘的人工智能選手戰(zhàn)勝了這個(gè)節(jié)目史上最強(qiáng)的人類(lèi)對(duì)手。過(guò)去數(shù)年間,隨著人工智能在醫(yī)療健康領(lǐng)域的應(yīng)用成為熱點(diǎn),醫(yī)療領(lǐng)域即將準(zhǔn)備迎來(lái)一場(chǎng)大變革。IBM、微軟、谷歌等大企業(yè)紛紛加大投入,并取得了顯著的進(jìn)步。
本月,沃森正式進(jìn)入中國(guó)的21家醫(yī)院,并在日本為癌癥病人做出診斷。也許距離我們接受一名機(jī)器人醫(yī)生的“坐診”已經(jīng)為時(shí)不遠(yuǎn)。
正當(dāng)國(guó)內(nèi)醫(yī)療專(zhuān)家開(kāi)始嘗試使用深度學(xué)習(xí)來(lái)挖掘醫(yī)療數(shù)據(jù)時(shí),IBM宣布其重金研發(fā)的智能認(rèn)知系統(tǒng)沃森(Watson)已登陸中國(guó)。根據(jù)IBM宣布的計(jì)劃,沃森將與國(guó)內(nèi)21所醫(yī)院進(jìn)行合作,幫助醫(yī)生為腫瘤患者制定更好的個(gè)性化治療方案。
據(jù)IBM的消息,現(xiàn)階段沃森可以對(duì)醫(yī)學(xué)文獻(xiàn)進(jìn)行打分與評(píng)級(jí),并迅速整理醫(yī)患的醫(yī)療記錄,提高醫(yī)生的診療效率。沃森對(duì)海量數(shù)據(jù)進(jìn)行分析,從而幫助醫(yī)生為患者提供高質(zhì)量、個(gè)體化的循證癌癥治療方案。它還可以為醫(yī)生與患者帶來(lái)世界頂級(jí)的癌癥治療專(zhuān)業(yè)知識(shí)。
本月初,沃森幫助一位在日本東京大學(xué)醫(yī)學(xué)院治療的60歲女性患者診斷出了罕見(jiàn)的白血病類(lèi)型。據(jù)東大醫(yī)學(xué)院研究人員對(duì)媒體的說(shuō)法,沃森通過(guò)比對(duì)2000萬(wàn)份癌癥研究論文,在短短10分鐘內(nèi)得出了診斷結(jié)果。
作為認(rèn)知計(jì)算系統(tǒng)的沃森于2007年問(wèn)世,它取名自IBM的首任執(zhí)行官托馬斯·沃森(Thomas Watson)。過(guò)去九年間,沃森不僅是智力問(wèn)答的佼佼者,還推動(dòng)著醫(yī)療健康、金融服務(wù)、零售和教育等行業(yè)的發(fā)展以及未來(lái)轉(zhuǎn)型。它可從各種結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù)源中學(xué)習(xí)和積累知識(shí),還可以在大數(shù)據(jù)中篩選信息,并對(duì)其進(jìn)行評(píng)分。
在醫(yī)療健康領(lǐng)域,它可以在幾分鐘內(nèi)搜索大量的信息,給病患提供精準(zhǔn)的診療方案。自2014年起,IBM公司已將醫(yī)療健康作為沃森的主打牌。目前,沃森已經(jīng)與包括安德森癌癥中心(MD Anderson Cancer Center)、紐約紀(jì)念斯隆-凱特琳癌癥中心(Memorial Sloan-Kettering Cancer Center)等在內(nèi)的頂尖癌癥中心建立合作關(guān)系。通過(guò)大數(shù)據(jù)整合,沃森正逐步成長(zhǎng)為日臻完美的醫(yī)學(xué)診斷專(zhuān)家。以它為代表的人工智能,將推動(dòng)醫(yī)療健康領(lǐng)域的轉(zhuǎn)型,給人類(lèi)帶來(lái)巨大的社會(huì)、經(jīng)濟(jì)以及政治效應(yīng)。
沃森轉(zhuǎn)戰(zhàn)醫(yī)療健康:既上醫(yī)學(xué)課程,又閱讀文獻(xiàn)
眾所周知,IBM公司以前研發(fā)的超級(jí)國(guó)際象棋電腦——深藍(lán),具有極強(qiáng)的計(jì)算能力,它有32個(gè)“大腦”,每秒鐘可以計(jì)算2億步,存儲(chǔ)了一百多年來(lái)超過(guò)兩百萬(wàn)局優(yōu)秀棋手的棋局。然而,深藍(lán)無(wú)法處理自然語(yǔ)言,也無(wú)法識(shí)別非結(jié)構(gòu)化的數(shù)據(jù)源。和深藍(lán)相比,沃森代表了認(rèn)知計(jì)算時(shí)代一個(gè)嶄新的計(jì)算模型,它可以閱讀并理解自然語(yǔ)言,提出假設(shè),并可尋求證據(jù)支持或反對(duì)假設(shè),還可以不斷地學(xué)習(xí)和進(jìn)化。如果說(shuō)深藍(lán)留在了電腦的舒適區(qū)域,那么沃森則走進(jìn)了一個(gè)看似讓機(jī)器尷尬的領(lǐng)域,因?yàn)樗鼑L試像人一樣工作,甚至在某些方面比人做得更好。
2011年,正值IBM創(chuàng)立100周年之際,沃森參加了哥倫比亞廣播公司的《危險(xiǎn)邊緣》(Jeopady!)節(jié)目,這檔智力問(wèn)答節(jié)目的問(wèn)題包羅萬(wàn)象,節(jié)目的規(guī)則是答對(duì)問(wèn)題得分,答錯(cuò)倒扣分。為了參加比賽,沃森不僅需要聽(tīng)懂人的自然語(yǔ)言,還需要分析語(yǔ)言背后的語(yǔ)義,在內(nèi)置數(shù)據(jù)庫(kù)中進(jìn)行搜索,找到可能的多種答案,再對(duì)可能的答案一一進(jìn)行評(píng)分。評(píng)分過(guò)后,沃森需要選擇3個(gè)有可能的答案,當(dāng)其中一個(gè)答案評(píng)估的可能性超過(guò)50%的時(shí)候,沃森便會(huì)按下?lián)尨疰I進(jìn)行搶答,最終在人機(jī)對(duì)抗的比賽中,聰明的沃森打敗了該節(jié)目最高獎(jiǎng)金得主布拉德·魯特爾(Brad Rutter)和連勝紀(jì)錄保持者肯·詹寧斯(Ken Jennings),取得了冠軍。
嶄露頭角之后,這位全美“最聰明的人”開(kāi)始轉(zhuǎn)戰(zhàn)醫(yī)療健康領(lǐng)域,它花了兩年的時(shí)間“修讀”醫(yī)學(xué)院課程,像人類(lèi)那樣做必要的知識(shí)儲(chǔ)備。然而在起步階段,沃森也歷經(jīng)了不少枯燥以及低技術(shù)含量的工作過(guò)程。安德森癌癥中心以及IBM的研發(fā)團(tuán)隊(duì)花了好幾個(gè)月,向沃森輸入大量的病患信息,此類(lèi)信息包括他們的姓名、年齡、性別、藥物史、醫(yī)學(xué)檢測(cè)報(bào)告以及病患的就醫(yī)筆記等。一開(kāi)始,沃森在語(yǔ)言識(shí)別上遇到了對(duì)人類(lèi)來(lái)說(shuō)很基本,對(duì)機(jī)器來(lái)說(shuō)卻很難的問(wèn)題,譬如,當(dāng)需要解讀醫(yī)生輸入的“冷”(cold)的信息時(shí),沃森無(wú)法識(shí)別“冷”在語(yǔ)境中,指代的到底是溫度低還是一種流感病毒。又或者,它無(wú)法解讀“T2”指代的是磁共振成像,還是癌癥發(fā)展的一個(gè)階段。所以,每一項(xiàng)信息的輸入,都需要相關(guān)人員向沃森進(jìn)行核實(shí),需要他們手動(dòng)輸入被認(rèn)為是“正確”的診斷。
此外,為了擴(kuò)充沃森的知識(shí)量,幫助其更好地為病患進(jìn)行診斷,科學(xué)家們讓沃森“閱讀”了大量的相關(guān)領(lǐng)域的頂尖文獻(xiàn),并幫助沃森學(xué)會(huì)如何在海量的信息中篩選出有用的信息,進(jìn)行總結(jié),提出可能性的報(bào)告。
不同于人類(lèi)做決策時(shí)容易受到外在環(huán)境和情緒的影響,沃森“冷靜”、“理智”地在海量的數(shù)據(jù)源中,為醫(yī)生快速尋找適合病人的診療方式,給出最佳的推薦。截至2015年,IBM已經(jīng)和北美14個(gè)癌癥中心建立合作伙伴關(guān)系,成為診斷癌癥的一個(gè)新型輔助途徑。
沃森背后的技術(shù)革新
IBM 的深度開(kāi)放域問(wèn)答系統(tǒng)工程(Deep QA)是沃森背后的技術(shù)支持。深度開(kāi)放域問(wèn)答系統(tǒng)工程的發(fā)展,解決了臨床決策支持系統(tǒng)多年以來(lái)突破不了的瓶頸。
近40年來(lái),臨床決策支持系統(tǒng)致力于改善臨床醫(yī)生知識(shí)的局限性,減少人為疏忽,從而幫助病人找到最優(yōu)的診療決策。它一般包括診斷輔助工具(Diagnostic Support Tools)和治療輔助工具(Treatment Support Tools)。第一代的臨床決策支持系統(tǒng)(Clinical Decision Support System)主要致力于診斷輔助,然而解決方案的信息量太多,往往需要醫(yī)生花費(fèi)很多的時(shí)間閱讀,所以在臨床上并不具備實(shí)用性。第二代臨床決策支持系統(tǒng)致力于提高使用效率,它可以通過(guò)概括醫(yī)生的筆記和醫(yī)療研究文獻(xiàn)來(lái)為醫(yī)生提供診斷建議,然而它仍無(wú)法在信息量很小的時(shí)候給出好的診斷,提取速度也非常慢。
這兩代臨床決策支持系統(tǒng)存在的問(wèn)題,在沃森剛剛步入“職場(chǎng)”之際,哪怕是強(qiáng)大如谷歌的搜索引擎,也很難解決。這是因?yàn)椋?dāng)時(shí)的谷歌不能從非結(jié)構(gòu)化的信息中抓取問(wèn)題。醫(yī)生需要把查詢的問(wèn)題總結(jié)成關(guān)鍵字組合,輸入谷歌來(lái)尋求答案。其次,當(dāng)谷歌按照結(jié)果的相關(guān)度查找到大量文獻(xiàn)的時(shí)候,醫(yī)生需要對(duì)此進(jìn)行一一閱讀,并且將重點(diǎn)加以概括從而得出結(jié)論,所以當(dāng)時(shí)谷歌遭遇了與前兩代臨床決策支持系統(tǒng)一樣的問(wèn)題。
事實(shí)上,IBM的深度開(kāi)放域問(wèn)答系統(tǒng)工程是在類(lèi)似谷歌的搜索引擎之上,加上自然語(yǔ)言閱讀能力和語(yǔ)義解析能力。谷歌依賴(lài)人類(lèi),IBM 的深度開(kāi)放域問(wèn)答系統(tǒng)工程使得沃森可以靠自己解決問(wèn)題。它可以支持沃森閱讀電子病歷、化驗(yàn)結(jié)果、醫(yī)學(xué)影像、視頻以及病患傳感器(如可穿戴醫(yī)療設(shè)備),從而生成假設(shè),收集大量證據(jù),最后進(jìn)行分析和評(píng)估。
沃森解決問(wèn)題的流程圖:
1.沃森總結(jié)自然語(yǔ)言,生成一個(gè)搜索問(wèn)題;
2.沃森嵌入式搜索引擎搜索一個(gè)大型文檔的知識(shí)庫(kù)找到相關(guān)文件;
3.沃森將搜索結(jié)果總結(jié)成自然語(yǔ)言,并且生成可能的解答(假設(shè)):
a)對(duì)于每個(gè)假設(shè),沃森構(gòu)建并啟動(dòng)其他搜索以收集證據(jù)支持這一假設(shè);
b)沃森的嵌入式搜索引擎為每一個(gè)假設(shè)搜索論據(jù);
c)沃森總結(jié)搜索結(jié)果,并對(duì)每一個(gè)結(jié)果進(jìn)行評(píng)分;d)給予每一個(gè)假設(shè)的支持論據(jù),沃森給出一個(gè)評(píng)分。
4.所有的假設(shè)被轉(zhuǎn)化成一張答案列表,返還給用戶。
在以上提及的4個(gè)步驟中,沃森對(duì)自然語(yǔ)言的處理體現(xiàn)在步驟1,3和3c,沃森的搜索能力體現(xiàn)在2,3a和3b,它的評(píng)分能力體現(xiàn)在3d和4。
作者:袁鈞濤(Michael J. Yuan), 系Ringful Health 首席科學(xué)家。
上圖總結(jié)了沃森解決問(wèn)題的流程。無(wú)論是對(duì)自然語(yǔ)言進(jìn)行總結(jié),還是對(duì)收集到的證據(jù)進(jìn)行評(píng)分,沃森都需要對(duì)非結(jié)構(gòu)化的語(yǔ)言文本進(jìn)行處理。它的內(nèi)置的基于非結(jié)構(gòu)化信息的管理架構(gòu)(Apache UIMA)負(fù)責(zé)執(zhí)行和解決用戶提出的任務(wù)。對(duì)于接受到的每一個(gè)任務(wù),沃森都會(huì)開(kāi)啟多個(gè)搜索引擎,并且使用多樣的搜索技術(shù),從內(nèi)置知識(shí)庫(kù)中找出假設(shè)和佐證。沃森使用的搜索技術(shù)包括詞頻排名結(jié)果(Apache Lucene),貝葉斯網(wǎng)絡(luò)排名結(jié)果(Indri),以及術(shù)語(yǔ)和文檔之間的搜索關(guān)系(SPARQL)。
據(jù)Ringful Health 首席科學(xué)家袁鈞濤博士介紹,近年來(lái),沃森在已有的深度開(kāi)放域問(wèn)答系統(tǒng)工程之上,又加入了很多“傳統(tǒng)”的機(jī)器學(xué)習(xí)和數(shù)據(jù)處理技術(shù)。應(yīng)用在癌癥診療領(lǐng)域,它不單單可以對(duì)醫(yī)生輸入的問(wèn)題提出多種診療建議,還可以向醫(yī)生解釋各類(lèi)診療決策的異同,以便醫(yī)生作出最后的判斷。
除了沃森,人工智能近年內(nèi)正在極大地推進(jìn)醫(yī)療領(lǐng)域的發(fā)展及變革,各大科技巨頭正陸續(xù)向醫(yī)療健康領(lǐng)域進(jìn)軍。如微軟近日發(fā)現(xiàn),分析搜索引擎可用來(lái)推測(cè)用戶是否有患胰腺癌的前兆;微軟還嘗試讓人工智能和機(jī)器學(xué)習(xí)用于分析患者的醫(yī)學(xué)掃描圖像,例如用于掃描并計(jì)算出腦腫瘤的大小,分析腫瘤組織成分,然后給出最佳治療方案;谷歌發(fā)布了世界上準(zhǔn)確度最高的自然語(yǔ)言解析器SyntaxNet;谷歌DeepMind正計(jì)劃將人工智能算法更多地應(yīng)用于醫(yī)療健康領(lǐng)域,包括在未來(lái)五年將機(jī)器學(xué)習(xí)技術(shù)用于處理英國(guó)國(guó)家醫(yī)療服務(wù)系統(tǒng)(NHS)的數(shù)據(jù)等。
人工智能給醫(yī)療健康帶來(lái)深刻影響
沃森在醫(yī)療領(lǐng)域的迅猛發(fā)展,帶來(lái)了多重的思考。一方面,它正在以驚人的速度成為完美的醫(yī)學(xué)診斷專(zhuān)家,似乎具有在未來(lái)替代實(shí)體醫(yī)生的可能性;另一方面,對(duì)于它是否有可能取代實(shí)體醫(yī)生,直接給病患帶去一對(duì)一的精準(zhǔn)治療的質(zhì)疑聲也不斷傳出。作為醫(yī)生,如何看待和接受沃森,作為病患,又是否可以接受一個(gè)機(jī)器人的坐診?
部分觀點(diǎn)認(rèn)為,沃森的出現(xiàn),將很有可能顛覆醫(yī)患關(guān)系的主體。因?yàn)闄C(jī)器人具有比人腦更多的數(shù)據(jù)容量,以及更為理性的判斷,它將可能給病患帶來(lái)更精準(zhǔn)的治療。比外,醫(yī)療機(jī)器人的普及,將有可能弱化不同地區(qū)醫(yī)療水平的不均給病患帶來(lái)的差異,醫(yī)療欠發(fā)達(dá)地區(qū)的病患將得到更多的診療機(jī)會(huì)。
然而,與之相反的觀點(diǎn)卻認(rèn)為,將沃森定位為醫(yī)生的診斷輔助工具更為合適,因?yàn)殡m然它在某些方面顯示出優(yōu)于醫(yī)生的能力,但尚不足以完全取代醫(yī)生。維克森林大學(xué)醫(yī)學(xué)院的助理教授胡塞恩醫(yī)生(Iltifat Husain)表示,雖然沃森很大程度上幫助病人提升他們的醫(yī)療質(zhì)量,但機(jī)器缺少人的本能和同理心。它無(wú)法察言觀色,無(wú)法在人的言談舉止中捕捉對(duì)診斷可能起關(guān)鍵作用的隱藏信息。而這些隱藏信息,恰恰可能是確診的關(guān)鍵。
目前,沃森已經(jīng)將診斷領(lǐng)域拓展到對(duì)糖尿病、肺癌的輔助診斷。無(wú)論沃森是否會(huì)取代實(shí)體醫(yī)生,在可預(yù)見(jiàn)的未來(lái),可以肯定的是,以它為代表的認(rèn)知計(jì)算系統(tǒng),結(jié)合大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù),將帶動(dòng)醫(yī)療健康領(lǐng)域醫(yī)療模式的發(fā)展與轉(zhuǎn)型,為患者及醫(yī)生帶去更多疾病診療的福音。