英特爾和賓夕法尼亞大學(xué)醫(yī)學(xué)院正在研究一個龐大的、跨機構(gòu)的人工智能,它將幫助識別腦瘤,但不會逾越嚴(yán)格的醫(yī)療隱私規(guī)則。這款跨機構(gòu)人工智能將使用一種被稱為 “聯(lián)合學(xué)習(xí) ”的技術(shù),因為它跨越了29個不同的醫(yī)療和研究機構(gòu)。
利用疾病數(shù)據(jù)集訓(xùn)練人工智能,使其能夠讓大量的病例充當(dāng)過濾器,這在很多方面都顯示出了有效的作用。然而,其缺點是,為了獲得最有效的性能,它需要的數(shù)據(jù)集必須相當(dāng)可觀。單個醫(yī)療機構(gòu)或研究實驗室可能會難以為正在開發(fā)的機器學(xué)習(xí)提供所需的所有信息。
賓夕法尼亞大學(xué)生物醫(yī)學(xué)圖像計算和分析中心(CBICA)的Spyridon Bakas博士解釋說:“機器學(xué)習(xí)培訓(xùn)需要大量和多樣化的數(shù)據(jù),盡管從技術(shù)上來講并不是什么挑戰(zhàn),但現(xiàn)實是健康隱私法律(無論是HIPAA,GDPR還是其他法律)都限制了可以共享的內(nèi)容,這是大數(shù)據(jù)處理的瓶頸?!?/p>
英特爾和賓夕法尼亞醫(yī)學(xué)院對此的答案是聯(lián)合學(xué)習(xí)。與其共享單個病人的記錄,不如將一個加密的機器學(xué)習(xí)模型分發(fā)到每個參與的機構(gòu)中。它在每臺計算機上的安全區(qū)域中解密,并接受本地數(shù)據(jù)訓(xùn)練。隨后僅將模型更新與負責(zé)匯總模型的組織共享。由于患者數(shù)據(jù)永遠不會離開單獨的機構(gòu),因此更具隱私化,同時重新訓(xùn)練后的模型數(shù)據(jù)更小,因此在數(shù)據(jù)傳輸方面也更加高效。
賓夕法尼亞州醫(yī)學(xué)院和來自美國、加拿大、英國、德國、荷蘭、瑞士和印度的29家醫(yī)療和研究機構(gòu)將利用這個運行在英特爾硬件上的聯(lián)合學(xué)習(xí)系統(tǒng),合作研究出一種利用AI識別腦腫瘤的方法。今年,該聯(lián)盟將開始開發(fā)算法,從國際腦腫瘤分割(BraTS)數(shù)據(jù)集的大幅擴展版本中識別腦腫瘤。這個聯(lián)盟將允許醫(yī)學(xué)研究人員獲得大量的醫(yī)療數(shù)據(jù),同時保護這些數(shù)據(jù)的安全性。
美國腦瘤協(xié)會表示,2020年將有近8萬人被確診為腦瘤。在原始MRI數(shù)據(jù)上訓(xùn)練之后,當(dāng)從掃描中識別膠質(zhì)瘤腦腫瘤時,英特爾和賓夕法尼亞州醫(yī)學(xué)會開發(fā)的AI模型可以達到99%的準(zhǔn)確率。