12 月 17 日消息,人工智能(AI)日趨一日地在醫(yī)療領域變得越來越重要,尤其是在醫(yī)學影像分析方面。醫(yī)生們可以通過 AI 更快更準地診斷疾病,制定治療方案。而要讓 AI 更聰明,就需要大量高質量的醫(yī)學影像數據來“喂養(yǎng)”它,也就是進行訓練。
然而,由于患者隱私保護、高昂的數據標注成本等多種因素,要獲得高質量、多樣化的醫(yī)學影像數據往往存在障礙。為此,近年來,研究者們開始探索使用生成式 AI 技術合成醫(yī)學影像數據,以此來擴充數據。
為了解決這個問題,北京大學與溫州醫(yī)科大學的研究團隊建立一種生成式多模態(tài)跨器官醫(yī)學影像基礎模型(MINIM),可基于文本指令以及多器官的多種成像方式,合成海量的高質量醫(yī)學影像數據,為醫(yī)學影像大模型的訓練、精準醫(yī)療及個性化診療等提供有力技術支持。
該成果已于 12 月 11 日發(fā)表在國際權威期刊《自然?醫(yī)學》上(附 DOI:10.1038 / s41591-024-03359-y)。
簡單來說,MINIM 就像一個“圖像生成器”,它可以通過 AI 技術,根據文字描述,自動合成出海量的醫(yī)學影像數據,包括 CT、X 光、磁共振等等,涵蓋了各種器官。
北京大學未來技術學院助理研究員王勁卓介紹說,“目前公開的醫(yī)學影像數據非常有限,我們建立的生成式模型有望解決訓練數據不夠的問題。”
這些合成的影像數據有多逼真呢?研究團隊利用多種器官在 CT、X 光、磁共振等不同成像方式下的高質量影像文本配對數據進行訓練,最終生成海量的醫(yī)學合成影像,其在圖像特征、細節(jié)呈現(xiàn)等多方面都與真實醫(yī)學圖像高度一致。
實驗結果表明,使用 MINIM 生成的合成數據,在醫(yī)生主觀評價和客觀檢測標準上都達到了國際領先水平。在真實數據的基礎上,使用 20 倍合成數據在眼科、胸科、腦科和乳腺科的多個醫(yī)學任務準確率平均可提升 12% 至 17%。
王勁卓還表示,MINIM 生成的合成數據應用前景廣闊,既可以單獨用來訓練醫(yī)學影像大模型,也可以和真實數據混合使用,從而提高模型在實際應用中的性能,推動 AI 在醫(yī)學和健康領域更廣泛的應用。
目前,在疾病診斷、醫(yī)學報告生成和自監(jiān)督學習等關鍵領域,利用 MINIM 合成數據進行訓練已展現(xiàn)出顯著的性能提升。