紐約大學(NYU)醫(yī)學院與SRI International的研究人員采用統(tǒng)計機器學習(statistical machine learning)技術:隨機森林(random forest)算法與語音分析(speech analysis)平臺SenSay Analytics的部分功能,開發(fā)人工智能(AI)語音分析工具以支持創(chuàng)傷后壓力癥候群(PTSD)的臨床診斷。
分析語音的頻率、韻律、聲調、發(fā)音特征,可協(xié)助診斷創(chuàng)傷后壓力癥候群
據(jù)NYU Langone Health報導,PTSD的患者在遭逢觸發(fā)事件時會經(jīng)歷強烈而持續(xù)的精神緊張癥狀,全球逾70%的成年人一生中曾經(jīng)歷創(chuàng)傷事件,而部分艱困國家中的人民約12%正苦于PTSD。最常使用的診斷方式是透過臨床面談或自陳式(self-report)評估,不過兩者的結果都易受成見影響,因此必須找出可衡量、客觀、實際的PTSD發(fā)展指標,但迄今進展緩慢。
2019年4月22日NYU研究團隊以在線方式發(fā)表于Depression and Anxiety期刊的「美國退伍軍人PTSD語音標記(Speech-based markers for posttraumatic stress disorder in US veterans)」研究報告指出,分析退伍軍人說話的語音特征可用于協(xié)助診斷PTSD,NYU發(fā)展的AI語音分析軟件辨識PTSD患者的成功率達89%。
語音工具可提供非侵入式、低成本、可遠距操作等優(yōu)勢,因此非常適合用于自動化診斷系統(tǒng),例如集成至診斷PTSD的智能型手機App。NYU醫(yī)學院發(fā)表的研究并未探究導致PTSD的成因與機制,而是基于創(chuàng)傷事件會改變人腦控制情緒與肌肉張力的回路,進而影響其語音特征的理論,來開發(fā)PTSD臨床診斷AI工具。
運用隨機森林算法發(fā)展的AI程序,能夠基于實例學習處理個體分類,所建立的決策規(guī)則與數(shù)學模式,可隨訓練資料量增加而強化決策準確性。較不清晰的談話、沒有生氣且刺耳的語調,長久以來即被視為有助于辨識與診斷PTSD,NYU醫(yī)學院的研究團開發(fā)的隨機森林程序可為特定語音特征模式與PTSD癥狀建立連結作為診斷依據(jù)。
研究人員首先錄制數(shù)小時包括53名在服役時罹患PTSD癥狀與78名無PTSD癥狀的伊拉克與阿富汗退伍軍人的標準診斷面談,作為臨床醫(yī)師施行的PTSD衡量標準(Clinician-Administered PTSD Scale;CAPS),接著將其輸入結合隨機森林與SRI International語音技術的AI軟件,從診斷面談中篩選出各種模式,共計擷取出40,526個語音相關的特征。
蘋果(Apple)的 Siri是由SRI International所開發(fā),NYU醫(yī)學院研究團隊的AI PTSD診斷工具運用的語音分析技術,即是SRI International的語音分析平臺SenSay Analytics的部分功能。未來NYU醫(yī)學院研究團隊計畫用更多資料訓練AI語音工具以強化其功能,并進一步以獨立的樣本進行功能驗證,最終將向美國政府申請批準應用于醫(yī)療院所的臨床實際病例。
SenSay Analytics語音分析平臺分析語詞時會結合語音的頻率、韻律、聲調,以及發(fā)音的特征以推斷說話者的溝通質量、認知、情緒、生理與心理健康、情緒等狀態(tài),相關技術已被Ambit、Decoded Health、Oto等新創(chuàng)應用于各種產(chǎn)業(yè)應用。NYU的研究團隊成員包括NYU醫(yī)學院的教授、NYU精神醫(yī)學系與SRI International的研究人員。
NYU這項研究計畫是由美國陸軍醫(yī)學研究采購活動(U.S. Army Medical Research Acquisition Activity;USAMRAA)組織及遠距醫(yī)療與先進技術研究中心(Telemedicine and Advanced Technology Research Center;TATRC)的W81XWH-ll-C-0004,以及Steven and Alexandra Cohen Foundation所資助。