人工智能相關(guān)文章

基于偽觸發(fā)詞的并行預(yù)測(cè)篇章級(jí)事件抽取方法

篇章級(jí)事件抽取一般將事件抽取任務(wù)分為候選實(shí)體識(shí)別、事件檢測(cè)和論元識(shí)別3個(gè)子任務(wù),然后采用級(jí)聯(lián)的方式依次進(jìn)行,這樣的方式會(huì)造成誤差傳遞;另外,現(xiàn)有的大多數(shù)模型在解碼事件時(shí),對(duì)事件數(shù)量的預(yù)測(cè)隱含在解碼過程中,且只能按照預(yù)定義的事件順序及預(yù)定義的角色順序預(yù)測(cè)事件論元,使得先抽取的事件并沒有考慮到后面抽取的事件。針對(duì)以上問題提出一種多任務(wù)聯(lián)合的并行預(yù)測(cè)事件抽取框架。首先,使用預(yù)訓(xùn)練語言模型作為文檔句子的編碼器,檢測(cè)文檔中存在的事件類型,并使用結(jié)構(gòu)化自注意力機(jī)制獲取偽觸發(fā)詞特征,預(yù)測(cè)每種事件類型的事件數(shù)量;然后將偽觸發(fā)詞特征與候選論元特征進(jìn)行交互,并行預(yù)測(cè)每個(gè)事件對(duì)應(yīng)的事件論元,在大幅縮減模型訓(xùn)練時(shí)間的同時(shí)獲得與基線模型相比更好的性能。最終事件抽取結(jié)果F1值為78%,事件類型檢測(cè)子任務(wù)F1值為98.7%,事件數(shù)量預(yù)測(cè)子任務(wù)F1值為90.1%,實(shí)體識(shí)別子任務(wù)F1值為90.3%。

發(fā)表于:4/29/2024