融入翻譯記憶庫的法律領(lǐng)域神經(jīng)機(jī)器翻譯方法*
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大?。?span>3666 K
標(biāo)簽: 神經(jīng)機(jī)器翻譯 語義信息 結(jié)構(gòu)信息
所需積分:0分積分不夠怎么辦?
文檔介紹:面向法律領(lǐng)域的神經(jīng)機(jī)器翻譯對于合同文本翻譯等應(yīng)用場景具有重要價(jià)值。由于法律領(lǐng)域雙語對齊語料稀缺,翻譯效果還不理想。針對該問題,目前有效的方法是融入翻譯記憶或翻譯模版等外部信息,但法律領(lǐng)域的文本多具有固定的表達(dá)結(jié)構(gòu)且用詞準(zhǔn)確規(guī)范,在翻譯記憶庫中同時(shí)利用翻譯結(jié)構(gòu)信息和語義信息能夠進(jìn)一步提升法律領(lǐng)域翻譯性能?;诖耍岢鲆环N融入翻譯記憶庫的法律領(lǐng)域機(jī)器翻譯方法。提出了一種新的法律領(lǐng)域翻譯記憶庫,首先基于語義和結(jié)構(gòu)信息的相似性訓(xùn)練跨語言檢索模型以充分利用單語數(shù)據(jù),然后從翻譯記憶庫中檢索與輸入源句相關(guān)的一組翻譯記憶和翻譯模版,進(jìn)而引導(dǎo)翻譯模型生成目標(biāo)句子。實(shí)驗(yàn)表明,在MHLAW數(shù)據(jù)集上,提出的方法可以使譯文較基線模型提升1.28個(gè)BLEU點(diǎn)。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。