基于增強(qiáng)語義信息理解的場景圖生成
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大小:4006 K
標(biāo)簽: 場景圖生成 圖像裁剪 語義轉(zhuǎn)化
所需積分:0分積分不夠怎么辦?
文檔介紹:場景圖生成(SGG)任務(wù)旨在檢測圖像中的視覺關(guān)系三元組,即主語、謂語、賓語,為場景理解提供結(jié)構(gòu)視覺布局。然而,現(xiàn)有的場景圖生成方法忽略了預(yù)測的謂詞頻率高但卻無信息性的問題,從而阻礙了該領(lǐng)域進(jìn)步。為了解決上述問題,提出一種基于增強(qiáng)語義信息理解的場景圖生成算法。整個模型由特征提取模塊、圖像裁剪模塊、語義轉(zhuǎn)化模塊、拓展信息謂詞模塊四部分組成。特征提取模塊和圖像裁剪模塊負(fù)責(zé)提取視覺特征并使其具有全局性和多樣性。語義轉(zhuǎn)化模塊負(fù)責(zé)將謂詞之間的語義關(guān)系從常見的預(yù)測中恢復(fù)信息預(yù)測。拓展信息謂詞模塊負(fù)責(zé)擴(kuò)展信息謂詞的采樣空間。在數(shù)據(jù)集VG和VG-MSDN上與其他方法進(jìn)行比較,平均召回率分別達(dá)到59.5%和40.9%。該算法可改善預(yù)測出來的謂詞信息性不足問題,進(jìn)而提升場景圖生成算法的性能。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。