《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計(jì)應(yīng)用 > 基于匹配層融合的識(shí)別算法研究與實(shí)現(xiàn)
基于匹配層融合的識(shí)別算法研究與實(shí)現(xiàn)
2020年電子技術(shù)應(yīng)用第7期
李傲梅,胡正豪,周川川
陸軍炮兵防空兵學(xué)院 信息工程系,安徽 合肥230031
摘要: 提出一種基于音視頻匹配層自適應(yīng)加權(quán)融合的身份識(shí)別方法。在不同程度的噪聲情況下,圖像與聲音的識(shí)別率會(huì)隨噪聲的增強(qiáng)而降低,憑借單個(gè)生物模態(tài)的識(shí)別,難以達(dá)到很好的預(yù)測結(jié)果;而且兩種模態(tài)融合時(shí)的權(quán)值不同,融合系統(tǒng)的穩(wěn)定性效果也不同。采用雙模態(tài)的自適應(yīng)加權(quán)融合不僅可以有效地彌補(bǔ)不同生物模態(tài)識(shí)別之間的優(yōu)缺點(diǎn),而且可以自適應(yīng)選擇最優(yōu)的權(quán)值進(jìn)行決策。實(shí)驗(yàn)表明,該方法的理論推測成立,比單模態(tài)的身份識(shí)別具有更高的識(shí)別率與魯棒性。
中圖分類號(hào): TN06;TP391.4
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.191426
中文引用格式: 李傲梅,胡正豪,周川川. 基于匹配層融合的識(shí)別算法研究與實(shí)現(xiàn)[J].電子技術(shù)應(yīng)用,2020,46(7):57-59.
英文引用格式: Li Aomei,Hu Zhenghao,Zhou Chuanchuan. Research and implementation of recognition algorithm based on matching layer fusion[J]. Application of Electronic Technique,2020,46(7):57-59.
Research and implementation of recognition algorithm based on matching layer fusion
Li Aomei,Hu Zhenghao,Zhou Chuanchuan
Department of Information and Communication Engineering,Army and Artillery Air Defense Force College,Hefei 230031,China
Abstract: This paper proposes an adaptive weighted fusion based on audio-video matching layer.In the case of different degree of noise, the recognition degree of image and sound will decrease with the increase of noise.And the weight of the two modes is different, the stability effect of the fusion system is also different.The adaptive weighted fusion of two modes can not only make up the advantages and disadvantages of different biological modes, but also choose the optimal weight to make the decision.Experiments show that the proposed method is feasible and has higher recognition rate and robustness than single mode identification.
Key words : audio and video fusion;matching layer;adaptive weighting;identification;robustness

0 引言

    目前,人工智能迅速崛起,身份識(shí)別技術(shù)更是應(yīng)用在生活各個(gè)領(lǐng)域之中,如檢票、付款、登錄系統(tǒng)等。但是日常應(yīng)用的環(huán)境都是在條件較好的情況,并不滿足全天候嘈雜的復(fù)雜作戰(zhàn)環(huán)境,如在陰雨天或者夜晚光線不充足時(shí),人臉圖像的采集就會(huì)受到影響;在戰(zhàn)車艙內(nèi)進(jìn)行身份識(shí)別駕駛時(shí),會(huì)因?yàn)榘l(fā)動(dòng)機(jī)或炮火聲的影響,導(dǎo)致語音信號(hào)受噪聲干擾。所以,依靠任何一種單模態(tài)的身份識(shí)別都極易受到外部環(huán)境的影響。采用多模態(tài)的身份識(shí)別技術(shù)(如人臉、語音、指紋、虹膜等[1-3]),可以通過對(duì)來自多種傳感器信號(hào)的處理、分析、決策,彌補(bǔ)不同模態(tài)信息的不足,降低單一模態(tài)受干擾產(chǎn)生的誤差,得到更加可靠、準(zhǔn)確的結(jié)果。

    近年來,多模態(tài)的融合識(shí)別技術(shù)備受關(guān)注,一般情況下主要分為數(shù)據(jù)層、特征層、匹配層和決策層融合[4-5]。由于圖像屬于二維信號(hào),語音屬于一維信號(hào),數(shù)據(jù)層和特征層融合相容性不強(qiáng),且運(yùn)算復(fù)雜;決策層融合依賴信息匱乏單一,抗噪能力弱。因此,本文主要提出一種針對(duì)聲紋和人臉特征的匹配層融合識(shí)別算法,首先對(duì)不同說話人的無噪聲語音信號(hào)建立高斯混合模型,然后對(duì)加入噪聲的語音信號(hào)進(jìn)行模型匹配獲得匹配分?jǐn)?shù),再對(duì)含有噪聲的人臉圖像依次進(jìn)行小波分解、主成分分析(Principal Component Analysis,PCA)降維、支持向量機(jī)(Support Vector Machine,SVM)分類獲取匹配分?jǐn)?shù),最后利用本文提出的自適應(yīng)加權(quán)融合算法進(jìn)行加權(quán)匹配分析,獲得最優(yōu)決策結(jié)果。本文創(chuàng)新點(diǎn)在于規(guī)范一個(gè)衡量系統(tǒng)穩(wěn)定性的標(biāo)準(zhǔn)ξ,并利用這個(gè)標(biāo)準(zhǔn)選擇最佳的權(quán)值進(jìn)行融合,判斷結(jié)果。實(shí)驗(yàn)結(jié)果驗(yàn)證表明,該方法比采用單一模態(tài)的識(shí)別算法更加有效,具有較高且穩(wěn)定的識(shí)別率。




本文詳細(xì)內(nèi)容請(qǐng)下載:http://theprogrammingfactory.com/resource/share/2000002902




作者信息:

李傲梅,胡正豪,周川川

(陸軍炮兵防空兵學(xué)院 信息工程系,安徽 合肥230031)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。