《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 基于雙流卷積神經(jīng)網(wǎng)絡和生成式對抗網(wǎng)絡的行人重識別算法
基于雙流卷積神經(jīng)網(wǎng)絡和生成式對抗網(wǎng)絡的行人重識別算法
《信息技術與網(wǎng)絡安全》2020年第6期
林 通,陳 新,唐 曉,賀 玲,李 浩
中國人民解放軍空軍預警學院,湖北 武漢430019
摘要: 近年來,針對行人重識別問題的深度學習技術研究取得了很大的進展。然而,在解決實際數(shù)據(jù)的特征樣本不平衡問題時,效果仍然不理想。為了解決這一問題,設計了一個更有效的模型,該模型很好地解決了目標的不同姿態(tài)的干擾以及數(shù)據(jù)集中的圖片數(shù)量不足的問題。首先,通過遷移姿態(tài)生成對抗網(wǎng)絡生成行人不同姿勢的圖片,解決姿態(tài)干擾及圖片數(shù)量不足的問題。然后利用兩種不同的獨立卷積神經(jīng)網(wǎng)絡提取圖像特征,并將其結合得到綜合特征。最后,利用提取的特征完成行人重識別。采用姿勢轉換方法對數(shù)據(jù)集進行擴展,有效地克服了由目標不同姿勢引起的識別誤差,識別錯誤率降低了6%。實驗結果表明,該模型在Market-1501和DukeMTMC-Reid上達到了更好的識別準確度。在DukeMTMC-Reid數(shù)據(jù)集上測試時,Rank-1準確度增加到92.10%,mAP 達到84.60%。
中圖分類號: TP18
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.06.002
引用格式: 林通,陳新,唐曉,等. 基于雙流卷積神經(jīng)網(wǎng)絡和生成式對抗網(wǎng)絡的行人重識別算法[J].信息技術與網(wǎng)絡安全,2020,39(6):7-12.
Dual stream ConvNet-Gan for person re-identification
Lin Tong,Chen Xin,Tang Xiao,He Ling,Li Hao
People′s Liberation Army Force Army Early Warning Academy,Wuhan 430019,China
Abstract: The performance of current algorithm of person re-identification(ReID) has been made great progress, but there are still a lot of difficults in dealing with different backgrounds and poses. In order to cope with the difficult in actual scenes, this paper proposes a novel model, which can very well solve the problem that the characters have different poses and the number of pictures in the dataset is insufficient and uneven. Firstly the IDs with a relatively small number of images are screened out to expand by transferring pose and solve the problem of imbalanced datasets. Then two different convolutional neural networks are used to extract picture features and they are joined to get different characteristics. In the end, the task with extracted features is completed. This model solves the impact of different poses on the recognition effect very well. At the same time, it uses two independent feature extraction networks to extract the features of the person more comprehensively. Experimental results confirm that this model significantly improves performance and achieves high accuracy in Market-1501 and DukeMTMC-Reid. When tested on the DukeMTMC-Reid dataset, Rank-1 was increased to 92.10%, and mAP was increased to 84.60%.
Key words : person ReID;CNN;generative adversarial network;pose transfer

行人重識別(ReID)的目的是利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人的技術。由于其在安全和監(jiān)控方面的重要應用,受到了學術界和工業(yè)界的廣泛關注。這一任務極具挑戰(zhàn)性,因為不同相機拍攝的圖像往往包含由背景、視角、人體姿勢等變化引起的顯著變化。

在過去的幾十年中,大多數(shù)現(xiàn)有的研究都集中在度量學習和特征學習上,設計盡可能抵消類內(nèi)變化的算法已經(jīng)成為了行人重識別的主要目標之一。起初,行人重識別的研究主要是基于全局特征,即基于全局圖像獲得特征向量。為獲得更好的效果,開始引入局部特征,常用的局部特征提取方法包括圖像分割、骨架關鍵點定位和姿態(tài)校正。行人重識別任務還面臨一個非常大的問題,即很難獲得數(shù)據(jù)。到目前為止,最大的數(shù)據(jù)集只有幾千個目標和上萬張圖片。隨著生成性對抗網(wǎng)絡(GAN)技術的發(fā)展,越來越多的學者試圖利用這種方法來擴展數(shù)據(jù)集。然而,大多數(shù)現(xiàn)有的針對行人重識別的算法需要大量標記數(shù)據(jù),這限制了它在實際應用場景中的魯棒性和可用性,因為手動標記一個大型數(shù)據(jù)集是昂貴和困難的。最近的一些文獻在使用無監(jiān)督學習來解決此問題,改進人工標注的特征。由于不同數(shù)據(jù)集之間的圖像有明顯差異,在提取圖片特征問題上效果仍不理想。本文方法的貢獻主要有兩個方面。一方面,采用均衡采樣策略和姿勢遷移方法對數(shù)據(jù)集進行擴充有效地緩解了行人姿勢各異造成的干擾。另一方面,利用兩種不同的網(wǎng)絡結構從圖像的不同方面提取特征,使模型能學習到更為豐富全面的信息。實驗結果表明,該方法具有較高的精度。例如,在Market-1501數(shù)據(jù)集上,這一模型Rank-1準確度達到了96.0%,mAP達到了90.1%,與現(xiàn)有算法相比,性能有較大提升。



本文詳細內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000003145


作者信息:

林  通,陳  新,唐  曉,賀  玲,李  浩

(中國人民解放軍空軍預警學院,湖北 武漢430019)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。