文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.06.002
引用格式: 林通,陳新,唐曉,等. 基于雙流卷積神經(jīng)網(wǎng)絡和生成式對抗網(wǎng)絡的行人重識別算法[J].信息技術與網(wǎng)絡安全,2020,39(6):7-12.
行人重識別(ReID)的目的是利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人的技術。由于其在安全和監(jiān)控方面的重要應用,受到了學術界和工業(yè)界的廣泛關注。這一任務極具挑戰(zhàn)性,因為不同相機拍攝的圖像往往包含由背景、視角、人體姿勢等變化引起的顯著變化。
在過去的幾十年中,大多數(shù)現(xiàn)有的研究都集中在度量學習和特征學習上,設計盡可能抵消類內(nèi)變化的算法已經(jīng)成為了行人重識別的主要目標之一。起初,行人重識別的研究主要是基于全局特征,即基于全局圖像獲得特征向量。為獲得更好的效果,開始引入局部特征,常用的局部特征提取方法包括圖像分割、骨架關鍵點定位和姿態(tài)校正。行人重識別任務還面臨一個非常大的問題,即很難獲得數(shù)據(jù)。到目前為止,最大的數(shù)據(jù)集只有幾千個目標和上萬張圖片。隨著生成性對抗網(wǎng)絡(GAN)技術的發(fā)展,越來越多的學者試圖利用這種方法來擴展數(shù)據(jù)集。然而,大多數(shù)現(xiàn)有的針對行人重識別的算法需要大量標記數(shù)據(jù),這限制了它在實際應用場景中的魯棒性和可用性,因為手動標記一個大型數(shù)據(jù)集是昂貴和困難的。最近的一些文獻在使用無監(jiān)督學習來解決此問題,改進人工標注的特征。由于不同數(shù)據(jù)集之間的圖像有明顯差異,在提取圖片特征問題上效果仍不理想。本文方法的貢獻主要有兩個方面。一方面,采用均衡采樣策略和姿勢遷移方法對數(shù)據(jù)集進行擴充有效地緩解了行人姿勢各異造成的干擾。另一方面,利用兩種不同的網(wǎng)絡結構從圖像的不同方面提取特征,使模型能學習到更為豐富全面的信息。實驗結果表明,該方法具有較高的精度。例如,在Market-1501數(shù)據(jù)集上,這一模型Rank-1準確度達到了96.0%,mAP達到了90.1%,與現(xiàn)有算法相比,性能有較大提升。
本文詳細內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000003145
作者信息:
林 通,陳 新,唐 曉,賀 玲,李 浩
(中國人民解放軍空軍預警學院,湖北 武漢430019)