摘 要: RoboCup中型組足球機器人在比賽過程中由于受環(huán)境光照變化影響,使目標識別率降低。以HSV顏色空間為基礎(chǔ),針對傳統(tǒng)BP算法的缺陷,提出了一種改進的BP神經(jīng)網(wǎng)絡(luò)算法,利用其良好的分類效果來適應(yīng)環(huán)境光照的變化,對目標作出準確識別。實驗結(jié)果證明,該方法能有效地提高識別速度,并具有較好的光照魯棒性。
關(guān)鍵詞: 顏色空間;BP神經(jīng)網(wǎng)絡(luò);RoboCup;目標識別
顏色是物體表面的基本特征, 外部世界提供了豐富的顏色信息,因此通過顏色對目標進行識別[1-2]是一種常用的方法。然而,同一顏色在變化環(huán)境下所接收到的光照并不完全一樣,不同于人眼識別的靈敏性。機器人視覺系統(tǒng)所感知到的目標顏色會隨著光照的變化發(fā)生顏色畸變,降低識別精度。目前自然光線已經(jīng)被逐漸引入到RoboCup中型組足球機器人比賽[3]中,因此在自然光照條件下的魯棒性識別是當今研究的重點。
戚瑋瑋提出一種基于Gabor濾波器和支持向量機(SVM)的目標識別方法[4],以改善機器人對目標識別不穩(wěn)定和有效性差的問題。JUNGEL M等人利用顏色閾值法[5]實現(xiàn)物體的識別,并通過參考顏色實現(xiàn)閾值的自動調(diào)節(jié),提高了對光照的魯棒性。本文提出一種基于改進BP神經(jīng)網(wǎng)絡(luò)算法,以用于足球機器人視覺系統(tǒng)的目標識別中。
1 顏色空間的選擇
顏色空間是表示顏色的一種數(shù)學(xué)方法,人們用它來指定和產(chǎn)生顏色,使顏色形象化。HSV模型就是一種常用的顏色模型。HSV模型[6]由色調(diào)(Hue)、飽和度(Saturation)和亮度(Value)三屬性組成,其結(jié)構(gòu)如圖1所示。
HSV顏色模型構(gòu)成的是一個均勻的顏色空間,采用線性的標尺,彩色之間感覺上的距離與HSV顏色模型坐標上點的歐氏距離成正比,與RGB顏色模型相比,HSV模型對應(yīng)于光線的變化具有一定的不變性。由于人的視覺對亮度的敏感程度遠強于對顏色濃淡的敏感程度,為了便于顏色處理和識別,本文采用HSV顏色空間,它比RGB顏色空間更符合人的視覺特性。
2 BP神經(jīng)網(wǎng)絡(luò)簡介
BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋型網(wǎng)絡(luò),網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、中間層(隱含層)和輸出層。其拓撲結(jié)構(gòu)如圖2所示。
圖2中,xj表示輸入層第j個節(jié)點的輸入,j=1,…,M;wij表示隱含層第i個節(jié)點到輸入層第j個節(jié)點之間的權(quán)值;?茲i表示隱含層第i個節(jié)點的閾值;?準(x)表示隱含層的激勵函數(shù);wki表示輸出層第k個節(jié)點到隱含層第i個節(jié)點之間的權(quán)值,i=1,…,q;ak表示輸出層第k個節(jié)點的閾值,k=1,…,L;?追(x)表示輸出層的激勵函數(shù);Ok表示輸出層第k個節(jié)點的輸出。
BP算法的基本思想[7]是:學(xué)習(xí)訓(xùn)練過程由正向信號傳輸和反向誤差傳播構(gòu)成。正向傳播時輸入樣本從輸入層進入,經(jīng)各隱含層逐層處理后,傳向輸出層。若輸出層的實際輸出與期望輸出不符,則轉(zhuǎn)入誤差的反向傳播階段。誤差反傳是將輸出誤差以某種形式通過隱含層向輸入層逐層反傳,并將誤差分攤給各層的所有單元,從而獲得各層單元的誤差信號,以此誤差信號作為修正各單元權(quán)值的依據(jù)。此過程一直進行到網(wǎng)絡(luò)輸出的誤差減少到可接受的程度,或進行到預(yù)先設(shè)定的學(xué)習(xí)次數(shù)為止。
3 改進的BP神經(jīng)網(wǎng)絡(luò)算法
BP神經(jīng)網(wǎng)絡(luò)算法的缺陷是難以確定隱含層和隱節(jié)點個數(shù),訓(xùn)練時常會出現(xiàn)收斂慢、震蕩和陷入局部極小等問題[8]。本文通過引入附加動量法和自適應(yīng)學(xué)習(xí)速率加以改進。
3.1 附加動量法
BP算法實質(zhì)上是一種簡單的最速下降靜態(tài)尋優(yōu)算法,在沒有附加動量的作用下,網(wǎng)絡(luò)可能陷入淺的局部極小值,利用附加動量的作用有可能滑過這些極小值。該方法是在反向傳播法的基礎(chǔ)上,在每一個權(quán)值(或閾值)的變化上加上一項正比于前次權(quán)值(或閾值)變化量的值,并根據(jù)反向傳播法來產(chǎn)生新的權(quán)值(或閾值)變化。帶有附加動量因子的權(quán)值和閾值調(diào)節(jié)方法為:
?駐wij(k+1)=(1-mc)?濁 ?啄i pj+mc?駐wij(k)
?駐bi(k+1)=(1-mc)?濁 ?啄i+mc?駐bi(k)
其中,k為訓(xùn)練次數(shù),mc為動量因子。
3.2 自適應(yīng)學(xué)習(xí)速率
一階梯度法尋優(yōu)收斂較慢的一個重要原因是?濁(學(xué)習(xí)速率)不好選擇。?濁選得太小,收斂太慢;選得太大,則有可能修正過頭,導(dǎo)致震蕩甚至發(fā)散。通常調(diào)節(jié)學(xué)習(xí)速率的準則是:檢查權(quán)值是否真正降低了誤差函數(shù),如果確實如此,則說明所選學(xué)習(xí)速率小了,可以適當增加一個量;若產(chǎn)生了過調(diào),則應(yīng)該減少學(xué)習(xí)速率的值。自適應(yīng)學(xué)習(xí)速率的調(diào)整方法為:
?濁(k+1)=1.05?濁(k) E(k+1)<E(k)
0.7?濁(k) E(k+1)>1.04E(k)
?濁(k) 其他
其中,E(k)為第k步誤差平方和。
3.3 改進的BP神經(jīng)網(wǎng)絡(luò)算法
當采用動量法時,可以避免網(wǎng)絡(luò)陷入局部最小。當采用自適應(yīng)學(xué)習(xí)速率時,可以加快網(wǎng)絡(luò)的收斂速度。因此本文將兩種方法結(jié)合對基本BP算法進行改進,以彌補不足。
BP算法的執(zhí)行步驟如下:
(6)當求出了各層各權(quán)系數(shù)之后,可按給定判別指標判別是否滿足要求,如果滿足則算法結(jié)束;不滿足則返回步驟(3)。
4 基于改進BP神經(jīng)網(wǎng)絡(luò)算法的目標識別
4.1 識別過程
足球場地主要由綠、橙、白、黑4種顏色構(gòu)成,由于光線的變化會使得顏色發(fā)生偏差,本文的目的就是要在此條件下識別出橙色的球。識別過程分為學(xué)習(xí)階段和識別階段。
在學(xué)習(xí)階段,由于通常的彩色圖像都是RGB圖像,因此首先將圖像樣本轉(zhuǎn)化到HSV顏色空間,然后將樣本數(shù)據(jù)進行歸一化處理,再輸入到改進后的BP網(wǎng)絡(luò)中進行訓(xùn)練,以確定網(wǎng)絡(luò)的權(quán)值和閾值。
在識別階段,同樣將由攝像機所采集到的不同光照下的全向視覺圖像先進行顏色空間轉(zhuǎn)換,經(jīng)歸一化處理后再輸入到已訓(xùn)練好的網(wǎng)絡(luò)中,指導(dǎo)輸出為1或0(1表示為橙色,0表示為非橙色)。
4.2 網(wǎng)絡(luò)設(shè)計
現(xiàn)有神經(jīng)網(wǎng)絡(luò)理論證明,3層前饋神經(jīng)網(wǎng)絡(luò)能夠以任意精度逼近任意非線性關(guān)系,因此本文選用3層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。輸入層為經(jīng)預(yù)處理后的某一點的顏色值,輸入節(jié)點為3;隱含層節(jié)點數(shù)經(jīng)不斷操作調(diào)整確定為22個節(jié)點;輸出以1或0作指導(dǎo),節(jié)點數(shù)為1,故網(wǎng)絡(luò)的整體結(jié)構(gòu)為3-22-1。
5 仿真實驗及結(jié)果
本足球機器人視覺系統(tǒng)使用的彩色數(shù)字攝像機是由加拿大Procilica公司生產(chǎn)的EC655C,攝像機輸出的圖像分辨率為640×480,幀速率為30 幀/s,圖像的輸出格式為RGB24。處理圖像所采用的計算機為宏基TravelMate3010,CPU主頻為1.6 GHz,內(nèi)存為1.5 GB,在MATLAB7.0中進行仿真實驗。
5.1 4種不同目標識別方法的比較
4種不同目標識別方法的比較如表1所示。
從表1的結(jié)果可以看出,基本BP算法迭代次數(shù)最多,耗時最長;自適應(yīng)調(diào)整學(xué)習(xí)速率算法和引入動量的算法都有所改善,而新的改進算法最為明顯,不僅訓(xùn)練速度大大提高,而且還成功地避免了陷入局部極小值,保證了網(wǎng)絡(luò)的穩(wěn)定性。
5.2 不同光照下的識別情況
不同光照下的識別情況如表2所示。
從表2可看出,采用基本BP算法的系統(tǒng)識別率較低,采用了改進BP算法的系統(tǒng)的識別率相比要高一些,而且受光照影響并不大,識別率波動范圍小,整體保持在一個穩(wěn)定水平,說明該方法有很好的光照自適應(yīng)性。
本文在傳統(tǒng)BP算法基礎(chǔ)上加以改進,使得網(wǎng)絡(luò)避免陷入局部最小值,而且收斂速度有了顯著提高。將改進后的BP算法應(yīng)用于足球機器人全向視覺系統(tǒng)的目標識別中,結(jié)果顯示,該算法識別快速、精準,具有良好的光照自適應(yīng)能力。
參考文獻
[1] NEVES A J R,CORRENTE G,PINHO A J.An omnidirec-tional vision system for soccer robots[C].Proceedings of the EPIA 2007,Lecture Notes in Artificial Intelligence,Berlin,Germany:Springer-Verlag,2007,4874:499-507.
[2] MOHAN S,PETER S.Color learning and illumination vari-ance on mobile robots:a survey[J].Robotics and AutonomousSystem,2009,75(1):1-38.
[3] 洪炳熔,韓學(xué)東,孟偉.機器人足球比賽研究[J].機器人,2003,25(4):373-377.
[4] 戚瑋瑋,欒新,宋大雷,等.一種魯棒的基于全景視覺的機器人目標識別方法[J].中國海洋大學(xué)學(xué)報,2011,41(6):109-114.
[5] JUNGEL M,HOFFMANN J,TZSCH M L.A real-time au-to-adjusting vision system for robotic soccer.RoboCup 2003:Robot Soccer World Cup VII,2004:214-225.
[6] 李偲.全自主足球機器人視覺系統(tǒng)的研制[M].青島:中國海洋大學(xué),2008.
[7] 張國忠.智能控制系統(tǒng)及應(yīng)用[M].北京:中國電力出版社,2007.
[8] 趙明旺,王杰.智能控制[M].武漢:華中科技大學(xué)出版社,2010.