《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 教程:基于深度學習的車牌識別偵測網(wǎng)絡模型

教程:基于深度學習的車牌識別偵測網(wǎng)絡模型

2023-02-26
來源:新機器視覺
關鍵詞: 深度學習 圖像增強

  車牌識別

  概述

  基于深度學習的車牌識別,其中,車輛檢測網(wǎng)絡直接使用YOLO偵測。而后,才是使用網(wǎng)絡偵測車牌與識別車牌號。

  車牌的偵測網(wǎng)絡,采用的是resnet18,網(wǎng)絡輸出檢測邊框的仿射變換矩陣,可檢測任意形狀的四邊形。

  車牌號序列模型,采用Resnet18+transformer模型,直接輸出車牌號序列。

  數(shù)據(jù)集上,車牌檢測使用CCPD 2019數(shù)據(jù)集,在訓練檢測模型的時候,會使用程序生成虛假的車牌,覆蓋于數(shù)據(jù)集圖片上,來加強檢測的能力。

  車牌號的序列識別,直接使用程序生成的車牌圖片訓練,并佐以適當?shù)?a class="innerlink" href="http://theprogrammingfactory.com/tags/圖像增強" target="_blank">圖像增強手段。模型的訓練直接采用端到端的訓練方式,輸入圖片,直接輸出車牌號序列,損失采用CTCLoss。

  一、網(wǎng)絡模型

  1、車牌的偵測網(wǎng)絡模型:

  網(wǎng)絡代碼定義如下:

142.JPG

  該網(wǎng)絡,相當于直接對圖片劃分cell,即在16X16的格子中,偵測車牌,輸出的為該車牌邊框的反射變換矩陣。

  2、車牌號的序列識別網(wǎng)絡:

  車牌號序列識別的主干網(wǎng)絡:采用的是ResNet18+transformer,其中有ResNet18完成對圖片的編碼工作,再由transformer解碼為對應的字符。

  網(wǎng)絡代碼定義如下:

141.JPG

  其中的Block類的代碼如下:

140.JPG

139.JPG

  位置編碼的代碼如下:

138.JPG

  Block類使用的自注意力代碼如下:

137.JPG

136.JPG

  二、數(shù)據(jù)加載

  1、車牌號的數(shù)據(jù)加載

  同過程序生成一組車牌號:

135.JPG

  再通過數(shù)據(jù)增強,

  主要包括:

134.JPG

133.JPG

132.JPG

  三、訓練

  分別訓練即可

  其中,偵測網(wǎng)絡的損失計算,如下:

131.JPG

130.JPG

  偵測網(wǎng)絡輸出的反射變換矩陣,但對車牌位置的標簽給的是四個角點的位置,所以需要響應轉換后,做損失。其中,該cell是否有目標,使用CrossEntropyLoss,而對車牌位置損失,采用的則是L1Loss。

  四、推理

  1、偵測網(wǎng)絡的推理

  按照一般偵測網(wǎng)絡,推理即可。只是,多了一步將反射變換矩陣轉換為邊框位置的計算。

  另外,在YOLO偵測到得測量圖片傳入該級進行車牌檢測的時候,會做一步操作。代碼見下,將車輛檢測框的圖片扣出,然后resize到長寬均為16的整數(shù)倍。

129.JPG

  2、序列檢測網(wǎng)絡的推理

  對網(wǎng)絡輸出的序列,進行去重操作即可,如間隔標識符為“*”時:

128.JPG



更多信息可以來這里獲取==>>電子技術應用-AET<< 

mmexport1621241704608.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。