《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 設(shè)計(jì)應(yīng)用 > 神經(jīng)網(wǎng)絡(luò)在車牌識(shí)別中的應(yīng)用
神經(jīng)網(wǎng)絡(luò)在車牌識(shí)別中的應(yīng)用
來(lái)源:微型機(jī)與應(yīng)用2011年第5期
王 力,王小華,王 莉
(長(zhǎng)沙理工大學(xué) 電氣與信息工程學(xué)院,湖南 長(zhǎng)沙 410076)
摘要: 介紹了中國(guó)車牌識(shí)別的研究背景和現(xiàn)狀,提出了一種基于神經(jīng)網(wǎng)絡(luò)的新方法,并設(shè)計(jì)了一種沒(méi)有直接預(yù)處理的車牌像素圖像的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。該圖像變換適用于利用原始車牌來(lái)增加訓(xùn)練數(shù)據(jù)庫(kù)。實(shí)驗(yàn)結(jié)果驗(yàn)證了本車牌識(shí)別方法的魯棒性和有無(wú)車牌的識(shí)別效率。
Abstract:
Key words :

摘  要: 介紹了中國(guó)車牌識(shí)別的研究背景和現(xiàn)狀,提出了一種基于神經(jīng)網(wǎng)絡(luò)的新方法,并設(shè)計(jì)了一種沒(méi)有直接預(yù)處理的車牌像素圖像的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。該圖像變換適用于利用原始車牌來(lái)增加訓(xùn)練數(shù)據(jù)庫(kù)。實(shí)驗(yàn)結(jié)果驗(yàn)證了本車牌識(shí)別方法的魯棒性和有無(wú)車牌的識(shí)別效率。
關(guān)鍵詞: 卷積神經(jīng)網(wǎng)絡(luò);魯棒性;預(yù)處理;車牌識(shí)別

 車輛牌照自動(dòng)識(shí)別系統(tǒng)LPR(License Plate Recognition)是把計(jì)算機(jī)視覺(jué)理論和技術(shù)應(yīng)用于車輛牌照識(shí)別的專用系統(tǒng),是計(jì)算機(jī)視覺(jué)與模式識(shí)別在智能交通領(lǐng)域中的綜合應(yīng)用,涉及到圖像處理、人工智能、信息論、通信技術(shù)和工程學(xué)等多門學(xué)科。LPR是智能交通系統(tǒng)ITS(Intelligent Traffic System)中的關(guān)鍵技術(shù)之一[1]。近年來(lái),隨著ITS在社會(huì)生活中的廣泛應(yīng)用,LPR也發(fā)展得非???,已經(jīng)逐漸地應(yīng)用到現(xiàn)實(shí)生活中。由于LPR具有廣闊的發(fā)展前景,它的開(kāi)發(fā)和研制工作在國(guó)內(nèi)外均受到極大的關(guān)注。
 在車牌識(shí)別系統(tǒng)中,由于實(shí)際使用條件的影響,存在著許多影響識(shí)別率的因素,包括背景復(fù)雜程度、光照條件的變化、車牌污損以及由于拍攝角度或車輛運(yùn)動(dòng)等原因?qū)е伦址冃瓮嵝钡?。這些都對(duì)圖像處理和識(shí)別算法提出了很高的要求。識(shí)別算法中值得重視的是算法的學(xué)習(xí)能力,當(dāng)出現(xiàn)新的車牌模式時(shí),算法應(yīng)能很方便地適應(yīng)新模式。目前常用的字符識(shí)別算法包括模板匹配、輪廓匹配、拓?fù)涮卣鳈z測(cè)、基于Hausdo距離的模板匹配、模糊模式識(shí)別和神經(jīng)網(wǎng)絡(luò)等。其中,神經(jīng)網(wǎng)絡(luò)識(shí)別方法具有穩(wěn)健性好、識(shí)別率高、對(duì)殘損字符識(shí)別效果好等優(yōu)點(diǎn),是目前較為流行的識(shí)別算法[2]。
 但是目前這些技術(shù)大多依賴于圖像預(yù)處理前階段的訓(xùn)練和分類。而本文設(shè)計(jì)了一種沒(méi)有直接預(yù)處理的像素車牌結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)方法的應(yīng)用避免了圖像預(yù)處理以及由其出現(xiàn)的去噪問(wèn)題的影響,以確保沒(méi)有相關(guān)資料的不切實(shí)際的假設(shè),最大程度地保證了豐富的原始信號(hào)被保留。而且本卷積神經(jīng)網(wǎng)絡(luò)已被成功應(yīng)用于視覺(jué)圖形裝置,例如手寫字符識(shí)別、一般對(duì)象識(shí)別、人臉識(shí)別和行人跟蹤等。
1 卷積神經(jīng)網(wǎng)絡(luò)
 卷積神經(jīng)網(wǎng)絡(luò)是近年發(fā)展起來(lái)并引起廣泛重視的一種高效識(shí)別方法。20世紀(jì)60年代,Hubel和Wiesel在研究貓腦皮層中用于局部敏感和方向選擇的神經(jīng)元時(shí),發(fā)現(xiàn)其獨(dú)特的網(wǎng)絡(luò)結(jié)構(gòu)可以有效地降低反饋神經(jīng)網(wǎng)絡(luò)的復(fù)雜性,繼而提出了卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Networks)。目前,CNN已經(jīng)成為眾多科學(xué)領(lǐng)域的研究熱點(diǎn)之一,特別是在模式分類領(lǐng)域,由于該網(wǎng)絡(luò)避免了對(duì)圖像的復(fù)雜的前期預(yù)處理,可以直接輸入原始圖像,因而得到了更為廣泛的應(yīng)用[3]。FUKUSHIMA K在1980年提出的新識(shí)別機(jī)是卷積神經(jīng)網(wǎng)絡(luò)的第一個(gè)實(shí)現(xiàn)網(wǎng)絡(luò)。隨后,更多的科研工作者對(duì)該網(wǎng)絡(luò)進(jìn)行了改進(jìn),其中,具有代表性的研究成果是Alexander和Taylor提出的“改進(jìn)認(rèn)知機(jī)”[4],該方法綜合了各種改進(jìn)方法的優(yōu)點(diǎn)并避免了耗時(shí)的誤差反向傳播。
 CNN的基本結(jié)構(gòu)一般包括兩層:(1)特征提取層。每個(gè)神經(jīng)元的輸入與前一層的局部接受域相連,并提取該局部的特征。一旦該局部特征被提取后,與其他特征間的位置關(guān)系也隨之確定下來(lái)。(2)特征映射層。網(wǎng)絡(luò)的每個(gè)計(jì)算層由多個(gè)特征映射組成,每個(gè)特征映射是一個(gè)平面,平面上所有神經(jīng)元的權(quán)值相等。特征映射結(jié)構(gòu)采用影響函數(shù)核小的sigmoid函數(shù)作為卷積網(wǎng)絡(luò)的激活函數(shù)[5],使得特征映射具有位移不變性。此外,由于一個(gè)映射面上的神經(jīng)元共享權(quán)值,因而減少了網(wǎng)絡(luò)自由參數(shù)的個(gè)數(shù)。卷積神經(jīng)網(wǎng)絡(luò)中的每一個(gè)卷積層都緊跟著一個(gè)用來(lái)求局部平均與二次提取的計(jì)算層,這種特有的二次特征提取結(jié)構(gòu)減小了特征分辨率。
 CNN主要用來(lái)識(shí)別位移、縮放及其他形式扭曲不變性的二維圖形。由于CNN的特征檢測(cè)層通過(guò)訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí),所以在使用CNN時(shí),避免了顯示的特征抽取,而隱式地從訓(xùn)練數(shù)據(jù)中進(jìn)行學(xué)習(xí)。同時(shí),由于同一特征映射面上的神經(jīng)元權(quán)值相同,所以網(wǎng)絡(luò)可以并行學(xué)習(xí),這也是卷積網(wǎng)絡(luò)相對(duì)于神經(jīng)元彼此相連網(wǎng)絡(luò)的一大優(yōu)勢(shì)。卷積神經(jīng)網(wǎng)絡(luò)以其局部權(quán)值共享的特殊結(jié)構(gòu)在語(yǔ)音識(shí)別和圖像處理方面有著獨(dú)特的優(yōu)越性,其布局更接近于實(shí)際的生物神經(jīng)網(wǎng)絡(luò),權(quán)值共享降低了網(wǎng)絡(luò)的復(fù)雜性,特別是多維輸入向量的圖像可以直接輸入網(wǎng)絡(luò),這一特點(diǎn)避免了特征提取和分類過(guò)程中數(shù)據(jù)重建的復(fù)雜度。
2 卷積神經(jīng)網(wǎng)絡(luò)在車牌識(shí)別中的應(yīng)用
 為了提高車牌字符的識(shí)別率,本文采用一種改進(jìn)的基于卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別機(jī)完成字符識(shí)別,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。圖中,S層為簡(jiǎn)單(simple)神經(jīng)元組成的神經(jīng)層,完成特征提取,其輸入連接是可變的,并在學(xué)習(xí)過(guò)程中不斷更正。C層則是由復(fù)雜(complex)神經(jīng)元組成的神經(jīng)層,它的輸入連接是固定的,不可修改,顯示接收信心被激勵(lì)位置的近似變化。網(wǎng)絡(luò)中C層的最后一層為識(shí)別層,可以顯示模式識(shí)別的結(jié)果。經(jīng)過(guò)學(xué)習(xí),網(wǎng)絡(luò)可以自動(dòng)地識(shí)別輸入模式,而不受輸入圖片扭曲、縮放和位移的影響。

 
3 訓(xùn)練集和測(cè)試集的描述
 在訓(xùn)練集中同時(shí)需要常規(guī)積極樣本和消極樣本,因此本文建立了人工采樣的不同領(lǐng)域收集得到實(shí)時(shí)交通場(chǎng)景的400輛車牌圖像積極訓(xùn)練集。大多數(shù)基于學(xué)習(xí)方法的中國(guó)牌照的車牌識(shí)別使用一個(gè)大約為16×48的輸入窗口[9],因?yàn)樽鳛樽钚〉囊粋€(gè)窗口可以做到不遺漏任何重要信息??紤]到字符識(shí)別的進(jìn)程,選擇了中央部分窗口車牌,如大小為20×60的直方圖、均衡和整體亮度校正都沒(méi)有強(qiáng)度,正常情況下都適用于裁剪的車牌。卷積神經(jīng)網(wǎng)絡(luò)的魯棒性具有規(guī)模和地位上的優(yōu)勢(shì),因此本文的目標(biāo)是為其魯棒性提供不規(guī)范的樣本。
 為了創(chuàng)造更多的樣本,并加強(qiáng)不變性的強(qiáng)度,色彩轉(zhuǎn)換和對(duì)比還原轉(zhuǎn)換適用于所有原有的訓(xùn)練樣本,最后得到的積極樣本訓(xùn)練集包括2 400塊車牌。圖2是一些車牌的實(shí)物圖。

4 實(shí)驗(yàn)結(jié)果
 實(shí)驗(yàn)共分兩步進(jìn)行,前期對(duì)采集到的車牌圖片進(jìn)行預(yù)處理(包括定位、分割等),后期首先選取理想預(yù)處理?xiàng)l件下得到的200個(gè)20×60的樣本圖片(每個(gè)字符為20個(gè))[10]訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),得到各層的權(quán)值、閾值及神經(jīng)元細(xì)胞平面數(shù),然后使用優(yōu)化后的神經(jīng)網(wǎng)絡(luò)識(shí)別機(jī)對(duì)200個(gè)20×60的(每個(gè)字符為20個(gè))測(cè)試樣本字符圖像進(jìn)行識(shí)別,其正確的識(shí)別率達(dá)到99%。
 對(duì)于神經(jīng)網(wǎng)絡(luò),過(guò)度訓(xùn)練是一個(gè)不可忽視的嚴(yán)重問(wèn)題。當(dāng)過(guò)度訓(xùn)練時(shí),雖然訓(xùn)練錯(cuò)誤不斷減少,但是隨著時(shí)間的推移,測(cè)試誤差經(jīng)過(guò)最小值后開(kāi)始一定數(shù)量的增加迭代,并且可以觀察到這一現(xiàn)象的識(shí)別率并不穩(wěn)定。其學(xué)習(xí)曲線如圖3所示。

 實(shí)驗(yàn)結(jié)果表明,CNN用于車牌識(shí)別切實(shí)可行,訓(xùn)練樣本空間覆蓋越完備則識(shí)別率越高。卷積神經(jīng)網(wǎng)絡(luò)通過(guò)避免顯式的特征提取過(guò)程,隱式地從訓(xùn)練樣本中獲取對(duì)構(gòu)筑訓(xùn)練樣本空間貢獻(xiàn)較大的特征,與傳統(tǒng)網(wǎng)絡(luò)相比有更高的識(shí)別率和抗干擾性[11]。識(shí)別失敗原因是該類樣本在訓(xùn)練樣本庫(kù)中未曾出現(xiàn)或出現(xiàn)較少。
 本文利用神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì),采用一種改進(jìn)的基于卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別機(jī)制對(duì)車牌照中的字符進(jìn)行識(shí)別。該識(shí)別方法通過(guò)對(duì)理想預(yù)處理?xiàng)l件下的車牌字符圖片的學(xué)習(xí),優(yōu)化了網(wǎng)絡(luò)系統(tǒng)中各層的權(quán)值參數(shù),大大提高了車牌照中的字符識(shí)別率。但實(shí)際應(yīng)用中,前期預(yù)處理會(huì)出現(xiàn)車牌定位不清、字符分割錯(cuò)誤等缺點(diǎn),這些都會(huì)影響識(shí)別效果,降低實(shí)際識(shí)別率。因此,在今后的工作中,將對(duì)網(wǎng)絡(luò)結(jié)構(gòu)提出進(jìn)一步的改進(jìn),使其可以識(shí)別預(yù)處理較差條件下的車牌字符。
參考文獻(xiàn)
[1] 高雋.智能信息處理方法導(dǎo)論[M].北京:機(jī)械工業(yè)出版社,2004.
[2] 邊肇祺.模式識(shí)別[M].北京:清華大學(xué)出版社,1987.
[3] 高雋.人工神經(jīng)網(wǎng)絡(luò)原理及仿真實(shí)例[M].北京:機(jī)械工業(yè)出版社,2003.
[4] NEUBAUER C. Evaluation of convolutional neural networks for visual recognition[J]. Neural Netwoks, 1998,9(4):685-696.
[5] Li Baoqing, Li Baoxin. Building pattern classifiers using convolutional neural networks[J]. Neural Networks, 2001,5(3):3081-3085.
[6] 唐漢征.車牌識(shí)別系統(tǒng)的工作原理及其應(yīng)用[J].現(xiàn)代電子工程,2004,2(1):66-69.
[7] FUKUSHIMA K. Neocognitron for handwritten digit recognition[J]. Neurocomputing, 2003:161-180.
[8] FUKUSHIMA K. Neocognitron: a hierarchical neural network capable of visual pattern recognition[J]. Neural Networks, 1988,1(2):119-130.
[9] 魏武. 一種基于模板匹配的車牌識(shí)別方法[J].中國(guó)公路學(xué)報(bào),2001(1):104-106.
[10] 王璞.車牌字符識(shí)別的混合特征提取方法[J].沈陽(yáng)工業(yè)學(xué)院學(xué)報(bào),2004(3):30-33.
[11] HAGAN M T, DEMUTH H B, BEALE M H.神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)[M].北京:機(jī)械工業(yè)出版社,2002.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。