一種基于SVM的數(shù)字儀表顯示值識(shí)別方法
數(shù)字儀表結(jié)構(gòu)簡(jiǎn)單,使用方便,已廣泛應(yīng)用于科學(xué)實(shí)驗(yàn)和生產(chǎn)中。為了提高檢定效率、檢定精度,實(shí)現(xiàn)自動(dòng)化檢定是十分必要的。由于數(shù)字儀表的檢定是一項(xiàng)大批量、重復(fù)性的檢測(cè)過(guò)程,其操作過(guò)程簡(jiǎn)單、規(guī)范,外界環(huán)境要求不高,這為其實(shí)現(xiàn)檢定自動(dòng)化提供了有利條件。近年來(lái)計(jì)算機(jī)視覺(jué)技術(shù)和數(shù)字圖像處理技術(shù)的不斷發(fā)展,為滿(mǎn)足上述要求提供了可能。利用攝像機(jī)完成表盤(pán)及背景圖像的采集,并將其轉(zhuǎn)換成數(shù)字信號(hào),然后利用數(shù)字圖像處理技術(shù)實(shí)現(xiàn)關(guān)鍵操作,實(shí)現(xiàn)數(shù)字儀表的自動(dòng)檢定,提高了檢定精度、生產(chǎn)效率、降低了生產(chǎn)成本。本文開(kāi)發(fā)的儀表顯示值自動(dòng)實(shí)時(shí)識(shí)別系統(tǒng)主要包括:圖像預(yù)處理、特征提取和數(shù)字識(shí)別3部分。其中數(shù)字識(shí)別是關(guān)鍵一環(huán),主要采用了學(xué)習(xí)理論中的支持向量機(jī)方法。學(xué)習(xí)理論是一種研究有限樣本情況下機(jī)器學(xué)習(xí)性質(zhì)和規(guī)律的理論。在這一理論下發(fā)展出的一種通用的模式分類(lèi)器——支持向量機(jī),由于與傳統(tǒng)的模式識(shí)別方法相比,具有推廣能力強(qiáng),能保證全局最優(yōu)等優(yōu)點(diǎn),這使得支持向量機(jī)技術(shù)在數(shù)字識(shí)別系統(tǒng)中有很好的應(yīng)用前景,因而引起了國(guó)內(nèi)外學(xué)者的極大興趣。支持向量機(jī)通過(guò)結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則和核函數(shù)方法,較好地解決了模式分類(lèi)器復(fù)雜性與推廣性之間的矛盾,因而也引起了模式識(shí)別領(lǐng)域?qū)W者的極大關(guān)注。
1 儀表示值自動(dòng)識(shí)別原理
儀表顯示值自動(dòng)實(shí)時(shí)識(shí)別系統(tǒng)的流程:首先,由攝像頭獲取儀表顯示的視頻幀;然后,將視頻幀進(jìn)行灰度變換,二值化得到二值圖像;再通過(guò)邊緣檢測(cè),操作微分直方圖,計(jì)算表盤(pán)水平和垂直投影,進(jìn)行峰谷分析定位出數(shù)字區(qū)域,并切分出單個(gè)數(shù)字的二值圖像;對(duì)單個(gè)數(shù)字的圖像進(jìn)行特征提取,得到一組特征;最后,將特征送入識(shí)別器進(jìn)行識(shí)別。
1.1 預(yù)處理
數(shù)字儀表在檢定過(guò)程中,首先要定位表盤(pán)區(qū)域,然后確定數(shù)字位置。攝像頭提取圖像后,經(jīng)過(guò)灰度變換(見(jiàn)圖1)和二值化(見(jiàn)圖2),其效果將對(duì)后續(xù)的數(shù)字切分和特征提取產(chǎn)生直接的影響,其中二值化是圖像預(yù)處理的關(guān)鍵環(huán)節(jié),在實(shí)際應(yīng)用中受室內(nèi)燈光及儀表屏幕自身亮度等因素影響,圖像中往往存在灰度分布不均和灰度突變的情況。本文采用了OTSU算法,根據(jù)最大方差二值化獲得良好的二值圖像,這里主要為了提取表盤(pán)區(qū)域。通過(guò)標(biāo)識(shí)連通區(qū)域,連通區(qū)域的外接矩形,然后根據(jù)外接矩形的長(zhǎng)與寬定位數(shù)字儀表的顯示區(qū)域。本文采用了一個(gè)8連通區(qū)域提取算法。首先按照一定的標(biāo)號(hào)規(guī)則掃描圖像,得到一定數(shù)量的連通區(qū)域;然后針對(duì)同一區(qū)域內(nèi)標(biāo)號(hào)不一致的情況進(jìn)行處理,即得到最終處理結(jié)果。
1.2 數(shù)字分割
表盤(pán)區(qū)域分割之后,繼續(xù)分割數(shù)字區(qū)域。在實(shí)際應(yīng)用中,攝像頭是固定的,數(shù)字的顯示區(qū)域在圖像中的位置、大小等是基本相似的。本文根據(jù)數(shù)字儀表顯示屏幕的特點(diǎn),采用投影法找到顯示屏的邊框。圖像中數(shù)字區(qū)域的準(zhǔn)確定位分割是實(shí)現(xiàn)儀表顯示值識(shí)別的重要前提。在表盤(pán)的二值圖內(nèi),先通過(guò)邊緣檢測(cè),利用微分直方圖進(jìn)行數(shù)字分割,圖3為水平投影后的直方圖。
經(jīng)過(guò)水平投影將圖像分割成上、中、下3部分。對(duì)中部數(shù)字區(qū)域的二值圖像從上到下逐行掃描;獲取到圖像的水平投影圖。利用行間間隔形成的水平投影間隙,即可將各數(shù)字行分割開(kāi)來(lái),如圖4所示,然后提取中部截圖,再對(duì)中部數(shù)字區(qū)域做垂直投影,如圖5所示,計(jì)算峰谷可以將單個(gè)數(shù)字分割出來(lái)。字切割是從行切分后,得到的圖像中將每一個(gè)數(shù)字分割出來(lái),利用每行字符的垂直投影中字符之間的間隙即可將各個(gè)數(shù)字分割出來(lái)。
評(píng)論