基于圖像的目標區(qū)域分割算法研究
作者 楊順波,龍永紅,姚佳成,向昭宇(湖南工業(yè)大學 電氣與信息工程學院,湖南 株洲 421007)
本文引用地址:http://www.ex-cimer.com/article/201901/397276.htm摘要:通常在進行圖像處理時,并不需要對整幅圖像進行處理,往往我們感興趣的部分只有圖像中的某個區(qū)域??焖佟⒂行У貙⒛繕藚^(qū)域分割出來,不僅能降低運行時間,而且能為后續(xù)處理工作打下基礎。因此,本文將對目標區(qū)域分割算法進行研究,分別采用大津法(OTSU)、K-means聚類法、分水嶺算法進行研究,通過實驗對比發(fā)現(xiàn),背景較單一時,大津法相對來說效果較好。
關鍵詞:目標分割;大津法;K-means聚類法;分水嶺算法
0 引言
隨著人工智能技術(shù)的興起,無論是工業(yè)上還是生活上,人們對智能化的要求變得越來越高。那么對于生產(chǎn)一個智能化的產(chǎn)品而言,它首先應該考慮到問題就是要感知外部世界,目前感知外部世界主要有基于視覺、紅外、雷達、溫度等傳感器以及各傳感器混合使用的方法。當背景較為單一時,基于視覺的方法效果較好,而且價格也便宜。
然而,大多數(shù)情況下,我們并不需要整幅圖像的所有信息,我們感興趣的區(qū)域[1](ROI, Region of Interest)只是圖像中的一部分。為提高后續(xù)處理的效率,本文將對大津法[2](OTSU)、K-means聚類法[3]、分水嶺目標分割方法[4]進行研究,通過實驗比較三者之間的優(yōu)劣,為更好的改善區(qū)域分割算法打下基礎。
1 OTSU算法研究
1.1 OTSU算法的閾值分割
OTSU最早是在1979年被提出來,借助灰度直方圖,通過閾值的方式將圖像進行分類,然后計算各類之間的方差,選取使類間方差最大時閾值作為最優(yōu)閾值。本文實驗的對象背景單一,只需要進行單閾值就能將目標區(qū)域從圖像中分割出來。下面將重點分析OTSU算法的閾值分割。
原理分析如下:設圖像有L個灰度級,ni為第個灰度級所包含的像素個數(shù),N為總的像素個數(shù),則有,Pi為第i個灰度級出現(xiàn)的概率,表示為,則有。設定一個閾值t,將圖像按灰度級劃分為C0和C1兩類,其中。用w0,w1分別表示C0,C1兩類的概率分布。
其中分別表示類間方差、類內(nèi)方差和總方差,具體表示如下:
此時,問題轉(zhuǎn)化為如何尋找一個最優(yōu)t,使得三個判別函數(shù)最大。由于,因此a,b,g之間的關系式可以轉(zhuǎn)換為:
由上式可知,三個判別函數(shù)單調(diào)性一致,又因為能快速計算且與t無關。因此將作為分析對象最為簡單,又,所以能進一步簡化分析函數(shù),即將作為分類判別函數(shù):
其中。
假設最佳時的閾值為t*,則有:
由于本文實驗對象背景單一,只需要借助一維灰度直方圖就能很好實現(xiàn)分割,且不需要考慮像素空間位置等其它信息。因此,這里只對一維大津閾值法進行介紹,不對二維閾值方法進行介紹。
1.2 改進型OTSU算法
Otsu算法最關鍵的部分在于找一個合適的閾值t。t值過大,會丟失部分目標點;t值過小,則會產(chǎn)生一些偽目標點??梢?,t值過大、過小都會影響目標區(qū)域分割效果,進而為后面處理帶來影響。
鑒于上文分析的基礎上,對Otsu算法進一步改進。Otsu算法的基本原理是使得分割出來的類間距離較大,而類內(nèi)之間盡可能保持一定的聚合性,也就是各類中像素與類中心之間的距離盡量較小。根據(jù)以上要求,可以假設一個滿足上述要求的公式,即與各類之間的均值距離差成正比,與各類內(nèi)間距離之和成反比。當取最大時,此時的t就為所求的最佳閾值。表達式如下:
其中P0(t),PB(t)分別為目標,背景均值d0(t),d1(t),分別為目標、背景平均方差:
最佳閾值t對應X(t)取最大值時的t。分別對四個方向圖像進行處理,結(jié)果如圖1所示。
2 K-means聚類分割法
2.1 K-means算法分析
K-means算法是由Macqueen在1967年提出的,是一種具有無監(jiān)督學習性能的聚類算法。由于K-means算法簡單、易于實現(xiàn),且對規(guī)模較大的數(shù)有很好的聚類分割效果,因此,受到中外學者廣泛使用,并對它進行不斷改進。其核心思想在于對每個類進行反復迭代運算,直到迭代結(jié)果滿足一個穩(wěn)定值。該算法對連續(xù)型數(shù)據(jù)處理效果較好,對離散型數(shù)據(jù)處理效果不是很理想。
K-means算法實現(xiàn)的是內(nèi)類相似最大化,類間相似最小化,與Otsu算法正好相反,Otsu算法是使內(nèi)類達到方差最小化,內(nèi)類方差最大化。K-means算法同時也存在著不足,在執(zhí)行此算法時,首先需要選取初始聚類中心,還需要確定聚類數(shù)目(算法中的k值)和算法需要迭代的次數(shù)。如果所選初始中心為噪聲點或離散點,則算法很容易陷入局部聚類最優(yōu)值。當處理數(shù)據(jù)較大時,也易導致聚類時間延長,為此,又提出來很多改進K-means算法。Huifeng Cheng等人通過顏色轉(zhuǎn)換將RGB圖轉(zhuǎn)換成HIS圖,初始聚類中心以及初始聚類數(shù)通過平均方差確定,進行K-means算法聚類之后,利用粗糙集理論將彩色成分快速自動地分割出來。Shiv Ram Dubey等人根據(jù)水果顏色特征,提出了K-means無監(jiān)督缺陷分割方法,該方法是一種二維聚類法,利用了水果的顏色信息和空間信息進行聚類。該方法的一大優(yōu)點是:能將分好的小區(qū)域合并成較大的區(qū)域,減少了算法處理時間。
2.2 K-means算法流程
K-means算法流程圖如圖2所示。
?、匐S機從數(shù)據(jù)樣本n中取k個數(shù)據(jù)作為初始聚類中心;
②對數(shù)據(jù)樣本n中的每個數(shù)據(jù)進行分類,以距離最小為依據(jù),將每個數(shù)據(jù)與初始聚類中心計算,將數(shù)據(jù)歸為距離最小的那一類;
?、蹖π滦纬删垲愔械臄?shù)據(jù)不斷的求均值,將得到的均值作為聚類中心;
④若每次更新得到的均值不收斂,則返回第2步,以當前均值為聚類中心重新計算,直到均值收斂為止,此時均值即為聚類中心;
?、莸玫絢個聚類類別。
2.3 K-means算法最佳判別函數(shù)
設數(shù)據(jù)集為,其中xi表示由d維特征組成的向量。K-means算法將數(shù)據(jù)集劃分為k類,形成聚類集,設第Ck個類對應的聚類中心為mk,定義數(shù)據(jù)點到任意聚類中心mk的距離為:
則所有在Ck類中的數(shù)據(jù)點與聚類中心mk之間的距離之和可表示為:
上式為單個聚類集判別函數(shù)。那么將各聚類集的最小歐式距離求和一次,便得到了整個數(shù)據(jù)集的最小歐式距離,也即K-means算法的最佳判別函數(shù):
上式中。顯然,要使J最小,則應滿足J對任意聚類中心求偏導為0,即:
式中,因此可以看出J最小時,聚類中心為各類內(nèi)樣本數(shù)據(jù)的平均值,此時能得到最好的聚類效果。取不同k值時,結(jié)果如圖3所示。
3 分水嶺分割法
3.1 分水嶺算法分析
分水嶺法[8]算最早是Digabel和Lantuejoul等人將其引入數(shù)字圖像處理,該算法是一種基于數(shù)學形態(tài)學的分割方法。起初由于該算法被用于圖像的二值化,并沒有引起研究人員的廣泛關注,后來Vincent和Soille等人將像素灰度值看成地形高度值,模擬水浸沒過程實現(xiàn)分水嶺算法,此后該算法的優(yōu)勢便得以顯現(xiàn),同時受到學者們的廣泛關注。
基于浸水型的分水嶺算法是模擬底部浸水過程,漸漸浸水直到找到目標物邊緣。它是將圖像灰度值看成地面點高度值,因此灰度圖像就可以看成一幅上下起伏的地形圖。每個“積水盆地”之間的“山脈”被稱為“分水嶺”,浸水型分水嶺算法實現(xiàn)原理如下:
?、僭诟鳌胺e水盆地”最低點處刺孔;
?、趯⑺ㄟ^孔洞緩緩注入“積水盆地”;
?、垭S著水慢慢的涌入,水位漸漸上升,當水即將漫過盆地進入其它盆地時,在此即為該盆地的分水嶺;
④當水位即將漫過深度最深的盆地時,所有的盆地浸水過程結(jié)束,即實現(xiàn)的分水嶺操作。
當然,這只是分水嶺算法最基本的步驟。由于該算法對噪聲相當敏感,極易引起過分割,因此有必要在進行分水嶺算法之前對圖像濾波處理;同時分水嶺算法自身就存在著嚴重的過分割,該算法處理后會產(chǎn)生若干個非必要區(qū)域,嚴重影響處理效果,因此在處理之后加上一個合并操作,將相似區(qū)域進行合并,減少分割區(qū)域。浸水型分水嶺算法流程圖如圖4所示。
3.2 改進型分水嶺分割算法
由于分水嶺算法存在一些不足(噪聲敏感、過分割等),對此,人們開始著手研究其改進算法。改進的算法重點考慮如何很好的解決圖像過分割現(xiàn)象。研究發(fā)現(xiàn),基于標記理論的分水嶺算法能有效抑制過分割現(xiàn)象。與傳統(tǒng)的分水嶺算法相比,該算法預先標記極小值(像素)點,較好的抑制了圖像過分割。從本質(zhì)上看,是利用一種先驗知識來解決過度分割的問題。
基于標記的分水嶺算法實現(xiàn)步驟:
?、賹D像進行去噪處理;
?、趯D像進行梯度處理,計算處理后圖像中各“積水盆地”位置;
?、凼褂胕mextendedmin函數(shù)獲得標記符;
④使用watershed函數(shù)對標記好的圖像進行分割處理;
?、莺喜⑦^分割區(qū)域。
傳統(tǒng)方法與改進方法處理效果如圖5所示。
4 實驗結(jié)果與分析
上述實驗均是基于VS2015+Opencv3.1.0實驗平臺。根據(jù)圖1可以看出,對四個不同方向圖像處理后,隨著相機與目標物之間夾角的增大,分割出來的目標物偏差也在增大。誤分割主要是發(fā)生在兩個側(cè)面,側(cè)面光線較暗,算法處理時兩個側(cè)面部分被當作背景,沒有分割出來。根據(jù)圖3有:取不同的k值進行實驗,k值較小時處理效果較好。這也與本實驗所處的場景相吻合,即背景單一,聚類中心少,所需k值小。同時隨著k值的增大,算法處理時間也有相應延長。根據(jù)圖5有:改進的分水嶺算法較傳統(tǒng)算法有了較大提高,基于標記的分割法對分水嶺算法的過分割現(xiàn)象有很好的抑制效果。相關實驗數(shù)據(jù)如表1所示,其中OTSU算法取a圖數(shù)據(jù),K-means算法取k=2時的數(shù)據(jù)。
5 結(jié)論
通過對三種不同的分割算法進行比較,當背景區(qū)域較為單一時,大津閾值法相對來說效果較好。但是,圖像的背景往往都比較復雜,因此十分有必要對背景較復雜的圖像進行研究。接下來的研究工作的重點是對復雜背景下圖像分割算法分析與改進。
參考文獻
[1]呂欣然,陳潔,張立保,等.基于顯著特征聚類的遙感圖像感興趣區(qū)域檢測[J].光學學報,2015,35(A01):103-108.
[2]曹亮.基于 Otsu 理論的圖像分割算法研究[D].武漢:武漢理工大學,2008.
[3]劉小丹,牛少敏.一種改進的 K—means 聚類彩色圖像分割方法[J]. 湘潭大學自然科學學報, 2012, 34(2): 90-93.
[4]王宇,陳殿仁,沈美麗,等.基于形態(tài)學梯度重構(gòu)和標記提取的分水嶺圖像分割[J].中國圖象圖形學報, 2008, 13(11): 2176-2180.
[5]Patel B C, Sinha D G R. An adaptive K-means clustering algorithm for breast image segmentation[J]. International Journal of Computer Applications, 2010, 10(4): 35-38.
[6]Paul T U,Bandhyopadhyay S K. Segmentation of Brain Tumor from Brain MRI Images Reintroducing K–Means with advanced Dual Localization Method[J]. International Journal of Engineering Research and Applications (IJERA), 2012, 2(3): 226-231.
[7]王雪光,陳淑紅.基于K均值聚類的成熟草莓圖像分割算法[J].農(nóng)機化研究, 2013, 35(6): 51-54.
[8]孫惠杰,鄧廷權(quán),李艷超.改進的分水嶺圖像分割算法[J].哈爾濱工程大學學報,2014, 35(7): 857-864.
[9]Soille B V. Watershed in Digital Spaces: An Efficient Based on Immersion Simu-lations[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1991,13(6) : 583–598.
[10]郭昱杉,劉慶生,劉高煥,等.基于標記控制分水嶺分割方法的高分辨率遙感影像單木樹冠提取[J].地球信息科學學報, 2016,18(9):1259-1266.
本文來源于科技期刊《電子產(chǎn)品世界》2019年第2期第64頁,歡迎您寫論文時引用,并注明出處
評論