基于Kmean的乳腺腫塊檢測(cè)方法
乳腺分割
本文引用地址:http://www.ex-cimer.com/article/184614.htm在對(duì)圖像進(jìn)行了去除背景、胸肌、標(biāo)記以及噪聲后,為了更好的提取乳腺區(qū)域的特征,我們需要將乳腺區(qū)域提取出來(lái)。
本文提取乳腺區(qū)域的方法是:首先,將圖像在垂直方向上等間隔分成11份;其次,在水平方向上的每一個(gè)間隔內(nèi)每隔50個(gè)像素從背景區(qū)域向乳腺區(qū)域進(jìn)行搜索,直到找到離乳腺區(qū)域最近的點(diǎn);然后,將每個(gè)間隔內(nèi)得到的點(diǎn)按照三次樣條插值連接起來(lái),這樣就將乳腺區(qū)域的邊界找出來(lái)了;最后,根據(jù)一定的閾值將邊界外的背景區(qū)域去除,以此完成乳腺區(qū)域的分割。
提取感興趣區(qū)域
為了得到感興趣區(qū)域(ROI),本文采用了無(wú)監(jiān)督聚類方法Kmean。起初我們對(duì)每幅圖像應(yīng)用Kmean時(shí)采用的K值是不同的,是根據(jù)經(jīng)驗(yàn)值得到的。通過(guò)這些經(jīng)驗(yàn)值得到的結(jié)論是:如果腫塊的面積比較大且灰度值比較大,則采用的K值較小,反之,如果腫塊的面積比較小,則采用的K值比較大。為此,我們采用的是一種自適應(yīng)K值的Kmean聚類方法。
傳統(tǒng)Kmean算法
Kmeans算法[7]的工作過(guò)程如下:首先從n個(gè)數(shù)據(jù)對(duì)象任意選擇K個(gè)對(duì)象作為初始聚類中心,而對(duì)所剩下的其他對(duì)象,則根據(jù)他們與這些聚類中心的相似度,分別將他們分配給與其最相似的聚類。然后,再計(jì)算每個(gè)所獲新聚類中心,不斷重復(fù)這一過(guò)程直到標(biāo)準(zhǔn)測(cè)度函數(shù)開(kāi)始收斂為止。一般都采用均方差作為標(biāo)準(zhǔn)測(cè)度函數(shù),具體定義如下:
其中,p代表對(duì)象空間中的一個(gè)點(diǎn),mi為聚類的均值。
改進(jìn)的Kmean算法
楊善林[8]等人構(gòu)造了距離代價(jià)函數(shù),并以距離代價(jià)最小準(zhǔn)則求解最佳聚類數(shù)K。距離代價(jià)函數(shù)為:
其中,m為全部樣本的均值,p代表對(duì)象空間中的一個(gè)點(diǎn),mi為聚類的均值
該方法的原理是:首先,根據(jù)經(jīng)驗(yàn)規(guī)則計(jì)算和確定最優(yōu)解的上界,其中n為輸入的數(shù)據(jù)個(gè)數(shù);其次,用Kmean算法實(shí)現(xiàn)所有數(shù)目下的空間聚類;然后,根據(jù)距離代價(jià)函數(shù)分別計(jì)算不同聚類數(shù)目K下的F(S,K)值;最后,搜尋距離代價(jià)函數(shù)最小的F(S,K),并記下相應(yīng)的K值。
提取ROI
由于腫塊的灰度值與正常組織不同,所以我們提取的特征包括每個(gè)像素點(diǎn)的灰度值以及以該像素點(diǎn)為中心的4,8連通區(qū)域的均值,窗口內(nèi)的均值。將這些特征作為Kmean的輸入,K值根據(jù)改進(jìn)的Kmean方法獲得。根據(jù)腫塊亮度比較大的特點(diǎn),將每幅圖像中灰度值比較大的簇提取出來(lái),作為感興趣區(qū)域(ROI)。
經(jīng)過(guò)Kmean聚類后得到的感興趣區(qū)域如圖3所示。其中紅色曲線表示得到的感興趣區(qū)域。由圖可以看出來(lái),提取的ROI中均存在假陽(yáng)性區(qū)域。
由于通過(guò)Kmean得到的ROI并不都是腫塊,所以需要提取可以表征腫塊的特征。形態(tài)學(xué)特征已廣泛應(yīng)用于醫(yī)學(xué)圖像的目標(biāo)檢測(cè)。因此,通過(guò)對(duì)得到的ROI的二值圖像中的獨(dú)立區(qū)域提取形態(tài)學(xué)特征,將ROI進(jìn)行進(jìn)一步的分類。在本文中我們主要用的特征包括:面積(Area),離心率(Eccentricity),圓形度(Circularity),可靠性(Solidity)以及占空比(Extent)。
評(píng)論