結(jié)合實例與代碼談數(shù)字圖像處理都研究什么?
圖像處理(以及機器視覺)在學(xué)校里是一個很大的研究方向,很多研究生、博士生都在導(dǎo)師的帶領(lǐng)下從事著這方面的研究。另外,就工作而言,也確實有很多這方面的崗位和機會虛位以待。而且這種情勢也越來越凸顯。那么圖像處理到底都研究哪些問題,今天我們就來談一談。圖像處理的話題其實非常非常廣,外延很深遠,新的話題還在不斷涌現(xiàn)。下面給出的12個大的方向,系我認為可以看成是基礎(chǔ)性領(lǐng)域的部分,而且它們之間還互有交叉
本文引用地址:http://www.ex-cimer.com/article/201702/344134.htm1、圖像的灰度調(diào)節(jié)
圖像的灰度直方圖、線性變換、非線性變換(包括對數(shù)變換、冪次變換、指數(shù)變換等)、灰度拉伸、灰度均衡、直方圖規(guī)定化等等)。
例如,直方圖規(guī)定化
CLAHE(contrast limited adaptive histogram equalization)自適應(yīng)的直方圖均衡
2、圖像的幾何變換
圖像的平移、圖像的鏡像、轉(zhuǎn)置、縮放和旋轉(zhuǎn)。這里面其實還包含了插值算法(這是某些幾何變換所必須的),例如最鄰近插值法、雙線性插值法等等)
幾何變換同時和圖像的濾鏡特效是緊密聯(lián)系的,某些特效的實現(xiàn)本質(zhì)上就是某種類型的幾何變換。例如
3、圖像的特效與濾鏡
這方面的應(yīng)用很多,你可以想想Photoshop里面的濾鏡。
文獻Combining Sketch and Tone for Pencil Drawing Production中給出的將自然圖像變成手繪素描圖的效果
例如浮雕效果
4、圖像增強
內(nèi)容包括圖像的平滑(簡單平均、中值濾波、高斯平滑等)和銳化(例如Laplace方法)等。
增強處理中的很多算法其實和圖像復(fù)原中的降噪算法是重合的?,F(xiàn)在保持邊緣(或紋理結(jié)構(gòu))的平滑算法屬于研究熱點。像那些美顏相機里的嫩膚算法都是以此為基礎(chǔ)的。比較常見的雙邊濾波
基于全變分方法的TV去噪、基于PM方程的非線性擴散去噪等等。
5、圖像復(fù)原
廣義上來說——圖像降噪,圖像去霧,圖像去模糊 都屬于這個范疇
去噪實例是我用MagicHouse實現(xiàn)的中值濾波處理椒鹽噪聲的效果。此外,一些基于非局部均值的降噪算法是當(dāng)前研究的熱點(例如BM3D、NLM等)
圖像去模糊
6、圖像的壓縮與編碼
想想BMP圖像如何轉(zhuǎn)換成JPG,JPG如何變成PNG?這些都屬于圖像壓縮編碼所要探討的內(nèi)容。
7、邊緣檢測與輪廓跟蹤
邊緣檢測在圖像處理中是一個“古老”的話題了,我就不具體給例子了。下面是一個輪廓跟蹤的例子
8、圖像分割
你可以認為輪廓跟蹤也是實現(xiàn)圖像分割的一種途徑。
這是我在《數(shù)字圖像處理原理與實踐(Matlab版)》中給出的一個例子——用分水嶺算法對馬鈴薯圖像進行分割。
9、圖像的形態(tài)學(xué)處理
這也屬于一種非常古老的圖像處理方式了。包括膨脹、腐蝕、細化、擊中/擊不中、開/閉運算等。但一些對顆粒狀物體進行計數(shù)的應(yīng)用中它仍然非常有效。
10、圖像的頻域變換(或稱正交變換)
傅立葉、離散余弦、沃爾什-哈達瑪變換、K-L(卡洛南-洛伊)變換(也稱霍特林變換或PCA)、小波變換(小波變換還分很多種,例如Haar小波、Daubechies小波等等)
僅僅進行頻域變換其實并沒有多大意義,它往往要與具體應(yīng)用相結(jié)合來發(fā)揮作用。例如進行圖像壓縮、嵌入數(shù)字水印、進行圖像融合、進行圖像降噪等等。
例如,利用PCA進行圖像壓縮的例子
在比如,利用小波融合對由聚焦失敗導(dǎo)致的圖像模糊進行修復(fù) (本來左圖和中圖各有部分看不清,融合后變得可以辨識)源代碼可見
11、圖像融合
廣義上說融合至少包含三部分內(nèi)容:像上面的基于小波的Fusion我們也認識是融合的一種,另外一種是以隱藏為目的類似嵌入式的融合,第三種是matting。matting有時反義成摳圖,其實它最原本的意思就是融合。如果你理解
I = aF +(1-a)B這個融合公式的話,你應(yīng)該明白我在所什么。這本質(zhì)上和第二種融合原理是一樣的。
狹義上,融合就是指matting。
例如 著名的Possion融合,下圖右,如果直接把月亮圖貼上天空,矩形邊緣是很明顯的,融合處理后的左圖則很自然。
電影技術(shù)中常用matting方法來替換人物的場景。例如
12、圖像信息安全
主要包括兩個內(nèi)容:1)數(shù)字水印(主要用于多媒體的版權(quán)保護);2)圖像的加密(主要用于圖像信息的保護)
例子是我用MagicHouse實現(xiàn)的加密效果
注意上面我們所討論的領(lǐng)域僅僅是圖像處理的范疇,并不涉及機器視覺。所以也沒有任何機器學(xué)習(xí)的內(nèi)容,有時間我們再繼續(xù)討論這方面的東西。
評論