一種文檔圖像檢索算法設(shè)計和實現(xiàn)
3 實驗結(jié)果與分析
應(yīng)用上述方法進行了實驗,數(shù)據(jù)為手寫體英文,數(shù)據(jù)采集分辨率為100 dpi,256級灰度圖像,數(shù)據(jù)量為100幅文檔圖像。對不同的圖像分別比較它們的相似度。圖7(b)、(c)、(d)是與圖7(a)的相似度分別為40.422 9、45.760 7和43.407 8的圖像。圖8(b)、(c)、(d)是與圖8(a)原圖像版面結(jié)構(gòu)相似的幾種圖像類型。圖9(b)、(c)、(d)是與圖9(a)原圖像版面結(jié)構(gòu)具有差異的幾種圖像類型。
本文使用對100幅文檔圖像兩兩進行版面結(jié)構(gòu)的匹配,共有4 950種結(jié)果。實驗結(jié)果表明,兩種不同版面的能量差異最大的在340左右,如圖10所示。橫坐標顯示的是100幅圖像兩兩匹配出現(xiàn)的情況的數(shù)目,可以取到的最大坐標為4 950,縱坐標為各匹配情況對應(yīng)的能量差異,最大值350。從圖中可以看出能量差異主要集中在50~200之間。
各個能量點的頻數(shù)的直方圖如圖11所示,圖中橫坐標為能量差異數(shù)據(jù),最大為340左右,提取到350??v坐標為取到各個能量的情況的數(shù)目的累加。從圖11可以更直觀地觀察到能量差異在50~200之間的數(shù)目最多。
實驗結(jié)果表明:(1)文檔圖像的版面結(jié)構(gòu)具有相對的穩(wěn)定性。(2)點匹配模式計算了最小距離,可有效表示圖像的文本行基本信息。(3)距離匹配較為簡單,使用了三個維度的一維距離,有較好的區(qū)分性。對距離計算統(tǒng)計表明,具有正態(tài)分布特性。(4)點匹配模式需進一步進行研究,算法的復(fù)雜度需進一步降低,以進行實時圖像處理。
本文針對文檔圖像的檢索方法進行了研究,提出一種文檔圖像檢索的新方法。分析了文檔圖像版面特性,使用分割方法確定文本行,將文本行進行標記,找出頁面的中心點坐標,中心點坐標將文本行的長度作為權(quán)重考慮在內(nèi),得到相對坐標。根據(jù)相對坐標和文本行長度得到一個差異能量,根據(jù)差異能量來進行匹配。并對該方法進行了實驗和結(jié)果分析。本方法的優(yōu)點是,當文檔的行出現(xiàn)傾斜和縮放時,不影響匹配的進行。但需要進一步降低所用的點匹配模式時間復(fù)雜度,以進行實時圖像處理。
評論