<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 一種文檔圖像檢索算法設(shè)計(jì)和實(shí)現(xiàn)

一種文檔圖像檢索算法設(shè)計(jì)和實(shí)現(xiàn)

作者：時間：2011-07-04 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

摘要：介紹了一種基于版面結(jié)構(gòu)距離的文檔圖像檢索算法，使用版面特征作為文檔圖像的特征檢索圖像。先將文檔圖像進(jìn)行梯度和最大梯度差（MGD）計(jì)算，然后使用MGD值作為一個窗口對文本區(qū)域進(jìn)行融合，將文檔圖像以行線的形式標(biāo)示出來。同時給出了檢索的匹配方法，并對匹配方法進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明，該檢索方法具有較高的查準(zhǔn)率，具有很好的抗傾斜和抗縮放效果。

本文引用地址：http://www.ex-cimer.com/article/150529.htm

　　文檔圖像一般意為含有文字信息的圖像，目前大多數(shù)信息是以數(shù)字化形式存在的，并以文檔的形式組織起來存放在數(shù)據(jù)庫中。在這樣的數(shù)據(jù)庫中查找有關(guān)資料其技術(shù)是關(guān)鍵。常見的文檔圖像檢索方法是基于內(nèi)容的文檔圖像檢索（CBIR）。它是利用圖像本身的信息，通常以圖像特征（顏色、紋理、形狀、結(jié)構(gòu)布局和語義特征等）的相似性為檢索依據(jù)，根據(jù)每幅圖像都有的可比較特征進(jìn)行檢索。

　　近年來，數(shù)字化文檔被廣泛應(yīng)用于辦公自動化、數(shù)字化圖書館、工業(yè)自動化等領(lǐng)域。隨著科技的發(fā)展，傳統(tǒng)掃描儀體積大、效率低、攜帶不方便等不足之處日益突出，而數(shù)字照相機(jī)體積小、價位低，可以很容易地攜帶并結(jié)合到手機(jī)、手提電腦以及各種網(wǎng)絡(luò)設(shè)備中去，它還可以遠(yuǎn)距離地對背景文字及脆弱的珍貴文檔拍照，更適用于無約束環(huán)境下的數(shù)字化操作。因此，將數(shù)字照相機(jī)引入文檔圖像分析已經(jīng)引起越來越多人的關(guān)注。

　　Newman的調(diào)查表明，從報紙上提取段落時，基于PC攝像頭的OCR操作比基于掃描儀的OCR操作效率高得多；Fisher等調(diào)查了在戰(zhàn)場上用數(shù)字?jǐn)z像機(jī)替換士兵攜帶sheet-fed掃描儀的可能性。經(jīng)證實(shí)，數(shù)字?jǐn)z像機(jī)能夠以200dpi拍攝整張A4文檔紙，已經(jīng)達(dá)到OCR所要求的分辨率。

　　BEUSEKOM J V.等人提出了一種基于版面分析的文檔圖像檢索的距離度量方法，將文本區(qū)域分為不同的矩形塊，然后找到塊的中心點(diǎn)，利用角點(diǎn)的曼哈頓距離來計(jì)算塊之間的距離，再利用三種不同的方法進(jìn)行匹配[1]；WONG K Y.使用游程平滑算法進(jìn)行版面信息提取的方法[2]；BREUEL T M.提出了使用Whitespace算法來提取版面信息[3]。

　　圖像匹配是指通過一定的匹配算法在兩幅或多幅圖像之間識別同名點(diǎn)，如二維圖像匹配中通過比較目標(biāo)區(qū)和搜索區(qū)中相同大小的窗口的相關(guān)系數(shù)，取搜索區(qū)中相關(guān)系數(shù)最大所對應(yīng)的窗口中心點(diǎn)作為同名點(diǎn)。其實(shí)質(zhì)是在基元相似性的條件下，運(yùn)用匹配準(zhǔn)則的最佳搜索問題。

　　灰度匹配的基本思想：以統(tǒng)計(jì)的觀點(diǎn)將圖像看成是二維信號，采用統(tǒng)計(jì)相關(guān)的方法尋找信號間的相關(guān)匹配。利用兩個信號的相關(guān)函數(shù)，評價它們的相似性以確定同名點(diǎn)。

　　灰度匹配通過利用某種相似性度量，如相關(guān)函數(shù)、協(xié)方差函數(shù)、差平方和、差絕對值和等測度極值，判定兩幅圖像中的對應(yīng)關(guān)系。

　　最經(jīng)典的灰度匹配法是歸一化的灰度匹配法，其基本原理是逐像素的把一個以一定大小的實(shí)時圖像窗口的灰度矩陣，與參考圖像的所有可能的窗口灰度陣列，按某種相似性度量方法進(jìn)行搜索比較的匹配方法，從理論上說就是采用圖像相關(guān)技術(shù)。

　　利用灰度信息匹配方法的主要缺陷是計(jì)算量太大，因?yàn)槭褂脠龊弦话愣加幸欢ǖ乃俣纫螅赃@些方法很少被使用?，F(xiàn)在已經(jīng)提出了一些相關(guān)的快速算法，如幅度排序相關(guān)算法，F(xiàn)FT相關(guān)算法和分層搜索的序列判斷算法等。

　　1 相關(guān)工作

　　1.1 文本行標(biāo)記

　　將得到的文檔圖像進(jìn)行預(yù)處理，具體的處理方法是：使用文本行標(biāo)記算法實(shí)現(xiàn)文字區(qū)域的行定位。本文使用[-1，0，1]對圖像進(jìn)行處理計(jì)算其梯度，然后計(jì)算其MGD。MGD計(jì)算方法如下：在一個大小為n的窗口內(nèi)，用它的最大梯度差來進(jìn)行填充，以達(dá)到文本融合的目的。因?yàn)橛⑽暮椭形牡淖址麑挾炔煌?，根?jù)具體的情況選擇n，大于字符間距即可。將計(jì)算出來的梯度求它的最大值和最小值，然后相減，即為最大梯度差。將得到的MGD圖像使用最大類間方差方法[5]（OTSU）求出閾值得到二值圖像[2]。圖1為使用上述方法對行塊進(jìn)行標(biāo)記的圖像。

　　1.2 消除階躍跳變

　　對于手寫體或者英文的文檔，會出現(xiàn)字符高低不一、筆畫不連續(xù)等情況。線特征產(chǎn)生的斷點(diǎn)可采用形態(tài)學(xué)方法、凸凹點(diǎn)處理和噪聲處理三種基本策略提高直線的連續(xù)性，然后采用階梯插補(bǔ)算法來消除階躍跳變，算法的復(fù)雜度相對較低。

　　在像素級上進(jìn)行處理是：當(dāng)出現(xiàn)行階躍跳變的情況時，使用如圖2的模板來對其進(jìn)行填充。因?yàn)槲臋n圖像的行塊在4個方向上都有可能出現(xiàn)這種階躍，所以采用一個3×3的模板，以位置5為中心點(diǎn)，如圖3所示，4種情況都包含其中：1和4為非文本像素，對4進(jìn)行填充；3和6為非文本像素，對6進(jìn)行填充；4和7為非文本像素，對4進(jìn)行填充；6和9為非文本像素，對6進(jìn)行填充。如果填充之后依然有符合結(jié)構(gòu)的像素，則繼續(xù)填充，即把需要填充的區(qū)域都填充完整。填充前后的圖像如圖4所示。

絕對值編碼器相關(guān)文章:絕對值編碼器原理
三維掃描儀相關(guān)文章:三維掃描儀原理

上一頁 1 2 3 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 設(shè)計(jì) 實(shí)現(xiàn) 算法檢索圖像文檔

評論

相關(guān)推薦

用于移動、消費(fèi)及汽車應(yīng)用的圖像穩(wěn)定方案視頻教程

視頻安森美半導(dǎo)體 OIS LC898111AXB 圖像 | 2013-12-17

SHIPT算法擠壓了外包工人如何對雇主進(jìn)行審計(jì)

智能計(jì)算 SHIPT 算法算法管理 | 2024-07-04

CMOS 圖像傳感器為自動駕駛汽車提供視覺感知

物聯(lián)網(wǎng)與傳感器傳感器圖像自動駕駛 | 2024-04-08

用點(diǎn)亮LED舉例，說明嵌入式軟件分層設(shè)計(jì)的思想

嵌入式 LED 軟件設(shè)計(jì) | 2024-02-29

模擬電路PWM的實(shí)現(xiàn)

設(shè)計(jì)方案模擬電路實(shí)現(xiàn) | 2009-07-06

DSP虛擬I2C總線軟件包的設(shè)計(jì)及應(yīng)用實(shí)例

hpnet | 2002-05-17

單級高功率因數(shù)調(diào)光式熒光燈電子鎮(zhèn)流器設(shè)計(jì)

設(shè)計(jì)方案單級高功率因數(shù) 調(diào)光熒光燈電子鎮(zhèn)流器設(shè)計(jì) | 2009-07-06

IGBT實(shí)現(xiàn)慢降柵壓的電路

設(shè)計(jì)方案實(shí)現(xiàn) 慢降柵壓 | 2009-07-06

蘋果發(fā)布DeepPCR機(jī)器學(xué)習(xí)算法：加速神經(jīng)網(wǎng)絡(luò)的推理和訓(xùn)練

蘋果 DeepPCR 機(jī)器學(xué)習(xí) 算法神經(jīng)網(wǎng)絡(luò) | 2023-12-20

仿真器概念及實(shí)現(xiàn)技術(shù)

jackwang | 2002-05-14

CNTTR通信電源勘察、設(shè)計(jì)培訓(xùn).rar

資源下載 CNTTR 通信電源勘察、設(shè)計(jì) | 2007-12-16

嵌入式開發(fā)者都該了解的十大算法

嵌入式開發(fā)者算法 | 2024-07-16

PCB設(shè)計(jì)的EMC考慮

EDA/PCB PCB EMC 設(shè)計(jì) | 2024-05-31

消費(fèi)總線電力線接口電路的設(shè)計(jì)

資源下載消費(fèi)總線電力線接口電路設(shè)計(jì) | 2007-12-25

數(shù)字搶答器設(shè)計(jì)

設(shè)計(jì)方案數(shù)字搶答設(shè)計(jì) | 2009-07-06

超強(qiáng)整理！電機(jī)控制算法

電機(jī) 算法 BLDC | 2024-05-21

西門子推出 Solido IP 驗(yàn)證套件，為下一代 IC 設(shè)計(jì)提供端到端的芯片質(zhì)量保證

EDA/PCB 西門子 Solido IP IC設(shè)計(jì) IC 設(shè)計(jì) | 2024-05-23

利用PIC24F Curiosity開發(fā)板簡化設(shè)計(jì)

視頻 microchip 開發(fā)板設(shè)計(jì) PIC24F | 2018-01-18

一種數(shù)字接收機(jī)的設(shè)計(jì)

資源下載接收機(jī) 數(shù)字接收機(jī) 設(shè)計(jì) | 2007-12-22

PID算法原理介紹

PID 算法工業(yè)控制調(diào)節(jié)器 | 2023-11-28

8檔位恒流電流設(shè)計(jì)

設(shè)計(jì)方案檔位恒流電流設(shè)計(jì) | 2009-07-06

數(shù)字功放設(shè)計(jì)

資源下載功放數(shù)字功放設(shè)計(jì) | 2007-12-24

仿蚯蚓機(jī)器人蠕動裝置驅(qū)動電路的設(shè)計(jì)

資源下載蚯蚓機(jī)器人蠕動裝置驅(qū)動電路設(shè)計(jì) | 2007-12-25

[電子文檔]ARM Architecture Reference Manual

amine | 2002-05-18

[新書介紹]: 嵌入式計(jì)算系統(tǒng)設(shè)計(jì)原理(老站轉(zhuǎn))

amine | 2002-05-16

硬件開發(fā)文檔規(guī)范

嵌入式系統(tǒng) 硬件開發(fā) 文檔 | 2024-04-24

[轉(zhuǎn)帖]us/os就緒表的維護(hù)算法分析

amine | 2002-05-17

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();