<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 基于QS的字符串匹配改進算法

基于QS的字符串匹配改進算法

作者：時間：2012-02-03 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

串匹配問題是計算機科學(xué)領(lǐng)域研究中的一個焦點問題，它在諸多非數(shù)值處理方面都有著非常廣泛的應(yīng)用。串匹配就是在一個大的正文T中搜索指定模式P的所有出現(xiàn)位置。按照功能，串匹配算法主要分為三類：精確串匹配算法、近似串匹配算法和正則表達式算法。其中，最有影響的是KMP算法、BM算法、RK隨機算法和SUANDAY算法以及由此而產(chǎn)生的一些改進算法。在實際應(yīng)用中，這些算法都各有千秋，各有側(cè)重。

本文引用地址：http://www.ex-cimer.com/article/149786.htm

1 BM和QC算法分析

字符串匹配問題描述：

1.1 BM算法

BM是由Boyer和Moore于1977年提出的，它是一種簡單、快速、通用的工程算法。它的特點是在窗口內(nèi)部從右向左逆向匹配，采用壞字符啟發(fā)和好后綴啟發(fā)兩種方法，通過預(yù)處理模式分別計算BadcharShift[char]和GoodSufShift[char]轉(zhuǎn)移表。當(dāng)發(fā)現(xiàn)不匹配時，選擇兩者中的最大值作為模式向右移動的距離。

BM算法的預(yù)處理分為壞字符轉(zhuǎn)移表和好后綴轉(zhuǎn)移表。

壞字符移動表記錄的是字符char在模式串P中的最右出現(xiàn)位置。具體表述為：

BM算法的空間復(fù)雜度和預(yù)處理時間均為O（m+σ）。在最壞情況下，它的時間復(fù)雜度為O（nm）；在最好情況下，時間復(fù)雜度為O（n/m）。

從理論上講，BM算法的時間復(fù)雜度要大大高于KMP算法的時間復(fù)雜度O（m+n），但在實際應(yīng)用中，BM算法的搜索步長接近于模式長度m，所以執(zhí)行效率非常高。

1.2 QS算法

QS算法是一種簡單、快速、實用的算法。在模式匹配過程中，該算法將發(fā)生失配的字符與計算右移量兩者獨立開來的現(xiàn)象，其僅利用T[i+m]字符計算BadcharShift[T[i+m]]來決定模式轉(zhuǎn)移。通常情況下，模式轉(zhuǎn)移量為m+1，這大大提高了算法的搜索步長和匹配效率。

QS算法的預(yù)處理與BM算法的對壞字符啟發(fā)的預(yù)處理相同。

QS算法的匹配過程如下：

QS算法的空間復(fù)雜度和預(yù)處理時間均為O（m+σ）。在最壞情況下，它的時間復(fù)雜度為O（mn）；在最好情況下，時間復(fù)雜度為O（n/m+1）。

QS算法利用了失配情況下T[i+m]字符引起的Badchar-

Shift[T[i+m]]使其編碼簡單且調(diào)試迅速。通常情況下，QS算法比BM算法要快，但是當(dāng)T[i+m-1]不在模式中，而T[i+m]在模式中時，QS算法的效率就會大打折扣。

2 新算法

2.1 算法基本思想及步驟

本文在上述分析的基礎(chǔ)上，充分挖掘了其潛在可利用的隱含信息，進一步優(yōu)化和完善了QS算法。在預(yù)處理方面，新算法與QS算法基本相同，不同的是當(dāng)模式在當(dāng)前模式匹配窗口內(nèi)自右向左匹配正文的過程中發(fā)生失配時，比較正文中T[i+m]和T[i+m-1]這兩個字符的移動距離，取其最大值進行移動，然后在新位置重新開始模式匹配。圖1為一個新算法匹配過程示例。

新算法的匹配過程如下：

新算法在QS算法的基礎(chǔ)上，充分利用了失配時T[i+m-1]和T[i+m]兩個字符引起的移動距離的最大值，使得移動距離增大，減少了模式匹配的比較次數(shù)。通常情況下，新算法的時間復(fù)雜度為O（n/m+1）。

2.2 性能測試

針對本文提出的新算法，從參考文獻[1]中抽取chapter 32 STring Matching中第一段內(nèi)容作為測試正文，并在同樣的軟硬件環(huán)境下對BF、BM、QS和新算法進行比較，以檢測新算法在性能和效率方面的表現(xiàn)。表1為各種算法性能比較結(jié)果。

測試正文：

Finding all occurrences of a pattern in a text is a problem that arises frequently in text editing programs.Typically，the text is a document being edited，and the pattern searched for is a particular word supplied by the user.Efficiedt algorithms for this problem can greatly aid the respONsiveness of the test editing program.String matching algorithms are also used，for example，to search for particular patterns in DNA sequences.

搜索模式：the pattern searched

由表1可知：新算法是一種比較次數(shù)少、耗時小、效率高的快速字符串匹配算法。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：改進算法匹配 字符串 QS 基于

評論

相關(guān)推薦

SHIPT算法擠壓了外包工人如何對雇主進行審計

智能計算 SHIPT 算法算法管理 | 2024-07-04

基于D類功放專用驅(qū)動芯片驅(qū)動的高保真純正弦波逆變器

設(shè)計方案基于功放專用驅(qū)動芯片高保真正弦波逆變器 | 2009-07-06

Motorola大獎賽初賽結(jié)果公布

Gao | 2002-06-04

PID算法

資源下載 PID 算法誤差 | 2007-02-16

單片機ADC常用的十大濾波算法（C語言）

單片機 ADC 濾波算法 C語言 | 2023-05-23

基于RC電路的一次性濾波器

設(shè)計方案基于電路一次性濾波器 | 2009-07-06

基于D類功放專用驅(qū)動芯片驅(qū)動的高保真純正弦波逆變器1

設(shè)計方案基于功放專用驅(qū)動芯片高保真正弦波逆變器 | 2009-07-06

《用LM324制作搶答器》的改進

資源下載 LM324 搶答器改進 | 2007-02-16

PID算法原理介紹

PID 算法工業(yè)控制調(diào)節(jié)器 | 2023-11-28

基于運放的差動放大器

設(shè)計方案基于運放差動放大器 | 2009-07-06

嵌入式開發(fā)者都該了解的十大算法

嵌入式開發(fā)者算法 | 2024-07-16

超強整理！電機控制算法

電機算法 BLDC | 2024-05-21

基于VxWorks的多DSP系統(tǒng)的多任務(wù)程序設(shè)計(老站轉(zhuǎn))

amine | 2002-05-28

數(shù)字PID控制算法之一

資源下載 PID PID控制算法 | 2007-12-28

簡單實用的單片機CRC 快速算法

資源下載 CRC 算法單片機 | 2007-02-16

基于機器視覺的帶鋼焊縫定位

工控自動化卷積神經(jīng)網(wǎng)絡(luò) 實例標(biāo)準(zhǔn)化特征提取算法 202212 | 2022-12-25

加密算法之MD5算法

資源下載加密算法加密算法 MD5算法 | 2007-02-16

基于MSP430F133的電子鎮(zhèn)流器綜合測試儀

設(shè)計方案基于 MSP430F133 電子鎮(zhèn)流器綜合測試儀 | 2009-07-06

CAX軟件交流

hpnet | 2002-05-28

單片機的數(shù)字濾波算法

嵌入式系統(tǒng) 單片機濾波算法數(shù)字濾波 | 2023-11-21

蘋果發(fā)布DeepPCR機器學(xué)習(xí)算法：加速神經(jīng)網(wǎng)絡(luò)的推理和訓(xùn)練

蘋果 DeepPCR 機器學(xué)習(xí) 算法神經(jīng)網(wǎng)絡(luò) | 2023-12-20

[轉(zhuǎn)帖]us/os就緒表的維護算法分析

amine | 2002-05-17

Motorola大獎賽初賽結(jié)果公布

Gao | 2002-06-04

變步長自適應(yīng)盲源分離算法的設(shè)計研究

智能計算 202306 盲源分離算法自適應(yīng)步長收斂穩(wěn)態(tài)失調(diào) | 2023-07-07

FW-PSO算法支持下無線傳感網(wǎng)絡(luò)拓撲結(jié)構(gòu)的優(yōu)化策略

物聯(lián)網(wǎng)與傳感器 202302 FW-PSO 網(wǎng)絡(luò)拓撲結(jié)構(gòu) 算法優(yōu)化策略抗毀性 | 2023-02-20

焦點

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();