KMP算法
创始人
2024-04-09 23:32:07
0

串的朴素模式匹配算法

什么是字串匹配:

在主串中找到与模式串相同的字串并返回其位置,如主串google、模式串gle,则结果为3

算法思路:

相当于拿着模式串和主串对齐,对比其第一个字符。不相等则模式串往右移一位,相等则匹配剩下的字符,计算方式如下:
1234567SwangdaoTgda\begin{array}{|c|c|c|c|c|c|c|c|} \hline &1&2&3&4&5&6&7\\ \hline S&w&a&n&g&d&a&o\\ \hline T&g&d&a\\ \hline \end{array} ST​1wg​2ad​3na​4g​5d​6a​7o​​
k1234444i1234567j1111234\begin{array}{|c|c|c|c|c|c|c|c|} \hline k&1&2&3&4&4&4&4\\ \hline i&1&2&3&4&5&6&7\\ \hline j&1&1&1&1&2&3&4\\ \hline \end{array} kij​111​221​331​441​452​463​474​​

缺点:

当某些字串与模式串能部分匹配时,主串的扫描指针i经常回溯,导致时间开销增加

朴素模式匹配算法代码:

// S为主串,T为模式串
int Index(String S, String T) {// i用来遍历主串// k用来标记当前匹配串的第一个字符// j用来遍历模式串int i = k = j = 1;while (i <= S.length && j <= T.length) {if (S[i] == T[j]) {i++;j++;} else {k++;i = k;j = 1;}}// 用j是否超出边界作为成功标志if (j > T.length) {return k;} else {return 0;}
}

KMP算法

优点:

在上述朴素模式匹配算法中,当模式串第一个字符匹配时,j和i都继续++去匹配剩下的字符,但一旦当模式串第j个字符不匹配时,i和j都回溯,即模式串往右移动一格。但是其实大部分时候可以通过计算不回溯这么多(某些模式串中回溯到特点值就可保证最短不匹配)。例如:模式串google当j=5时不匹配,此时可发现只要i不变,j回溯到1即可满足最短不匹配,即模式串往右移了4格。KMP算法就是在i不回溯的情况下给出一个next数组用于表示当不匹配时j应该回溯到哪里,这样在模式匹配算法的基础上进一步优化了性能,解决了i经常回溯的问题。

求next数组:

next[j]={0,当j=1时1,当j=2时前j−1个字串的最长相等前后缀长度+1,当j>2时next[j] = \begin{cases} 0, & \text{当j=1时} \\ 1, & \text{当j=2时} \\ 前j-1个字串的最长相等前后缀长度+1, & \text{当j>2时} \end{cases} next[j]=⎩⎪⎨⎪⎧​0,1,前j−1个字串的最长相等前后缀长度+1,​当j=1时当j=2时当j>2时​
前j-1个字串的最长相等前后缀长度:当前j-1个字串为abcab时,ab为前缀和后缀最长相等部分,结果为2;当前j-1个子串为abc时,没有前后缀相等部分,结果为0。
序号j123456模式串ababaanext[j]011234\begin{array}{|c|c|c|c|c|c|c|} \hline 序号j&1&2&3&4&5&6\\ \hline 模式串&a&b&a&b&a&a\\ \hline next[j]&0&1&1&2&3&4\\ \hline \end{array} 序号j模式串next[j]​1a0​2b1​3a1​4b2​5a3​6a4​​

KMP算法代码:

int Index_KMP(String S, String T, int next[]) {int i = j = 1;while (i <= S.length && j <= T.length) {if (j==0 || S[i] == T[j]) {i++;j++;} else {j = next[j];        // i不回溯,j查找next数组回溯}}if (j > T.length) {return i - T.length;    // 匹配成功} else {return 0;}
}

KMP算法的优化:

当模式串为google,j=4时。原KMP算法的next[4]=1,但是其实此处不需要再重新匹配第一位,所以应该优化为next[4]=0。因此引入next的优化数组nextVal。
nextVal[j]={0,当j=1时next[j],当j>1 且 T[next[j]]!=T[j]时nextVal[next[j]],当j>1 且 T[next[j]]==T[j]时nextVal[j] = \begin{cases} 0, & \text{当j=1时} \\ next[j], & \text{当j>1 且 T[next[j]]!=T[j]时} \\ nextVal[next[j]], & \text{当j>1 且 T[next[j]]==T[j]时} \\ \end{cases} nextVal[j]=⎩⎪⎨⎪⎧​0,next[j],nextVal[next[j]],​当j=1时当j>1 且 T[next[j]]!=T[j]时当j>1 且 T[next[j]]==T[j]时​
序号j123456模式串ababaanext[j]011234nextVal[j]010104\begin{array}{|c|c|c|c|c|c|c|} \hline 序号j&1&2&3&4&5&6\\ \hline 模式串&a&b&a&b&a&a\\ \hline next[j]&0&1&1&2&3&4\\ \hline nextVal[j]&0&1&0&1&0&4\\ \hline \end{array} 序号j模式串next[j]nextVal[j]​1a00​2b11​3a10​4b21​5a30​6a44​​

相关内容

热门资讯

银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
AWSElasticBeans... 在Dockerfile中手动配置nginx反向代理。例如,在Dockerfile中添加以下代码:FR...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
月入8000+的steam搬砖... 大家好,我是阿阳 今天要给大家介绍的是 steam 游戏搬砖项目,目前...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
AWS管理控制台菜单和权限 要在AWS管理控制台中创建菜单和权限,您可以使用AWS Identity and Access Ma...