bm算法
创始人
2024-12-23 05:31:10
0

BM算法是一种快速字符串匹配算法,它的全称为Boyer-Moore算法,是由Robert S.Boyer和J Strother Moore于1977年提出的。它的特点在于在查找时尽量跨过匹配串,减少比较次数,因此在某些情况下比其他字符串匹配算法要快。

BM算法的基本思想是倒序匹配,即从模式串的最后一位开始匹配,如果匹配不上,则根据已经匹配的字串中的信息推出下一次匹配位置。具体的实现过程有两个核心步骤:

  1. 预处理阶段

此阶段是为了构建字符移动表和后缀移动表。字符移动表指的是,当发生匹配错误时,如何将模式串向右移动,使得模式串的尾部对齐文本串的下一个位置。后缀移动表就是当模式串的某一段匹配成功时,如何将模式串向右移动,以跳过已经匹配成功的部分,减少比较次数。

  1. 匹配阶段

此阶段是利用上述两个移动表,在文本串中查找模式串,直至找到或者结束。具体的实现过程是从模式串的尾部开始匹配,依次匹配每个字符,如果发现不匹配,则跟据字符移动表或后缀移动表移动模式串,并进行下一轮匹配。

C++代码示例:

void preBmBc(char *x, int m, int bmBc[]) {
   for (int i = 0; i < ASIZE; ++i) {
      bmBc[i] = m;
   }
   for (int i = 0; i < m-1; ++i) {
      bmBc[x[i]] = m-1-i;
   }
}

void suffixes(char *x, int m, int *suff) {
   suff[m-1] = m;
   int f = 0;
   for (int i = m-2; i >= 0; --i) {
      while (f > 0 && x[f+m-1] != x[i+f]) {
         f = suff[f];

相关内容

热门资讯

银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
AWSElasticBeans... 在Dockerfile中手动配置nginx反向代理。例如,在Dockerfile中添加以下代码:FR...
AsusVivobook无法开... 首先,我们可以尝试重置BIOS(Basic Input/Output System)来解决这个问题。...
ASM贪吃蛇游戏-解决错误的问... 要解决ASM贪吃蛇游戏中的错误问题,你可以按照以下步骤进行:首先,确定错误的具体表现和问题所在。在贪...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...