基于字典的LZW压缩算法
创始人
2024-03-14 23:05:07
0

基于字典的LZW压缩算法

  • 基于字典的LZW压缩算法
    • 简介
    • 重要概念:前缀和后缀
    • 算法
    • 示例

基于字典的LZW压缩算法

简介

J.Ziv和A.Lempel在1978年首次发表了介绍第二类词典编码算法的文章。在他们的研究基础上,Terry A.Wlch在1984年发表了改进这种编码算法的文章。因此把这种编码方法称为LZW压缩算法。

LZW算法又叫“串表压缩算法”就是通过建立一个字符串表,用较短的代码来表示较长的字符串来实现压缩。 LZW压缩算法是Unisys的专利,有效期到2003年,所以对它的使用已经没有限制了。

重要概念:前缀和后缀

两个重要概念:

  • 前缀(prefix):一个词组的前面一个字符 ,比如 ab,前缀为a,8f前缀为8;

  • 后缀(suffix):反之,为后一个字符,比如 ab,后缀为b,8f后缀为f;

算法

算法流程:

  1. 在输入流中读一个字符。
  2. 如果当前编码在字典中,则把当前编码的第一个字符作为当前串的后缀,如果当前串不在字典中,就把它加入到字典中,然后把当前编码作为串的前缀,转到第4步。
  3. 如果当前编码不在字典中,就把前缀的第一个字符作为后缀,把串加入到字典中,用当前串的编码作前缀,转到第4步。
  4. 把前缀放到输出流,转到第1步。

示例

对于字符串ababbacb。初始字典为{a, b, c}。

步骤前缀后缀存在对应码输出
1a(, a)
2ab(a, b)noa256
3ba(b, a)nob257
4ab(a, b)yes
5256b(256, b)no256258
6ba(b, a)yes
7257c(257, c)no257259
8cb(c, b)noc260

把输出来的和最后一个后缀连在一起则是:a,b,256,257,c,b这6个字符,那么就达到了压缩的目的。

对应生成的码表则是:

256257258259260
(a, b)(b, a)(256, b)(257, c)(c, b)

解压缩时,将输出字符串按照码表对应转化。a,b,256(ab),257(ba),c,b,即ababbacb,解压成功。

相关内容

热门资讯

AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
AWSElasticBeans... 在Dockerfile中手动配置nginx反向代理。例如,在Dockerfile中添加以下代码:FR...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
AWR报告解读 WORKLOAD REPOSITORY PDB report (PDB snapshots) AW...
AWS管理控制台菜单和权限 要在AWS管理控制台中创建菜单和权限,您可以使用AWS Identity and Access Ma...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...
群晖外网访问终极解决方法:IP... 写在前面的话 受够了群晖的quickconnet的小水管了,急需一个新的解决方法&#x...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
Azure构建流程(Power... 这可能是由于配置错误导致的问题。请检查构建流程任务中的“发布构建制品”步骤,确保正确配置了“Arti...