熵编码法 - 知识百科

熵编码法

更新时间：2022-08-25 17:20

熵编码法是一种进行无损数据压缩的技术，在这个技术中一段文字中的每个字母被一段不同长度的比特(Bit)所代替。与此相对的是LZ77或者LZ78等数据压缩方法，在这些方法中原文的一段字母列被其它字母取代。

技术介绍

熵编码法是一种进行无损数据压缩的技术，在这个技术中一段文字中的每个字母被一段不同长度的比特(Bit)所代替。与此相对的是LZ77或者LZ78等数据压缩方法，在这些方法中原文的一段字母列被其它字母取代。

要使得所有的字母可以在压缩后互相区别需要一定数量的比特，因此每个字母被取代的比特数不能无限小。

每个字母按照其出现的可能性所获得的最佳比特数取决于熵。

一般熵编码器与其它编码器联合使用。比如LHA首先使用LZ编码，然后将其结果进行熵编码。Zip和Bzip的最后一级编码也是熵编码。

编码

使用长度不同的比特串对字母进行编码有一定的困难。尤其是，几乎所有几率的熵都是一个有理数。

使用整数比特(bit)

哈夫曼编码建议了一种将比特进位成整数的算法，但这个算法在特定情况下无法达到最佳结果。为此有人加以改进，提供最佳整数比特数。这个算法使用二叉树来设立一个编码。这个二叉树的终端节点代表被编码的字母，根节点代表使用的比特。

除这个对每个要编码的数据产生一个特别的表格的方法外还有使用固定的编码表的方法。比如加入要编码的数据中符号出现的机率符合一定的规则的话就可以使用特别的变长编码表。这样的编码表具有一定的系数来使得它适应实际的字母出现机率。

免责声明

隐私政策

用户协议

目录 22

0{{catalogNumber[index]}}. {{item.title}}