1、 软件技术课程设计软件技术课程设计 课程论文报告书课程论文报告书 题题 目:目:哈夫曼编码及解码算法的实现哈夫曼编码及解码算法的实现 姓姓 名:名: 班班 级级: 学学 号:号: 指导教师:指导教师: - 2 - 目目 录录 一、前言一、前言 3 3 二、概要设计二、概要设计 3 3 赫夫曼树的建立 5 赫夫曼编码. 5 代码文件的译码 5 三、详细设计三、详细设计 5 5 (1)赫夫曼树的存储结构描述: . 5 哈弗曼树的算法: . 5 (2)哈弗曼编码 . 6 (3)哈弗曼译码 . 8 (4)主函数 8 (5)显示部分源程序:. 9 四、软件测试四、软件测试 1010 五、总结五、总结 1
2、212 附录:附录: 1212 - 3 - 一、前言一、前言 在当今信息爆炸时代, 如何采用有效的数据压缩技术节省数据文件的存储空间和计算机 网络的传送时间已越来越引起人们的重视, 赫夫曼编码正是一种应用广泛且非常有效的数据 压缩技术。哈夫曼编码是一种编码方式,以哈夫曼树即最优二叉树,带权路径长度最小的 二叉树,经常应用于数据压缩。哈弗曼编码使用一张特殊的编码表将源字符(例如某文件中 的一个符号)进行编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的估算概 率而建立起来的 (出现概率高的字符使用较短的编码, 反之出现概率低的则使用较长的编码, 这便使编码之后的字符串的平均期望长度降低,
3、从而达到无损压缩数据的目的) 。赫夫曼编 码的应用很广泛,利用赫夫曼树求得的用于通信的二进制编码称为赫夫曼编码。树中从根到 每个叶子都有一条路径,对路径上的各分支约定:指向左子树的分支表示“0”码,指向右 子树的分支表示“1”码,取每条路径上的“0”或“1”的序列作为和各个叶子对应的字符 的编码,这就是赫夫曼编码。哈弗曼译码输入字符串可以把它编译成二进制代码,输入二进 制代码时可以编译成字符串。 二、二、概要设计概要设计 哈夫曼编译码器的主要功能是先建立哈夫曼树,然后利用建好的哈夫曼树生成哈夫曼 编码后进行译码 。 在数据通信中,经常需要将传送的文字转换成由二进制字符 0、1 组成的二进制串,
4、称 之为编码。构造一棵哈夫曼树,规定哈夫曼树中的左分之代表 0,右分支代表 1,则从根节 点到每个叶子节点所经过的路径分支组成的 0 和 1 的序列便为该节点对应字符的编码, 称之 为哈夫曼编码。 最简单的二进制编码方式是等长编码。若采用不等长编码,让出现频率高的字符具有较 短的编码,让出现频率低的字符具有较长的编码,这样可能缩短传送电文的总长度。哈夫曼 树课用于构造使电文的编码总长最短的编码方案。 (1)其主要流程图如图 1-1 所示。 - 4 - (2)设计包含的几个方面: 开始 结点数是否大于 1 将 data 和权值赋给 ht 输出根结点和权值 调用 SELECT 函数 计算根结点函数
5、 父结点为两子结点之和 输出两子结点和已构造的结点 是否为根结点? 左子是否为空? 此时编码为 0 I2*N? I+ 编码为 1 结束 否 否 否 右子是否为空 是 是 否 否 是 是 是 - 5 - 赫夫曼树的建立 赫夫曼树的建立由赫夫曼算法的定义可知, 初始森林中共有n棵只含有根结点的二叉树。 算法的第二步是:将当前森林中的两棵根结点权值最小的二叉树,合并成一棵新的二叉树; 每合并一次,森林中就减少一棵树,产生一个新结点。显然要进行 n1 次合并,所以共产 生 n1 个新结点,它们都是具有两个孩子的分支结点。由此可知,最终求得的赫夫曼树中 一共有 2n1 个结点,其中 n 个结点是初始森林
6、的 n 个孤立结点。并且赫夫曼树中没有度数 为 1 的分支结点。我们可以利用一个大小为 2n-1 的一维数组来存储赫夫曼树中的结点。 赫夫曼编码 要求电文的赫夫曼编码,必须先定义赫夫曼编码类型,根据设计要求和实际需要定义的 类型如下: typedet struct char ch; / 存放编码的字符 char bitsN1; / 存放编码位串 int len; / 编码的长度 CodeNode; / 编码结构体类型 代码文件的译码 译码的基本思想是:读文件中编码,并与原先生成的赫夫曼编码表比较,遇到相等时, 即取出其对应的字符存入一个新串中。 三、三、详细设计详细设计 (1)赫夫曼树的存储结构描述: #define N 50 / 叶子结点数 #define M 2*N-1 / 赫夫曼树中结点总数 typedef struct int weight; / 叶子结点的权值 int lchild, rchild,