1、 数数 字字 信信 号号 处处 理理 课程设计报告课程设计报告 题目:题目: 基于声音的说话人身份识别技术研究基于声音的说话人身份识别技术研究 学院:学院: 信信 息息 工工 程程 学学 院院 专业:专业: 通通 信信 工工 程程 指导教师:指导教师: 指导时间指导时间: : 2014.12 2014.12 - 2 - 目录目录 1、背景. - 3 - 2、设计目的. - 3 - 3、设计原理. - 4 - 3.1 语音识别技术的分类. - 4 - 3.2 Mel频率倒谱系数 - 4 - 3.2.1 Mel频率倒谱系数基本原理 - 4 - 3.2.2 MFCC 的提取流程 . - 6 - 3.
2、3 矢量量化. - 7 - 3.3.1 矢量量化的简单介绍. - 7 - 3.3.2 矢量量化的定义. - 8 - 3.3.3 矢量量化的基本原理. - 8 - 3.4 矢量量化的失真测度. - 9 - 3.4.1 欧氏距离-均方误差 - 10 - 3.5 识别失真度. - 11 - 4、设计过程. - 12 - 4.1、实验技术路线图. - 12 - 4.2、实验结果测试图. - 13 - 5、实验代码与结果分析. - 14 - 5.1、MATLAB 源程序 . - 14 - GUI 界面:. - 14 - 测试程序. - 16 - Mel倒频谱系数函数 . - 17 - 库函数. - 18
3、 - 滤波程序. - 19 - 录音程序. - 19 - 5.2、实验结果分析. - 20 - 6、实验体会和总结. - 21 - 7、文献. - 22 - - 3 - 1、背景、背景 随着信息化的迅速发展,人们对身份识别技术的需求越来越多,并对其安 全性和可靠性的要求也越来越高。 基于传统密码认证的身份识别技术在实际信息 网络应用中已经暴露出许多不足之处, 而基于生物特征辨别的身份识别技术近年 来也日益成熟并在实际应用中展现出极大的优越性。 作为生物特征认证的一个重 要分支,语音识别同指纹识别、人脸识别、虹膜识别一样,一直以来都是研究者 们关注和探索的热点之一。 语音识别技术也成为了近年的研
4、究热点,有不少实用化的技术成果被商家 成功推向了市场,让人们看到了它在 PDA、智能家电、工业控制等领域的广阔 发展前景。 例如现在国内在语音方面做的最好的就是科大讯飞股份有限公司, 科 大讯飞作为中国最大的智能语音技术提供商, 在智能语音技术领域有着长期的研 究积累,并在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有 国际领先的成果。语音识别技术有很大可能产生新的服务,给人们的工作和生活 带来非常可观的方便。 我国语音识别研究工作起步于五十年代。近年来国内研究水平也从实验室 逐步走向实用。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语 音识别技术上还有自己的特点与优势,
5、并达到国际先进水平。 2、设计目的、设计目的 每个人都有自己特有的发音器官和特有的说话习惯,这些差异都式反映在 说话人语音信号的波形中,且比较复杂,使得每个人的发音都伴有浓重的个人色 彩,这是说话人识别得以实现的客观保证。说话入识别涉及到人的发音器官、说 话习惯、语言构造和发声原理等多方面的内容,它综合了生理学、语音学、数字 信号处理、模式识别、人工智能等学科知识,有着广阔的市场应用前景。通过说 话人识别技术,可以实现用语音信息进行说话人的身份鉴别。利用说话人识别技 术还可以通过语音实现对一些服务的控制,例如语音拨号、电话银行、数据库访 问服务、信息服务和计算机的远程访问等等。而且,说话人识别
6、技术有很大可能 产生新的服务,给人们的工作和生活带来非常可观的方便,本次试验主要目的为 提出和设计开发能够快速准确识别不同个体的可行方案。 - 4 - 3、设计原理、设计原理 3.1 语音识别技术的分类语音识别技术的分类 语音识别系统可以根据对输入语音的限制加以分类。 从说话者与识别系统的相关性考虑 可以将识别系统分为 3 类: 特定人语音识别系统:仅考虑对于特定人的语音进行识别; 非特定人语音系统:识别的语音与人无关,通常要用大量不同人的语音数据 库对识别系统进行学习; 多人的识别系统: 通常能识别一组人的语音, 或者成为特定组语音识别系统, 该系统仅要求对需要识别的那组人的语音进行训练。 从说话的方式考虑 也可以将识别系统分为 3 类: 孤立词语音