自动化外文翻译---改进型智能机器人的语音识别方法
-
资源ID:124487
资源大小:632.50KB
全文页数:20页
- 资源格式: DOC
下载积分:100金币
快捷下载

账号登录下载
三方登录下载:
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
|
自动化外文翻译---改进型智能机器人的语音识别方法
1、 毕业设计 (论文 )外文资料翻译 学 院 : 自动化工程学院 专 业:自动化 测控技术与仪器 姓 名: 学 号: 附 件: 1.外文资料翻译译文; 2.外文原文。 指导教师评语: 签名: 年 月 日 附件 1:外文资料翻译译文 改进型智能机器人的语音识别方法 2、 语音识别概述 最近, 由于 其 重大 的 理论意义和实用价值 , 语音识别已经 受 到越来越多的关注 。到现在为止 , 多数的语音识别是基于传统的线性系统理论 ,例 如隐马尔可夫模型 和动态时间规整技术。随着语音识别的深度研究,研究者 发现,语音信号是一个复杂的非线性过程 , 如果语音识别研究 想 要 获得 突破, 那么就必须引进
2、 非线性系统理论方法。最近, 随着 非线性系统理论 的发展 ,如人工神经网络 , 混 沌与分形 , 可能应用这些理论 到 语音识别 中 。因此,本文的研究是 在 神经网络和混沌 与 分形理论的基础上介绍了语音识别的过程。 语音识别可以划分为独立发声式和非独立发声式两种。非独立发声式是指发音模式是由单个人来进行训练,其对训练人命令的识别速度很快,但它对与其他人的指令识别速度很慢,或者不能识别。独立发声式是指其发音模式是由不同年龄,不同性别,不同地域的人来进行训练,它能识别一个群体的指令。一般地,由于用户不需要操作训练,独立发声式系统得到了更广泛的应用。 所以,在独立发声式系统中,从语音信号中提取
3、语音特征是语 音识别系统的一个基本问题。 语音识别包括训练和识别,我们可以把它看做一种模式化的识别任务。通常地,语音信号可以看作为一段通过 隐马尔可夫模型 来表征的时间序列。通过这些特征提取,语音信号被转化为特征向量并把它作为一种意见,在训练程序中, 这些意见将反馈 到 HMM 的模型参数 估计中。 这些参数包括 意见和他们响应状态所对应的概率密度函数,状态间的 转移概率 ,等等。经过参数估计以后,这个已训练模式就可以应用到识别任务当中。输入信号将会被确认为造成词,其精确度是可以评估的。整个过程如图一所示。 图 1 语音识别系统的模块图 3、理论与方法 从语音信号中进行独立扬声器的特征提取是语
4、音识别系统中的一个基本问题。解决这个问题的最流行方法是应用 线性预测倒谱系数 和 Mel 频率倒谱系数 。这两种方法都是基于一种假设的线形程序,该假设认为说话者所拥有的语音特性是由于 声道共振 造成的。这些信号特征构成了语音信号最基本的光谱结构。然而,在语音信号中,这些非线形信息不容易被当前的特征提取逻辑方法所提取,所以我们使用分型维数来测量非线形语音扰动。 本文利用传统的 LPCC和非线性多尺度分形维数特征提取研究并实现 语音 识别系统。 3.1 线性预测倒谱系数 线性预测系数 是一个我们在做语音的线形预分析时得到的参数,它是关于毗邻语音样本间特征联系的参数。线形预分析正式基于以下几个概念建立起来的,即一个语音样本可以通过一些以前的样本的线形组合来快速地估计,根据真实语音样本在确切的分析框架(短时间内的)和预测样本之间的差别的最小平方原则,最后会确认出唯一的一组 预测系数 。 LPC 可以用来估计语音信号的倒谱 。在语音信号的短时 倒谱 分析中,这是一种特殊的处理方法。 信道模型 的系统函数可以通过如下的线形预分析来得到: 其中 p 代表线形预测命令, ,( k=1, 2, , p)代表预测参数, 脉冲响应 用h(n)来表示,假设 h( n)的 倒谱 是 。那么( 1)式可以扩展为( 2)式: 将( 1)带入( 2),两边同时 ,( 2)变成( 3)。