1、 毕业设计(论文)开题报告 题 目 基于滤波器组的语音分析与合成方法研究基于滤波器组的语音分析与合成方法研究 学生姓名 班级学号 专业 通信工程 一、一、对指导教师下达的课题任务的学习与理解对指导教师下达的课题任务的学习与理解 语音分析与合成是利用数字信号相关技术对语音信号进行处理的的技术。随着语音技术和数字信 号处理技术的发展,现阶段,常见的语音应用有几方面:语音搜索、语音输入法、语音教育评测。一些 基于语音分析和合成的语音技术已经实现商用,如Gtalk,米聊,微信,QQ,MSN 等等。另外,语音技 术在物联网工程也有广泛的应用,语音认证登陆,语音导航,语音定位 等等。 目前,我们所完成的语
2、音产品还都处于最初级的应用,在识别上还有待提高,需要考虑离线状态 下语音识别问题。待到时机成熟之时,语音将可以形成跨屏、跨平台,标准化的交互方式,实现智能语 音技术在各类场景中的应用。 语音分析与合成技术基本概述: 语音具有被称为声学特征的物理性质。 语音既是人的发音器官发出来的一种声波,它就个其他各 种声音一样,也具有声音的物理属性。它具有以下一些特性: 1 . 音质,它是一种声音区别与其他声音的基本特征。 2 . 音调,就是声音的高低。音调取决于声波的频率:频率快则音调高,频率慢则音调低 3 . 声音的强弱,音强及音量,又称响度。它是由声波振动幅度决定的。 4 . 声音的长短,也称音长,它
3、取决于发音持续时间的长短。 语音信号最主要的特性是随时间而变化的,是一个非平稳的随机过程。但是,在一个较短的时间内 语音信号的特征基本保持不变,这是语音信号处理的一个重要出发点。我们可以采用平稳过程的分析处 理方法来处理语音。 语音信号分析可分为时域,频域,倒频域等,时域分析方法简单,运算小。随着傅里叶等变换的应 用,频域分析更加直观,物理意义更加明显。语音分析与合成的实现形式很多,基于滤波器组,基于正 弦式,基于AR模型,基于DSP芯片,基于同态滤波实现的语音分析与合成 等等。 在语音的合成阶段可能会出现回声,回声是一种物理现象。当直达声结束后,声音经过其他物体反 射,折射,又返回来收到的声
4、波叫做回声。当直达声和回声之间的时间差在1 20S以上时,人耳可以很 清楚地把他们区分开。相反,当直达声和回声之间的时间差在1 20S以下时,回声不但不妨碍听音,反 而使声音更洪亮。 二、二、阅读文献资料进行调研的综述阅读文献资料进行调研的综述 语音分析语音分析。( ) = ()( ) = 在分析阶段是求语音的短时傅氏变换(STFT) ,并将其看做是通过一滤波器组的输出。 短时傅立叶变换主要用于语音分析合成系统,它将语音流分成一段一段(帧)进行处理,语音信号 在1030ms之间是平稳的(一般取20ms为帧长) ,抽样加窗处理,其逆变换可以精确地恢复语音波形; 合成阶段是利用滤波器组求和法(FB
5、S)由STFT重建该语音信号。 短时傅立叶变换 ( ) = ()( ) = (1) 其中, ():输入信号序列 ( ):窗函数 ( ) 的低通实现过程: )(mx )( j n eX mj e ( 图图 1) 根据欧拉公式: mj e =cos wm-jsinwm,可以把 mj e 乘以 x(m)或者 w(m), 此外,根据傅里叶变换的性质得到 x(m)频谱左右搬移,即相当于乘以了带通滤波器 所以,若令 2k/N,则得离散的短时傅里叶变换,它是在频域的取样. ( 2 ) = ()( ) 2 = 0 1 (2) 当 或 k 固定时,Xn(k)看做是时间 n 的函数。它们是信号序列和窗口函数序列的卷积,此时窗口 的作用相当于一个滤波器. 窗宽度 N、抽样周期 T 和频率分辨率 f 之间存在下列关系 f1/NT 窗口宽度频率分辨率 时间分辨率 窗口宽度频率分辨率 时间分辨率 所以,时域加窗函数的形状、长度等参数选取对语音分析与合成效果会产生影响,实验中在去验 冲击响应 w(n) 证。 )( j n eX带通滤波器组实现过程: N 个中心频率处于 ( = , )的滤波器组成的滤波器组. h0(n) Xn (e jw0) ejnw0 h1(n)