1、 毕业设计(论文)开题报告 题目名称 基于单片机的智能声控小车设计 学生姓名 专业班级 学号 一、选题的目的和意义: 1设计(论文)的主要目的 通过本次设计,可以对国内、外的智能声控发展趋势及应用背景有所了解,并通过一 些书籍、期刊,掌握单片机及声控工作原理,同时对一些基于单片机的智能声控小车的软、 硬件设计及相关仿真软件进行了实践应用。 2. 意义 机器人的应用越来越广泛,几乎渗透到所有领域。机器人的发展体现了一个国家技术 水平的高低,现代机器人从其诞生到现在,己经发展到了第三代。第一代机器人是示教再 现型机器人。它们装有记忆存储器,由人将作业的各种操作要求示范给机器人,使之记住 操作的程序
2、和要领。当它接到再现命令时,则自主地再现示教的动作。第二代机器人是装 有小型计算机和简单传感器的离线编程的工业机器人。它能感知外界信息和进行“思维”, 比第一代机器人更灵活、更能适应环境变化的需要。第三代是智能机器人。智能机器人是 “具有感知、思维和动作的机器”。它装有多种传感器,能识别作业环境,能自主决策, 具有人类大脑的部分功能,且动作灵活,是人工智能技术发展到高级阶段的产物。 智能小车,也就是轮式机器人,具有广泛的用途,尤其适合那些人类无法工作的环境 中工作,无人生产线,仓库,服务机器人,航空航天等 领域。作为 20 世纪自动化领域 的重大成就,机器人已经和人类社会的生产、生活密不可分。
3、应此为了使智能小车工作在 最佳状态,进一步研究及完善其速度和方向的控制是非常有必要的。其次学习智能小车的 制作也是对大学 4 年学习的一个很好的检测,对今后的学习和工作具有很大的帮助。 二、国内外研究现状简述: 机器自动语音识别的研究工作起始于上世纪 50 年代, 1952 年 Bell 实验室的 Davis, Biddulph 等人建立了第一个可以识别孤立英文数字的语音识别系统。六十年代对语音信 号的研究主要是特征分析与特征提取,人们发现人耳对声音中不同的频率有不同的分辨率 和反应强度,从而提出临界频带理论(Critical Band Theory)。当时由于计算机技术的限 制,只能用专用硬
4、件进行谱分析再由计算机识别。1966 年 MIT 的 Gold 等人用 16 通道滤 波器组、基音检测器、浊音检测器和一台计算机构成一个语音识别系统。语音识别从这一 时期开始起步。 七十年代语音识别技术得到迅速发展,由于线性预测编码 LPC (Linear Prediction Coding) 特征较好地解决了语音特征的提取问题,人们开始研究各种识别方法。人们把用 于解决有序的优化问题的动态规划 (Dynamic Programming) 技术应用到语音识别中,由 Sakoe(1972 ) 提出的动态时间弯曲 DTW (Dynamic Time Warping) 算法有效地解决了语 音两次发音
5、间的时间变形问题。 DTW算法对特定人的孤立词识别十分有效, 从此基于LPC 分 析及 DTW 算法的中、小字表孤立字特定人语音识别系统纷纷建立起来,语音识别开始走出 实验室进入实用领域。 八十年代,不论在语音特征表示、距离度量、还是识别方法上均有较大发展。八十年 代初 Y. Linde 将信息压缩理论中矢量量化(Vector Quantization) 技术应用于语音识别。 矢量量化的作用是进行数据压缩,将连续的语音特征空间量化为一些离散点,降低系统在 时间及存储上的开销。矢量量化的另一个作用是通过聚类获取多个话者或一个话者的多次 发音所共有的语音特征。Bell 实验室的 Rabiner(1
6、983)等人将矢量量化与隐马尔可夫模型 HMM (Hidden Markov Model) 结合起来,提出并建立了离散参数隐马尔可夫模型,从此 采用离散参数隐马尔可夫模型的非特定人语音识别研究纷纷开展起来。 日本 AT R 的电话翻译研究实验室 (Interpreting Telephony Research Laboratory) 是世界上最大的致力于语音识别研究的实验室,己经研制出语音翻译系统( 即 SL-TRANS 系统) ,它能识别日语语音并翻译成英语再合成英语声音输出。1990 年 Nagata 和 Kogure 介绍了 SL-TRANS 系统,SL-TRANS 由六部分组成。HMM 识别器生成多侯选词表,通过词 和短语级的相关滤波操作将多余侯选词删除,然后由基于 HPSG 的表达文法分析器生成一 个文法分析表,再用一个转换模型重写该表,用基于规则的生成器生成英语句子,发音由 语音合成器生成。整个系统能翻译测试句子的 69% ,语法是特别为口语设计的,它包括一 些实用的约束,如敬语的语法规则。语音识别部分的精度比整个翻译系统的高,非特定人 的识别率为 81.6% ,特定人