外文翻译--基于网络的自动语音识别能度语言模型
《外文翻译--基于网络的自动语音识别能度语言模型》由会员分享,可在线阅读,更多相关《外文翻译--基于网络的自动语音识别能度语言模型(7页珍藏版)》请在毕设资料网上搜索。
1、 1 中文 3230 字 外文翻译: 原文来源 : Computer Speech and Language (2014) 译文正文 : 基于网络的自动语音识别能度语言模型 本文描述了一种基于可能性理论的新的语言模型。这些新模型的目的是为了更好地利用Web 上可用的数据进行语言建模。这些模型的目的在于 整合与不可能单词序列有关的信息。我们找到了使用这种模型的两个主要问题:如何估算单词序列的长度以及如何把这种模型整合到自动语音识别系统 (ASR)中去。 我们提出了一个单词序列可能性的措施和一个基于单词序列统计数据的实用估算方 法,这种方法尤其适用于来自于 Web 数据的估算。对于在一个经典的 依
2、靠一个语音识别过程中的概率模型的 自动语音识别引擎中使用这些模型,我们提出了一些策略和构想。 这项工作在两种典型的使用场景中进行评估:具有非常大训练集的广播新闻转录和在一个专业领域,对只有非常有限训练数据的医疗视频的转录。 该结果表明,在专业领域的任务中,能度模型提供了显著低的单词错误率,但是经典的n 元模型由于训练材料的缺少没有能够做到这一点。在广播新闻方面,概率模型仍然优于能度模型。但是,这两种模型的对数线性组合优于所有单独使用的模型, 这表明能度 模型带来了概率模型所没有的信息。 1.简介 最先进的大词汇量连续语音识别系统 ( LVCSR) 是基于 n 元语法模型的,这种模型是在由数十亿
3、单词组成的文本集合中被估算的。这些模型在很大范围的应用中证明了自己的效率, 但是它们的准确度是依赖于庞大的相关训练语料库的可用性上,但是如果对于资源很少的语言或者特定的某一领域,大量的数据集就不能保证了。 处理这种训练数据缺乏的最受欢迎的方法之一在于在互联网上搜集文本材料和在这些自动搜集的数据集上估算 n 元统计模型。这种方法得益于互联网两个有趣的特点:覆盖范围广和持续更新。 覆盖依 赖于这样一个事实, Web 可能 被看作 是一个趋于无限的语料库,大多数的语言实现都可以在这里找到。 互联网提供了一个比通常在 LM 训练中用到的文本集合大得多的语言覆盖。 用户通过不断地增加包含新单词和新的惯用
4、语言形式的文档来提供更新。最后一点被广泛地用于统计语言模型的各个方面,典型的应用如新单词的发现, n 元语法模型的适应,不可见的 n 元语法模型的评价。 然而,与互联网内容的规模和不稳定性相关的技术问题限制了对大范围和统计语言模型更新的利用。标准的方法会是定期地搜集互联网上可以利用的所有数据,在结果语料库上来估算 n 元模型 。这样的一种技术很明显是难以实施的;一些作者提出了使对庞大的 LM 数据集的估算可行的解决方法: Guthrie 和 Hepple( 2010) 解决了稀疏 n 元模型占用内存减少的问题;快速平滑的技术在 Brants( 2007) 等被提出;基于分布式的数据存储与处理的
5、技术方法在 Ghemawat(2003), Chang( 2006) 等 文章 上被发表。 最后,即使软件和硬件技术不断发展,在整个 Web 内容上最新的 LM 的训练仍然是一个具有挑战性的问题。 另一个问题是和单词序列在 Web 上的分布相关。由于文档来源的多样性,生产的可变 2 性和使用的环 境等因素,它们的可靠性很低。分布不仅仅不可靠,也不会匹配一个定向的应用程序上下文,这个应用程序上下文决定着可能的主题、说话的风格和语言的等级等。 考虑到使用整个 Web 在实 用上和理论上的 诸多限制,以前的很多研究都是提取相关的和易于处理的 Web 子集,这些 Web 子集被作为传统的估算 n 元统
6、计模型的语料库来使用。语料库是通过自动查询搜索引擎取得的 。就覆盖,语言风格等而言,查询组成技术决定了语料库的精确度。不幸的是,查询是基于以前的知识或者是一个与领域相关的描述的自动提取,这种描述可能是不完整或者不准确的。 此外,独立于 查询组成技术,搜索到的数据依赖于在商业引擎里面使用的搜索策略,这些搜索策略可能完全或者部分是机密的。 即使这些方法成功地在各种应用程序上下文中得到使用,一些作者仍试图通过使用动态n 元语法估算方法从 Web 的特殊性中得到更多的好处。 在 Beger 和 Miller( 1998) 的文章中,一个刚好及时的适应过程被提出了,它是基于一个在线的文档主题分析和快速
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中设计图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 外文 翻译 基于 网络 自动 语音 识别 辨认 语言 模型
