毕业论文(设计):西文译名自动识别方法研究-----字库和词库的匹配与识别开题报告
《毕业论文(设计):西文译名自动识别方法研究-----字库和词库的匹配与识别开题报告》由会员分享,可在线阅读,更多相关《毕业论文(设计):西文译名自动识别方法研究-----字库和词库的匹配与识别开题报告(6页珍藏版)》请在毕设资料网上搜索。
1、 1 淮 海 工 学 院 毕业设计开题报告 学生姓名: 沈 峰 学 号: 111001418 专 业: 计算机科学与技术 设计题目: 西文译名自动识别方法研究 -字库和词库的匹配与识别 指导教师: 樊 宁 纪兆辉 2004 年 3 月 26 日 2 开题报告填写要求 1开题报告作为毕业设计(论文)答辩委员会对学生答辩资格审查的依据材料之一。此报告应在指导教师指导下,由学生在毕业设计(论 文)工作前期内完成,经指导教师签署意见及教研室审查后生效; 2开题报告内容必须用黑墨水笔工整书写或按教务处统一设计的电子文档标准格式(可从教务处网址上下载)打印,禁止打印在其它纸上后剪贴,完成后应及时交给指导教
2、师签署意见; 3学生查阅资料的参考文献应不少于 10 篇(不包括辞典、手册); 4 有关年月日等日期的填写,应当按照国标 GB/T 7408 94数据元和交换格式、信息交换、日期和时间表示法规定的要求,一律用阿拉伯数字书写。如“ 2004 年 4 月 26日”或“ 2004-04-26” 3 毕 业 设 计 开 题 报 告 1 本课题的研究意义,国内外研究现状、水平和发展趋势 随着信息产业和 Internet 的飞速发展,计算机的使用已渗透到各个领域。这就迫切地要求计算机能够对浩瀚的信息实现自动化处理,以实现及时、准确的掌握信息。在中文信息处理中,自动地进行词语的切分和词性标注是其中的关键。中
3、文信息处理的可信度在很大程度上依赖于自动分词的可信度。 目前影响自动分词精确度提高的主要因素是歧义字段的处理和专有名词的识别。在中文信息处理中,处理最多的是名词,名词又分为普通名词和专有名词。而西文译名在专有名词中占有很大 比重。如果对西文译名处理不当,将会引起相当严重的错误。由于西文译名都是以音译的方式来翻译的,目前对有关译名用字的数量、级别以及范围还没有明确的规定,这是造成现有的西文译名自动识别系统准确率和招回率不高的主要因素之一。因此,对西文译名自动识别做后处理是非常必要的。 目前国内对专有名词识别的研究只是刚刚起步,对译名自动识别的研究相对较少,研究的范围只涉及到对英文姓名译名和音义名的识别。在他们的研究中没有充分利用上下文信息、西文译名中的音节信息以及西文译名在用字上的联系。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中设计图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业论文 设计 西文 译名 自动识别 方法 法子 研究 钻研 字库 以及 词库 匹配 识别 辨认 开题 报告 讲演 呈文
