毕业论文(设计):西文译名自动识别方法研究-----字库和词库的匹配与识别开题报告
-
资源ID:131577
资源大小:52.50KB
全文页数:6页
- 资源格式: DOC
下载积分:50金币
快捷下载

账号登录下载
三方登录下载:
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
|
毕业论文(设计):西文译名自动识别方法研究-----字库和词库的匹配与识别开题报告
1、 1 淮 海 工 学 院 毕业设计开题报告 学生姓名: 沈 峰 学 号: 111001418 专 业: 计算机科学与技术 设计题目: 西文译名自动识别方法研究 -字库和词库的匹配与识别 指导教师: 樊 宁 纪兆辉 2004 年 3 月 26 日 2 开题报告填写要求 1开题报告作为毕业设计(论文)答辩委员会对学生答辩资格审查的依据材料之一。此报告应在指导教师指导下,由学生在毕业设计(论 文)工作前期内完成,经指导教师签署意见及教研室审查后生效; 2开题报告内容必须用黑墨水笔工整书写或按教务处统一设计的电子文档标准格式(可从教务处网址上下载)打印,禁止打印在其它纸上后剪贴,完成后应及时交给指导教
2、师签署意见; 3学生查阅资料的参考文献应不少于 10 篇(不包括辞典、手册); 4 有关年月日等日期的填写,应当按照国标 GB/T 7408 94数据元和交换格式、信息交换、日期和时间表示法规定的要求,一律用阿拉伯数字书写。如“ 2004 年 4 月 26日”或“ 2004-04-26” 3 毕 业 设 计 开 题 报 告 1 本课题的研究意义,国内外研究现状、水平和发展趋势 随着信息产业和 Internet 的飞速发展,计算机的使用已渗透到各个领域。这就迫切地要求计算机能够对浩瀚的信息实现自动化处理,以实现及时、准确的掌握信息。在中文信息处理中,自动地进行词语的切分和词性标注是其中的关键。中
3、文信息处理的可信度在很大程度上依赖于自动分词的可信度。 目前影响自动分词精确度提高的主要因素是歧义字段的处理和专有名词的识别。在中文信息处理中,处理最多的是名词,名词又分为普通名词和专有名词。而西文译名在专有名词中占有很大 比重。如果对西文译名处理不当,将会引起相当严重的错误。由于西文译名都是以音译的方式来翻译的,目前对有关译名用字的数量、级别以及范围还没有明确的规定,这是造成现有的西文译名自动识别系统准确率和招回率不高的主要因素之一。因此,对西文译名自动识别做后处理是非常必要的。 目前国内对专有名词识别的研究只是刚刚起步,对译名自动识别的研究相对较少,研究的范围只涉及到对英文姓名译名和音义名的识别。在他们的研究中没有充分利用上下文信息、西文译名中的音节信息以及西文译名在用字上的联系。