欢迎来到毕设资料网! | 帮助中心 毕设资料交流与分享平台
毕设资料网
全部分类
  • 毕业设计>
  • 毕业论文>
  • 外文翻译>
  • 课程设计>
  • 实习报告>
  • 相关资料>
  • ImageVerifierCode 换一换
    首页 毕设资料网 > 资源分类 > DOC文档下载
    分享到微信 分享到微博 分享到QQ空间

    算法课程设计---中文分词程序设计与实现

    • 资源ID:1425309       资源大小:79.50KB        全文页数:13页
    • 资源格式: DOC        下载积分:100金币
    快捷下载 游客一键下载
    账号登录下载
    三方登录下载: QQ登录
    下载资源需要100金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

    算法课程设计---中文分词程序设计与实现

    1、 课 程 设 计 说 明 书 设计题目: 中文分词程序设计与实现 学院、系: 装备制造学院 专业班级: 计算机 09(1)班 学生姓名: 指导教师: 成 绩: 2012 年 3 月 2 日 目目 录录 一一 需求分析需求分析 随着国内互联网的迅猛发展,网络信息量急剧膨胀,如果完全由人工来整理如此 繁多的信息,那是难以想象的工作量,同时也不现实的,如何有效、快速、准确的从大 量的信息中找到我们所需要的信息,是摆在我们面前的一个重要和迫切的任务,为了解 决这个难题,人们采用了中文分词技术,通过分词技术,就可以使得对海量信患的整理 更准确更合理,使得检索结果更准确,效率也会大幅度地提高。所谓中文分词

    2、,就是把 一个汉语句子按照其中词的含义进行切分。随羞人们更深入熬研究,中文信息处理技术 得到了广泛应用,并对中文分词技术的要求也越来越高。中文分词技术已经引起多方的 关注,并成为中文信息处理的一个前沿课题l卜21。目前在自然语言处理技术中,中文 处理技术远远落后于西文处理技术,许多西文的处理方法中文不能直接采用,就是因为 中文必须进行分词处理。中文分词是其它中文信息处理的基础,搜索弓|擎只是中文分 词的一个应用,其它应用比如机器翻译(MT)、语音合成、自动分类、自动摘要、自动校 对、中文文献瘁全文检索等翻,都需要焉到分词。分词准确性对搜索弓|擎来说十分重 要,但如果分词速度太慢,即使准确性再高

    3、,对于搜索引擎来说也是不可用的,因为搜 索弓l擎需要处理数以亿诗的网页,如果分词耗用的时间过长,会严重影响搜索引擎内 容更新的速度。因此对于搜索引擎来说,分词的准确性和速度,二者都需要达到很高的 要求,中文分词技术要想更好的服务予更多的产品,需要更多的专业队伍投入到研究中 来,因此,中文分词的研究还是一个相当长的探索过程。 目前中文分词得到了很多现实的应用,主要体现在在信息检索、同音字和多音字 方面的识别、文本校对、简体繁体的囱动转换、自动标引、自动文撬、视器翻译、语言 文字研究、搜索弓|擎研究、自然语言理解和中文信息处哈尔滨二程大学硕七学位论文 理等方面M,也是中文智能计算技术发展的前提和基

    4、础。随着对中文分词技术关注度的 不断提高,大量的学者都加入到了这一研究领域,使中文分词取得了丰硕的研究成果。 近10年来,语言学界、人工智能领域和情报检索界的学者们,在中文分词与自动标引的 研究与实践上进行了大量的研究,找到了许多解决中文分词的方法,目前关于中文分词 研究方法主要有三个方面,即基于字符串匹配的分词方法、基于统计的分词方法和基于 理解的分词方法。中文分词的研究,主要是从词层面进行的研究,这一问题很早就受到 了广泛的关注。目前,各种分词系统也不断建立,分词系统在运行速度、准确度等方面 已经具有了研究应用的价值,但是在句子中词该如何被界定,仍然是一个比较困难的问 题,同时,在不同的应用领域由于应用需求的不同,需要达到的分词效果有很大区别。 词的确切概念难以标准化,词的应用领域不同,使得分词规范难以统一,需要达到的分 词效果也有很大区别。在这一长期的研究和实践过程中,分词规范、歧义字段处理和未 登录词识别成为困扰我们的主要技术难题,随着计算机技术和汉语语言研究的发展,中 文分词


    注意事项

    本文(算法课程设计---中文分词程序设计与实现)为本站会员(毕****文)主动上传,毕设资料网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请联系网站客服QQ:540560583,我们立即给予删除!




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们
    本站所有资料均属于原创者所有,仅提供参考和学习交流之用,请勿用做其他用途,转载必究!如有侵犯您的权利请联系本站,一经查实我们会立即删除相关内容!
    copyright@ 2008-2025 毕设资料网所有
    联系QQ:540560583