外文翻译（中文）--对于Hadoop处理小文件的性能优化

资源ID：132582 资源大小：812.83KB 全文页数：15页
资源格式： DOCX 下载积分：100金币

快捷下载

账号登录下载

三方登录下载：

下载资源需要100金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

外文翻译（中文）--对于Hadoop处理小文件的性能优化

1、PDF外文：http:/ 中文 4310 字对于 Hadoop 处理小文件的性能优化 Neethu Mohandas 和 Sabu M. Thampi 印度科钦 Rajagiri工程与技术学院摘要 Hadoop是由 Dong Cutting提出的，一个顶级的 Apache项目。用于支持千级别的庞大数据的分布式应用。它是一个开源的软件框架，灵感来自于谷歌的 MapReduce编程模型和谷歌的系统文件。它是由全球社区的开发者用 java共同研发的。Hadoop被广泛地应用与世界各地的各种学

2、术科研机构和商业组织，还包括了common hadoop， hadoop文件系统 (HDFS)和 MapReduce作为其子项目。 common hadoop包含了支持其他子项目的通用工具。 HDFS是一个高性能的分布式文件系统，Hadoop给予了 HDFS高度的访问程序数据的性能。它还通过数据复制提高了可靠性，并同时保持数据的完整性。 MapReduce的是基于 MapReduce算法的一个能在集群上进行大量的分布式数据计算的软件框架。虽然 Hadoop被广泛的使用，但是由于种种问题，它的潜力还没有被充分发挥出来，小文件的问题就是其中之一。在 hadoop的 0.18.

3、0版本开始， hadoop归档被作为处理小文件的解决方案被引入 hadoop。文件序列化也可以作为一种解决方案。这两种解决方案各自有自己的优点和缺点。我们提出的与建议预计将获得两个解决方案的优点，同时确保 hadoop有一个更好的性能。关键词： hadoop， hadoop分布式文件系统（ HDFS） ,MapReduce，小文件问题， hadoop归档，文件序列化 1 绪论在分布式计算的时代， hadoop飞速发展起来，它在涉及 TB和 PB级别的计算处理中，表现出极佳的性能和高效的处理能力。这些成就可能源于一个名为MapRedu

4、ce的底层软件架构和一个名为 HDFS的分布式文件系统。 MapReduce正像它的名字表现的，是一个基于 Map和 Reduce两步的支持大量计算的软件框架。 Map和 Reduce两个步骤的概念都源于函数是编程语言。在 2004年的 OSDI中，谷歌提交了一份关于 MapReduce的文件，标志着这项工程的动工。 Hadoop是基于 java的MapReduce实现，它的基本概念即为将一个巨大的难以管理的计算分成更小的可管理的块。 HDFS，从另一方面来说，是受了谷歌文件系统的启发。它依靠它的可靠的数据存储，数据的高完整性，以及最重要的高吞吐量，来支持 hadoop高性能的大型计算。因此， Hadoop广泛地受到了网络，搜索，金融，科研机构等市场的青睐。

注意事项: 本文（外文翻译（中文）--对于Hadoop处理小文件的性能优化）为本站会员（泛舟）主动上传，毕设资料网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请联系网站客服QQ：540560583，我们立即给予删除！