外文翻译--Hadoop分布式文件系统：架构和设计（译文）

资源ID：151549 资源大小：91KB 全文页数：11页
资源格式： DOC 下载积分：200金币

快捷下载

账号登录下载

三方登录下载：

下载资源需要200金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

外文翻译--Hadoop分布式文件系统：架构和设计（译文）

1、中文 6500 字文献出处： Borthakur D. The hadoop distributed file system : Architecture and designJ. Hadoop Project Website, 2007, 11(11):1 - 10. 毕业设计（论文）外文文献翻译院系：经济与管理学院物流与电子商务系专业：电子商务班级：学生姓名：导师姓名：职称：讲师起止时间： 2014 年 12 月 20 日至 2015 年 6 月 20 日 1 Hadoop 分布式文件系统：架构和设计 D Borthakur 一、引言 Hadoo

2、p 分布式文件系统 (HDFS)被设计成适合运行在通用硬件 (commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时，它和其他的分布式文件系统的区别也是很明显的。 HDFS 是一个高度容错性的系统，适合部署在廉价的机器上。 HDFS 能提供高吞吐量的数据访问，非常适合大规模数据集上的应用。 HDFS 放宽了一部分 POSIX 约束，来实现流式读取文件系统数据的目的。 HDFS 在最开始是作为 Apache Nutch 搜索引擎项目的基础架构而开发的。 HDFS 是 Apache Hadoop Core 项目的一部分。这个项目的地址是http:/

3、hadoop.apache.org/core/。二、前提和设计目标 2.1 硬件错误硬件错误是常态而不是异常。 HDFS 可能由成百上千的服务器所构成，每个服务器上存储着文件系统的部分数据。我们面对的现实是构成系统的组件数目是巨大的，而且任一组件都有可能失效，这意味着总是有一部分 HDFS 的组件是不工作的。因此错误检测和快速、自动的恢复是 HDFS 最核心的架构目标。 2.2 流式数据访问运行在 HDFS 上的应用和普通的应用不同，需要流式访问它们的数据集。 HDFS的设计中更多的考虑到了数据批处理，而不是用户交互处理。比之数据访问的低延迟问题，更关键的在于数据访问的高吞吐量。 PO

4、SIX 标准设置的很多硬性约束对 HDFS 应用系统不是必需的。为了提高数据的吞吐量，在一些关键方面对 POSIX的语义做了一些修改。 2.3 大规模数据集运行在 HDFS 上的应用具有很大的数据集。 HDFS 上的一个典型文件大小一般都在 G 字节至 T 字节。因此， HDFS 被调节以支持大文件存储。它应该能提供整体上高的数据传输带宽，能在一个集群里扩展到数百个节点。一个单一的 HDFS实例应该能支撑数以千万计的文件。 2 2.4 简单的一致性模型 HDFS 应用需要一个“一次写入多次读取”的文件访问模型。一个文件经过创建、写入和关闭之后就不需要改变。这一假设简化了数据一致性问题，并

5、且使高吞吐量的数据访问成为可能。 Map/Reduce 应用或者网络爬虫应用都非常适合这个模型。目前还有计划在将来扩充这个模型，使之支持文件的附加写操作。 2.5 “移动计算比移动数据更划算” 一个应用请求的计算，离它操作的数据越近就越高效，在数据达到海量级别的时候更是如此。因为这样就能降低网络阻塞的影响，提高系统数据的吞吐量。将计算移动到数据附近，比之将数据移动到应用所在显然更好。 HDFS 为应用提供了将它们自己移动到数据附近的接口。 2.6 异构软硬件平台间的可移植性 HDFS 在设计的时候就考虑到平台的可移植性。这种特性方便了 HDFS 作为大规模数据应用平台的推广。三、 Namenode 和 Datanode HDFS 采用 master/slave 架构。一个 HDFS 集群是由一个 Namenode 和一定数目的 Datanodes 组成。 Namenode 是一个中心服务器，负责管理文件系统的名字空间 (namespace)以及客户端对文件的访问。集群中的 Datanode 一般是一个节

注意事项: 本文（外文翻译--Hadoop分布式文件系统：架构和设计（译文））为本站会员（小****人）主动上传，毕设资料网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请联系网站客服QQ：540560583，我们立即给予删除！