(五)HDFS容错机制
创始人
2025-05-28 01:56:22
0

设置

  • 关键性的参数 replication factor(复制因子),是每个block要复制几份副本到其他的机器上去,如果某台机器挂了,其他机器上有一模一样的block副本。
  • 这个replication factor可以整体设置一下,也可以对每个文件设置一下,后续还可以修改

过程

  • 写文件的时候,假如说默认的每个block就是3副本,此时namenode会先根据一个复制算法挑选出来3个datanode
  • 每个datanode放一个block
  • 客户端先第一个datanode写入一个block
  • 接着datanode将这个block复制给第二个datanode
  • 然后第二个datanode再将block复制给第三个datanode。

rack aware(机架感知)

  • namenode默认一般一个block是3个副本,你就可以把2个副本放在一个机架上,然后第3个副本放在另外一个机架上。
  • 在一个机架里,同步复制2个副本,通信速度很好,仅仅只有一个副本是同步到另外一个机架上去的,确实会影响一点写的速度,但是总比你在三个机架上各方一个副本好
  • 如果一个机架完全挂了,还有另外一个机架上有一个副本。

心跳

  • namenode每隔一段时间就会从各个datanode那里获取一个heartbeat,这是用来确定那个datanode还活着的
  • 获取心跳的同时还会获取一份block report,就是每个datanode报告自己本地可用的block
  • namenode不断的获取整个集群中的block的情况,新创建文件分配block给datanode的时候,可以根据各个datanode当前的block数量来均匀的分配

数据读取

  • 在读数据的时候,会优先找离自己最近的那个副本所在的机器,保证读取性能最高

相关内容

热门资讯

银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
AWSElasticBeans... 在Dockerfile中手动配置nginx反向代理。例如,在Dockerfile中添加以下代码:FR...
AsusVivobook无法开... 首先,我们可以尝试重置BIOS(Basic Input/Output System)来解决这个问题。...
ASM贪吃蛇游戏-解决错误的问... 要解决ASM贪吃蛇游戏中的错误问题,你可以按照以下步骤进行:首先,确定错误的具体表现和问题所在。在贪...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...