(五)HDFS容错机制
创始人
2025-05-28 01:56:22
0

设置

  • 关键性的参数 replication factor(复制因子),是每个block要复制几份副本到其他的机器上去,如果某台机器挂了,其他机器上有一模一样的block副本。
  • 这个replication factor可以整体设置一下,也可以对每个文件设置一下,后续还可以修改

过程

  • 写文件的时候,假如说默认的每个block就是3副本,此时namenode会先根据一个复制算法挑选出来3个datanode
  • 每个datanode放一个block
  • 客户端先第一个datanode写入一个block
  • 接着datanode将这个block复制给第二个datanode
  • 然后第二个datanode再将block复制给第三个datanode。

rack aware(机架感知)

  • namenode默认一般一个block是3个副本,你就可以把2个副本放在一个机架上,然后第3个副本放在另外一个机架上。
  • 在一个机架里,同步复制2个副本,通信速度很好,仅仅只有一个副本是同步到另外一个机架上去的,确实会影响一点写的速度,但是总比你在三个机架上各方一个副本好
  • 如果一个机架完全挂了,还有另外一个机架上有一个副本。

心跳

  • namenode每隔一段时间就会从各个datanode那里获取一个heartbeat,这是用来确定那个datanode还活着的
  • 获取心跳的同时还会获取一份block report,就是每个datanode报告自己本地可用的block
  • namenode不断的获取整个集群中的block的情况,新创建文件分配block给datanode的时候,可以根据各个datanode当前的block数量来均匀的分配

数据读取

  • 在读数据的时候,会优先找离自己最近的那个副本所在的机器,保证读取性能最高

相关内容

热门资讯

AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
AWSElasticBeans... 在Dockerfile中手动配置nginx反向代理。例如,在Dockerfile中添加以下代码:FR...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
AWR报告解读 WORKLOAD REPOSITORY PDB report (PDB snapshots) AW...
AWS管理控制台菜单和权限 要在AWS管理控制台中创建菜单和权限,您可以使用AWS Identity and Access Ma...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...
群晖外网访问终极解决方法:IP... 写在前面的话 受够了群晖的quickconnet的小水管了,急需一个新的解决方法&#x...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
Azure构建流程(Power... 这可能是由于配置错误导致的问题。请检查构建流程任务中的“发布构建制品”步骤,确保正确配置了“Arti...