Hadoop环境搭建
创始人
2025-05-30 17:55:26
0

一.模板虚拟机hadoop100配置如下(本文Linux系统以centos7及以上为准)

(1)使用yum安装需要虚拟机可以正常上网,yum安装前可以先测试下虚拟机联网情况:
ping www.baidu.com
(2)安装epel-release
Extra Packages for Enterprise Linux是为“红帽系”的操作系统提供额外的软件包,适用于RHEL、CentOS和Scientific Linux。

yum install -y epel-release

注意:如果Linux安装的是最小系统版,还需要安装如下工具;如果安装的是Linux桌面标准版,不需要执行如下操作

yum install -y net-tools (工具包集合)
yum install -y vim(编辑器)

在这里插入图片描述
(2)关闭防火墙,关闭防火墙开机自启

![systemctl stop firewalld](https://img-blog.csdnimg.cn/041abcbfd9db45cc8eb6a017cad10847.png)systemctl disable firewalld.service

在这里插入图片描述
3)创建admin用户,并修改admin用户的密码:

useradd admin
passwd admin

在这里插入图片描述
修改克隆ip地址

vim /etc/sysconfig/network-scripts/ifcfg-ens33

自由修改
自由修改

查看主机名称

vim /etc/hostname

配置好xshell
在这里插入图片描述
连接好XFTPS,并传输文件
在这里插入图片描述
文件已经传输完成
在这里插入图片描述

开始安装JDK
之前现实权限不够,安装失败,所以第二次我加了sudo强制安装
在这里插入图片描述

加了sudo 之后显示安装成功

在这里插入图片描述
进入根目录
在这里插入图片描述
来到这个目录下找到jdk
在这里插入图片描述
然后进入jdk
在这里插入图片描述
jdk能不能用,主要是看配置的环境变量

在这里插入图片描述

在这里插入图片描述
然后自己创建一个文件

井号表示注释

#JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_212
export PATH=$PATH:$JAVA_HOME/bin

export 表示全局配置
source一下/etc/profile文件,让新的环境变量PATH生效

source /etc/profile

在这里插入图片描述
输入java
在这里插入图片描述
测试一下,是否安装成功

java -version

在这里插入图片描述
来到这,准备安装hadoop
在这里插入图片描述
安装成功
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
同样source一下之后输入hadoop
在这里插入图片描述
在这里插入图片描述
2)重要目录
(1)bin目录:存放对Hadoop相关服务(hdfs,yarn,mapred)进行操作的脚本
(2)etc目录:Hadoop的配置文件目录,存放Hadoop的配置文件
(3)lib目录:存放Hadoop的本地库(对数据进行压缩解压缩功能)
(4)sbin目录:存放启动或停止Hadoop相关服务的脚本
(5)share目录:存放Hadoop的依赖jar包、文档、和官方案例

Hadoop运行模式

Hadoop运行模式包括:
本地模式、伪分布式模式以及完全分布式模式。
本地模式:单机运行。
伪分布式模式:也是单机运行,但是具备Hadoop集群的所有功能,一台服务器模拟一个分布式的环境。
完全分布式模式:多台服务器组成分布式环境。
在这里插入图片描述
点绿色的Getting started

执行命令时。输出路径是不能存在的,不然会报错
在这里插入图片描述
查看数据 cat
在这里插入图片描述
将102的Hadoop和jdk拷贝到103
在这里插入图片描述
(1)scp定义
scp可以实现服务器与服务器之间的数据拷贝。
(2)基本语法
scp -r pdir/pdir/pdir/fname user@user@user@host:pdir/pdir/pdir/fname
命令 递归 要拷贝的文件路径/名称 目的地用户@主机:目的地路径/名称
eg:
scp -r /opt/module/jdk1.8.0_212 atguigu@hadoop103:/opt/module

可能出现权限不够的情况,两边都需要用root(之前明明赋权了,上次开机就可以用,不知为什么这次不行,没懂)
scp -r root@hadoop102:/opt/module/jdk1.8.0_212/ root@hadoop103:/opt/module

在这里插入图片描述

带*可以把目录下的文件都拷过来,在103上把102的文件拷贝到104
在这里插入图片描述
查看104
在这里插入图片描述

rsync第一次同步等同于拷贝,第二次及以后只改变变化数据
(1)基本语法
rsync -av pdir/pdir/pdir/fname user@user@user@host:pdir/pdir/pdir/fname
命令 选项参数 要拷贝的文件路径/名称 目的地用户@主机:目的地路径/名称
选项参数说明:
-a:归档拷贝
-v:显示复制过程

两个文件同时删掉
在这里插入图片描述

编写集群分发脚本xsync

xsync集群分发脚本
(1)需求:循环复制文件到所有节点的相同目录下
(2)需求分析:
(a)rsync命令原始拷贝:
rsync -av /opt/module admin@hadoop103:/opt/

把原始数据同步分发到指定相同的路径上
在这里插入图片描述

配置全局环境变量
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
创建软连接

在这里插入图片描述
从103退回到102 exit

在这里插入图片描述

创建vim
在这里插入图片描述

在该文件中编写如下代码:

#!/bin/bash#1. 判断参数个数
if [ $# -lt 1 ]
thenecho Not Enough Arguement!exit;
fi
#2. 遍历集群所有机器
for host in hadoop102 hadoop103 hadoop104
doecho ====================  $host  ====================

在这里插入图片描述
进行同步

xsync bin/

在这里插入图片描述
分发环境变量,但显示权限拒绝了
在这里插入图片描述

直接加sudo ,会显示找不到系统命令,因为root用户在家目录下的那些目录内,root使用不了这个路径,所以应该在前面加上 ./bin

sudo ./bin/xsync /etc/profile.d/my_env.sh

在这里插入图片描述
ssh免密登录,需要在自己的服务器上创建一堆密钥

相关内容

热门资讯

AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
AWSElasticBeans... 在Dockerfile中手动配置nginx反向代理。例如,在Dockerfile中添加以下代码:FR...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
AWR报告解读 WORKLOAD REPOSITORY PDB report (PDB snapshots) AW...
AWS管理控制台菜单和权限 要在AWS管理控制台中创建菜单和权限,您可以使用AWS Identity and Access Ma...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...
群晖外网访问终极解决方法:IP... 写在前面的话 受够了群晖的quickconnet的小水管了,急需一个新的解决方法&#x...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
Azure构建流程(Power... 这可能是由于配置错误导致的问题。请检查构建流程任务中的“发布构建制品”步骤,确保正确配置了“Arti...