【大数据存储技术】「#3」将数据从Hive导入到MySQL
创始人
2024-04-26 22:05:51
0

文章目录

  • 准备工作
    • 安装Hive、MySQL和Sqoop
  • Hive预操作
    • 启动MySQL、hadoop、hive
    • 创建临时表inner_user_log和inner_user_info
  • 使用Sqoop将数据从Hive导入MySQL
    • 启动hadoop集群、MySQL服务
    • 将前面生成的临时表数据从Hive导入到 MySQL 中
    • 查看MySQL中user_log或user_info表中的数据

准备工作

安装Hive、MySQL和Sqoop

Hive预操作

启动MySQL、hadoop、hive

# 启动MySQL
service mysql start
# 启动hadoop
cd /usr/local/hadoop
./sbin/start-all.sh
# 启动hive
hive

在这里插入图片描述

创建临时表inner_user_log和inner_user_info

hive> create table dbtaobao.inner_user_log(user_id INT,item_id INT,cat_id INT,merchant_id INT,brand_id INT,month STRING,day STRING,action INT,age_range INT,gender INT,province STRING) COMMENT 'Welcome to XMU dblab! Now create inner table inner_user_log ' ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE;
  • 将user_log表中的数据插入到inner_user_log
hive> INSERT OVERWRITE TABLE dbtaobao.inner_user_log select * from dbtaobao.user_log;

在这里插入图片描述

  • 查询上面的插入命令是否成功执行
# 不是很理解,不应该在hdfs上查看吗
hive> select * from inner_user_log limit 10;# 在hdfs上查看
./bin/hadoop dfs -cat /user/hive/warehouse/dbtaobao.db/inner_user_log/*

使用Sqoop将数据从Hive导入MySQL

启动hadoop集群、MySQL服务

将前面生成的临时表数据从Hive导入到 MySQL 中

  • 登录 MySQL
  • 创建数据库
mysql> show databases; #显示所有数据库
mysql> create database dbtaobao; #创建dbtaobao数据库
mysql> use dbtaobao; #使用数据库

在这里插入图片描述

  • 查看数据库编码,请确认当前编码为utf8
mysql> show variables like "char%";

在这里插入图片描述

  • 创建表
# 下面在MySQL的数据库dbtaobao中创建一个新表user_log,并设置其编码为utf-8:
mysql> CREATE TABLE `dbtaobao`.`user_log` (`user_id` varchar(20),`item_id` varchar(20),`cat_id` varchar(20),`merchant_id` varchar(20),`brand_id` varchar(20), `month` varchar(6),`day` varchar(6),`action` varchar(6),`age_range` varchar(6),`gender` varchar(6),`province` varchar(10)) ENGINE=InnoDB DEFAULT CHARSET=utf8;
# 提示:语句中的引号是反引号`,不是单引号’。
# 需要注意的是,sqoop抓数据的时候会把类型转为string类型,所以mysql设计字段的时候,设置为varchar# 创建成功后,输入下面命令退出MySQL
mysql> exit;

在这里插入图片描述

  • 导入数据(执行时间:20秒左右)
cd /usr/local/sqoop
bin/sqoop export --connect jdbc:mysql://localhost:3306/dbtaobao --username root --password root --table user_log --export-dir '/user/hive/warehouse/dbtaobao.db/inner_user_log' --fields-terminated-by ',';
  • 字段解释:
./bin/sqoop export ##表示数据从 hive 复制到 mysql 中
--connect jdbc:mysql://localhost:3306/dbtaobao
--username root #mysql登陆用户名
--password root #登录密码
--table user_log #mysql 中的表,即将被导入的表名称
--export-dir '/user/hive/warehouse/dbtaobao.db/user_log ' #hive 中被导出的文件
--fields-terminated-by ',' #Hive 中被导出的文件字段的分隔符

查看MySQL中user_log或user_info表中的数据

  • 再次启动MySQL,进入“mysql>”命令提示符状态
mysql -u root -p
  • 执行下面命令查询user_action表中的数据:
mysql> use dbtaobao;
mysql> select * from user_log limit 10;

在这里插入图片描述

  • 有可能会报错,大概率是mysql字符集问题,字符集使用utf8mb4!

相关内容

热门资讯

保存时出现了1个错误,导致这篇... 当保存文章时出现错误时,可以通过以下步骤解决问题:查看错误信息:查看错误提示信息可以帮助我们了解具体...
汇川伺服电机位置控制模式参数配... 1. 基本控制参数设置 1)设置位置控制模式   2)绝对值位置线性模...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
表格中数据未显示 当表格中的数据未显示时,可能是由于以下几个原因导致的:HTML代码问题:检查表格的HTML代码是否正...
本地主机上的图像未显示 问题描述:在本地主机上显示图像时,图像未能正常显示。解决方法:以下是一些可能的解决方法,具体取决于问...
表格列调整大小出现问题 问题描述:表格列调整大小出现问题,无法正常调整列宽。解决方法:检查表格的布局方式是否正确。确保表格使...
不一致的条件格式 要解决不一致的条件格式问题,可以按照以下步骤进行:确定条件格式的规则:首先,需要明确条件格式的规则是...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...