上海古都建筑设计集团,上海办公室装修设计公司,上海装修公司高质量的内容分享社区,上海装修公司我们不是内容生产者,我们只是上海办公室装修设计公司内容的搬运工平台

Sqoop将hive处理的数据导出到MySQL

guduadmin11天前

目录

部署前提

一、创建数据上传到hive中

创建学生表数据:vim stu.txt

创建课程表数据:vim course.txt

在hive中创建学生表和课程表:

上传数据到hdfs上的hive中:

二、处理hive中的数据

查询学生姓名和课程信息,创建结果表stu_result:

插入数据:

三、在mysql中创建结果表

四、将hive中处理好的结果同步到mysql

处理mysql乱码(1)

处理mysql乱码(2)


部署前提:

启动Hadoop集群,MySQL

一、创建数据上传到hive中

Sqoop将hive处理的数据导出到MySQL,第1张

  • 创建学生表数据:vim stu.txt

    name,id,age(姓名,学号,年龄):

    张三,2001,18

    李四,2002,22

    王五,2003,20

    老六,2004,22

    • 创建课程表数据:vim course.txt

      id,kcmc,xf(学号,课程名称,学分):

      2001,大数据,2

      2002,ETL,3

      2003,python,1

      2004,C语言,2

      Sqoop将hive处理的数据导出到MySQL,第2张

      • 在hive中创建学生表和课程表:

        create table hive_db03.stu
        (
        name string,
        id string,
        age string
        )
        row format delimited fields terminated by ',' stored as textfile;
        create table hive_db03.course
        (
        id string,
        kcmc string,
        xf string
        )
        row format delimited fields terminated by ',' stored as textfile;

        查看创建的两个表:

        show tables;

        Sqoop将hive处理的数据导出到MySQL,第3张

        • 上传数据到hdfs上的hive中:

          hdfs dfs -put stu.txt /user/hive/warehouse/hive_db03.db/stu

          Sqoop将hive处理的数据导出到MySQL,第4张

          hdfs dfs -put course.txt /user/hive/warehouse/hive_db03.db/course

          Sqoop将hive处理的数据导出到MySQL,第5张

          二、处理hive中的数据

          • 查询学生姓名和课程信息,创建结果表stu_result:

            create table hive_db03.stu_result
            (
            name string,
            kcmc string,
            xf string
            )
            row format delimited fields terminated by ',' stored as textfile;

            Sqoop将hive处理的数据导出到MySQL,第6张

            • 插入数据:

              insert into hive_db03.stu_result select m.name,n.kcmc,n.xf from hive_db03.stu m join hive_db03.course n on m.id=n.id;

              Sqoop将hive处理的数据导出到MySQL,第7张

              Sqoop将hive处理的数据导出到MySQL,第8张

              三、在mysql中创建结果表:

              • 登录:

                Sqoop将hive处理的数据导出到MySQL,第9张

                create table db3.stu_result
                (
                name varchar(50),
                kcmc varchar(50),
                xf varchar(20)
                );

                (注:hive中的string对应MySQL中的varchar)

                Sqoop将hive处理的数据导出到MySQL,第10张

                四、将hive中处理好的结果同步到mysql

                sqoop export -connect jdbc:mysql://192.168.43.21:3306/db3 -username sqoop03 -password 123456 -table stu_result -export-dir /user/hive/warehouse/hive_db03.db/stu_result -input-fields-terminated-by ','

                Sqoop将hive处理的数据导出到MySQL,第11张

                • 处理mysql乱码(1)

                • 修改mysql配置文件/etc/my.cnf,增加如下信息

                  [mysqld]

                  character-set-server=utf8

                  [client]

                  default-character-set=utf8

                  [mysql]

                  default-character-set=utf8

                  • 重启mysql:

                    Sqoop将hive处理的数据导出到MySQL,第12张

                    • 重新创建数据库(注意:一定要重新创建数据库,以前创建的数据库编码并未改变)

                      Sqoop将hive处理的数据导出到MySQL,第13张

                      • 调用数据库:

                        Sqoop将hive处理的数据导出到MySQL,第14张

                        • 创建表:

                          Sqoop将hive处理的数据导出到MySQL,第15张

                          • 查看新建的数据库与表编码,已经变成utf8:

                            Sqoop将hive处理的数据导出到MySQL,第16张

                            Sqoop将hive处理的数据导出到MySQL,第17张

                            • 重新同步数据:

                              sqoop export -connect jdbc:mysql://192.168.43.21:3306/db3 -username sqoop03 -password 123456 -table stu_result -export-dir /user/hive/warehouse/hive_db03.db/stu_result -input-fields-terminated-by ','
                              • 查询:

                                Sqoop将hive处理的数据导出到MySQL,第18张

                                • 处理mysql乱码(2)

                                  将原数据库编码格式改变(与上面方法不同的是需要每个数据库修改编码)

                                  1. 删除原表:drop table xxx;
                                  2. 改变数据库编码:alter database db03 character set "utf8";
                                  3. 重新创表:create table xxx;

                                  以上就是简单的sqoop导出过程!

                                  Sqoop将hive处理的数据导出到MySQL,第19张

网友评论

搜索
最新文章
热门文章
热门标签