上海古都建筑设计集团,上海办公室装修设计公司,上海装修公司高质量的内容分享社区,上海装修公司我们不是内容生产者,我们只是上海办公室装修设计公司内容的搬运工平台

Hive实战:学生信息排序

guduadmin11天前

文章目录

  • 一、实战概述
  • 二、提出任务
  • 三、完成任务
    • (一)准备数据
      • 1、在虚拟机上创建文本文件
      • 2、上传文件到HDFS指定目录
      • (二)实现步骤
        • 1、启动Hive Metastore服务
        • 2、启动Hive客户端
        • 3、基于HDFS数据文件创建Hive外部表
        • 4、利用Hive SQL实现按年龄降序排列
        • 四、拓展练习
          • 任务:学生信息排序,先按性别升序,再按年龄降序

            一、实战概述

            • 本次实战以Apache Hive数据仓库工具为核心,通过处理存储在HDFS上的学生信息表实现数据排序操作。首先,创建并上传包含8条记录的学生表数据至HDFS的指定目录,每条记录由姓名、性别、年龄、手机和专业五个字段组成。随后,启动Hive Metastore服务与客户端,并基于HDFS上的文本文件建立了一个外部表t_student。

            • 在实战任务中,主要运用Hive SQL进行数据查询与排序。首先展示了如何按年龄降序排列学生信息,直观展示了Hive对大规模结构化数据的强大处理能力。此外,还进行了拓展练习,演示了更为复杂的排序需求,即先按性别升序再按年龄降序排序学生信息。

            • 整个实战过程通过实际操作详细解析了从数据准备、到使用Hive进行数据建模、再到执行SQL查询及排序的一系列步骤,旨在帮助学习者深入理解并掌握Hive在大数据处理场景中的应用,特别是在数据查询、分析与排序方面的功能与优势。

              二、提出任务

              • 学生表,包含五个字段(姓名、性别、年龄、手机、专业),有8条记录
                姓名性别年龄手机专业
                李文丽1915892943440大数据应用
                张三丰2015890903456人工智能应用
                郑晓琳1818867890234软件技术
                唐宇航2215856577890计算机应用
                陈燕文2113956576783软件技术
                童安格1915889667890大数据应用
                肖雨涵2015857893452软件技术
                冯晓华1818856784560大数据应用
                • 使用Hive计算框架,学生信息按年龄降序排列结果

                  Hive实战:学生信息排序,在这里插入图片描述,第1张

                  三、完成任务

                  (一)准备数据

                  1、在虚拟机上创建文本文件

                  • 在master虚拟机上创建student.txt文件

                    Hive实战:学生信息排序,在这里插入图片描述,第2张

                    2、上传文件到HDFS指定目录

                    • 创建/sortstudent/input目录,执行命令:hdfs dfs -mkdir -p /sortstudent/input

                      Hive实战:学生信息排序,在这里插入图片描述,第3张

                    • 将文本文件student.txt上传到HDFS的/sortstudent/input目录

                      Hive实战:学生信息排序,在这里插入图片描述,第4张

                      (二)实现步骤

                      1、启动Hive Metastore服务

                      • 执行命令:hive --service metastore &,在后台启动metastore服务

                        Hive实战:学生信息排序,在这里插入图片描述,第5张

                        2、启动Hive客户端

                        • 执行命令:hive,看到命令提示符hive>

                          Hive实战:学生信息排序,在这里插入图片描述,第6张

                          3、基于HDFS数据文件创建Hive外部表

                          • 创建外部表t_student,执行命令:

                          • create external table t_student ( name string, gender string, age int, phone string, major string ) row format delimited fields terminated by ' ' location '/sortstudent/input';

                            Hive实战:学生信息排序,在这里插入图片描述,第7张

                          • 在MySQL的hive数据库的TBLS表里可以查看外部表t_student对应的记录

                            Hive实战:学生信息排序,在这里插入图片描述,第8张

                          • 查看学生表全部记录,执行语句:select * from t_student;

                            Hive实战:学生信息排序,在这里插入图片描述,第9张

                            4、利用Hive SQL实现按年龄降序排列

                            • 执行语句:select * from t_student order by age desc;

                              Hive实战:学生信息排序,在这里插入图片描述,第10张

                              四、拓展练习

                              任务:学生信息排序,先按性别升序,再按年龄降序

                              • 运行结果,如下图所示

                                Hive实战:学生信息排序,在这里插入图片描述,第11张

网友评论

搜索
最新文章
热门文章
热门标签