一、前言
hadoop是大数据生态中的基础服务,也是其他大数据框架的基础运行环境,尤其是hdfs,是其他大数据框架的基础存储载体,因此系统学习和掌握hadoop对学习大数据很有必要;
而Hive则是Hadop生态系统中必不可少的一个数据分析工具,它可以将存储在HDES中的结构化数据映射为数据库中的一张表,并提供了一种SQL方言对其进行查询。这些SQL语句最终会翻译成MapReduce程序执行。Hive的本质就是为了简化用户编写MapReduce程序而生成的一种框架,它本身并不会存储和计算数据,完全依赖于HDFS和MapReduce,所以搭建hive的前提需要安装并启动hadoop服务;
本篇将基于阿里云服务器,搭建一个hive的环境,由于生产环境下,hive的运行需要依赖hadoop的环境,所以需要提前搭建好hadoop环境;
二、安装包版本说明
本文核心软件包主要包括下面几个,请提前根据需需要准备好,并上传值指定目录;
名称 |
版本号 |
备注< |
猜你喜欢
- 9小时前网络安全(黑客)—2024自学
- 9小时前智能小程序相关名词解释(汇总)
- 9小时前基于 Eureka 的 Ribbon 负载均衡实现原理【SpringCloud 源码分析】
- 9小时前kafka服务器连接出现:[NetworkClient.java:935] [Producer clientId=producer-1] Node -1 disconnected原因分析
- 9小时前Kafka系列 - Kafka一篇入门
- 9小时前数据湖架构Hudi(二)Hudi版本0.12源码编译、Hudi集成spark、使用IDEA与spark对hudi表增删改查
- 9小时前3D Gaussian Splatting:用于实时的辐射场渲染
- 6小时前你是我的优乐美(你是我的优乐美是什么歌)
- 3小时前魔方六面还原公式(魔方六面还原公式口诀)
- 46分钟前沈阳辉山乳业(沈阳辉山乳业是国企吗)
网友评论
- 搜索
- 最新文章
- 热门文章