上海古都建筑设计集团,上海办公室装修设计公司,上海装修公司高质量的内容分享社区,上海装修公司我们不是内容生产者,我们只是上海办公室装修设计公司内容的搬运工平台

搭建完全分布式Hadoop

guduadmin116小时前

文章目录

  • 一、Hadoop集群规划
  • 二、在主节点上配置Hadoop
    • (一)登录虚拟机
    • (二)设置主机名
    • (三)主机名与IP地址映射
    • (四)关闭与禁用防火墙
    • (五)配置免密登录
    • (六)配置JDK
    • (七)配置Hadoop
      • 1、上传安装包
      • 2、解压缩安装包
      • 3、配置环境变量
      • 4、编辑Hadoop环境配置文件 - hadoop-env.sh
      • 5、编辑Hadoop核心配置文件 - core-site.xml
      • 6、编辑HDFS配置文件 - hdfs-site.xml
      • 7、编辑MapReduce配置文件 - mapred-site.xml
      • 8、编辑YARN配置文件 - yarn-site.xml
      • 9、编辑数据节点文件 - workers
      • 三、从主节点分发到从节点
        • (一)从master节点分发到slave1节点
          • 1、分发JDK
          • 2、分发Hadoop
          • 3、分发环境配置文件
          • 4、刷新环境配置文件
          • 5、查看jdk和hadoop版本
          • 6、分发主机名IP地址映射文件
          • (二)从master节点分发到slave2节点
            • 1、分发JDK
            • 2、分发Hadoop
            • 3、分发环境配置文件
            • 4、刷新环境配置文件
            • 5、查看jdk和hadoop版本
            • 6、分发主机名IP地址映射文件
            • 四、格式化名称节点
            • 五、启动Hadoop集群
            • 六、初试HDFS Shell
              • (一)查看目录
                • 1、命令
                • 2、演示
                • (二)创建目录
                  • 1、创建单层目录
                    • (1)命令
                    • (2)演示
                    • 2、创建多层目录
                      • (1)命令
                      • (2)演示
                      • (三)上传文件
                        • 1、命令
                        • 2、演示
                        • (四)查看文件内容
                          • 1、命令
                          • 2、演示
                          • (五)删除文件
                            • 1、命令
                            • 2、演示
                            • (六)删除目录
                            • 七、查看Hadoop WebUI
                            • 八、运行MR应用 - 词频统计
                            • 九、关闭Hadoop集群

                              一、Hadoop集群规划

                              搭建完全分布式Hadoop,在这里插入图片描述,第1张

                              二、在主节点上配置Hadoop

                              (一)登录虚拟机

                              • 登录三个虚拟机

                                搭建完全分布式Hadoop,在这里插入图片描述,第2张

                                (二)设置主机名

                                搭建完全分布式Hadoop,在这里插入图片描述,第3张

                                (三)主机名与IP地址映射

                                • 执行命令:vim /etc/hosts

                                  搭建完全分布式Hadoop,在这里插入图片描述,第4张

                                  (四)关闭与禁用防火墙

                                  搭建完全分布式Hadoop,在这里插入图片描述,第5张

                                  (五)配置免密登录

                                  搭建完全分布式Hadoop,在这里插入图片描述,第6张

                                  (六)配置JDK

                                  搭建完全分布式Hadoop,在这里插入图片描述,第7张

                                  export JAVA_HOME=/usr/local/jdk1.8.0_231
                                  export PATH=$JAVA_HOME/bin:$PATH
                                  export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
                                  

                                  (七)配置Hadoop

                                  1、上传安装包

                                  • 上传hadoop安装包

                                    搭建完全分布式Hadoop,在这里插入图片描述,第8张

                                  • 查看hadoop安装包

                                    搭建完全分布式Hadoop,在这里插入图片描述,第9张

                                    2、解压缩安装包

                                    • 执行命令:tar -zxvf hadoop-3.3.4.tar.gz -C /usr/local

                                      搭建完全分布式Hadoop,在这里插入图片描述,第10张

                                    • 查看解压后的目录

                                      搭建完全分布式Hadoop,在这里插入图片描述,第11张

                                      3、配置环境变量

                                      • 执行命令:vim /etc/profile

                                        搭建完全分布式Hadoop,在这里插入图片描述,第12张

                                        export HADOOP_HOME=/usr/local/hadoop-3.3.4
                                        export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
                                        export HDFS_NAMENODE_USER=root
                                        export HDFS_DATANODE_USER=root
                                        export HDFS_SECONDARYNAMENODE_USER=root
                                        export YARN_RESOURCEMANAGER_USER=root
                                        export YARN_NODEMANAGER_USER=root
                                        
                                        • 存盘退出,执行命令:source /etc/profile,让配置生效

                                          搭建完全分布式Hadoop,在这里插入图片描述,第13张

                                        • 查看hadoop版本,执行命令:hadoop version

                                          搭建完全分布式Hadoop,在这里插入图片描述,第14张

                                          4、编辑Hadoop环境配置文件 - hadoop-env.sh

                                          • 进入hadoop配置目录,执行命令:cd $HADOOP_HOME/etc/hadoop

                                            搭建完全分布式Hadoop,在这里插入图片描述,第15张

                                          • 执行命令:vim hadoop-env.sh

                                            搭建完全分布式Hadoop,在这里插入图片描述,第16张

                                            export JAVA_HOME=/usr/local/jdk1.8.0_231
                                            export HADOOP_HOME=/usr/local/hadoop-3.3.4
                                            export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
                                            
                                            • 存盘退出,执行命令:source hadoop-env.sh,让配置生效

                                              搭建完全分布式Hadoop,在这里插入图片描述,第17张

                                              5、编辑Hadoop核心配置文件 - core-site.xml

                                              • 执行命令:vim core-site

                                                搭建完全分布式Hadoop,在这里插入图片描述,第18张

                                                
                                                    
                                                    
                                                        fs.defaultFS
                                                        hdfs://master:9000
                                                    
                                                    
                                                    
                                                        hadoop.tmp.dir
                                                        /usr/local/hadoop-3.3.4/tmp
                                                    
                                                
                                                

                                                6、编辑HDFS配置文件 - hdfs-site.xml

                                                • 执行命令:vim hdfs-site.xml

                                                  搭建完全分布式Hadoop,在这里插入图片描述,第19张

                                                  
                                                      
                                                      
                                                          dfs.namenode.name.dir
                                                          /usr/local/hadoop-3.3.4/tmp/namenode
                                                      
                                                      
                                                      
                                                          dfs.datanode.data.dir
                                                          /usr/local/hadoop-3.3.4/tmp/datanode
                                                      
                                                      
                                                      
                                                          dfs.namenode.secondary.http-address
                                                          master:50090
                                                      
                                                      
                                                      
                                                      
                                                          dfs.namenode.http-address
                                                          0.0.0.0:9870
                                                      
                                                      
                                                      
                                                          dfs.replication
                                                          3
                                                      
                                                      
                                                      
                                                          dfs.permissions.enabled
                                                          false
                                                      
                                                  
                                                  

                                                  7、编辑MapReduce配置文件 - mapred-site.xml

                                                  • 执行命令:vim mapred-site.xml

                                                    搭建完全分布式Hadoop,在这里插入图片描述,第20张

                                                    
                                                        
                                                        
                                                            mapreduce.framework.name
                                                            yarn
                                                        
                                                    
                                                    

                                                    8、编辑YARN配置文件 - yarn-site.xml

                                                    • 执行命令:vim yarn-site.xml

                                                      搭建完全分布式Hadoop,在这里插入图片描述,第21张

                                                      
                                                          
                                                          
                                                              yarn.resourcemanager.hostname
                                                              master
                                                          
                                                          
                                                          
                                                              yarn.nodemanager.aux-services
                                                              mapreduce_shuffle
                                                          
                                                          
                                                          
                                                              yarn.nodemanager.vmem-check-enabled
                                                              false
                                                          
                                                      
                                                      

                                                      9、编辑数据节点文件 - workers

                                                      • 执行命令:vim workers

                                                        搭建完全分布式Hadoop,在这里插入图片描述,第22张

                                                        三、从主节点分发到从节点

                                                        (一)从master节点分发到slave1节点

                                                        1、分发JDK

                                                        • 执行命令:scp -r $JAVA_HOME root@slave1:$JAVA_HOME(注意,拷贝目录,一定要加-r选项)

                                                          搭建完全分布式Hadoop,在这里插入图片描述,第23张

                                                        • 在slave1节点上查看拷贝的JDK目录

                                                          搭建完全分布式Hadoop,在这里插入图片描述,第24张

                                                          2、分发Hadoop

                                                          • 执行命令:scp -r $HADOOP_HOME root@slave1:$HADOOP_HOME

                                                            搭建完全分布式Hadoop,在这里插入图片描述,第25张

                                                          • 在slave1节点上查看拷贝的hadoop目录

                                                            搭建完全分布式Hadoop,在这里插入图片描述,第26张

                                                            3、分发环境配置文件

                                                            • 执行命令:scp /etc/profile root@slave1:/etc/profile

                                                              搭建完全分布式Hadoop,在这里插入图片描述,第27张

                                                              4、刷新环境配置文件

                                                              • 在slave1节点上执行命令:source /etc/profile

                                                                搭建完全分布式Hadoop,在这里插入图片描述,第28张

                                                                5、查看jdk和hadoop版本

                                                                • 在slave1节点上执行命令:java -version

                                                                  搭建完全分布式Hadoop,在这里插入图片描述,第29张

                                                                • 在slave1节点上执行命令:hadoop version

                                                                  搭建完全分布式Hadoop,在这里插入图片描述,第30张

                                                                  6、分发主机名IP地址映射文件

                                                                  • 执行命令:scp /etc/hosts root@slave1:/etc/hosts

                                                                    搭建完全分布式Hadoop,在这里插入图片描述,第31张

                                                                    (二)从master节点分发到slave2节点

                                                                    1、分发JDK

                                                                    • 执行命令:scp -r $JAVA_HOME root@slave2:$JAVA_HOME(注意,拷贝目录,一定要加-r选项)

                                                                      搭建完全分布式Hadoop,在这里插入图片描述,第32张

                                                                    • 在slave2节点上查看拷贝的JDK目录

                                                                      搭建完全分布式Hadoop,在这里插入图片描述,第33张

                                                                      2、分发Hadoop

                                                                      • 执行命令:scp -r $HADOOP_HOME root@slave2:$HADOOP_HOME

                                                                        搭建完全分布式Hadoop,在这里插入图片描述,第34张

                                                                      • 在slave2节点上查看拷贝的hadoop目录

                                                                        搭建完全分布式Hadoop,在这里插入图片描述,第35张

                                                                        3、分发环境配置文件

                                                                        • 执行命令:scp /etc/profile root@slave2:/etc/profile

                                                                          搭建完全分布式Hadoop,在这里插入图片描述,第36张

                                                                          4、刷新环境配置文件

                                                                          • 在slave2节点上执行命令:source /etc/profile

                                                                            搭建完全分布式Hadoop,在这里插入图片描述,第37张

                                                                            5、查看jdk和hadoop版本

                                                                            • 在slave2节点上执行命令:java -version

                                                                              搭建完全分布式Hadoop,在这里插入图片描述,第38张

                                                                            • 在slave2节点上执行命令:hadoop version

                                                                              搭建完全分布式Hadoop,在这里插入图片描述,第39张

                                                                              6、分发主机名IP地址映射文件

                                                                              • 执行命令:scp /etc/hosts root@slave2:/etc/hosts

                                                                                搭建完全分布式Hadoop,在这里插入图片描述,第40张

                                                                                四、格式化名称节点

                                                                                • 执行命令:hdfs namenode -format

                                                                                  搭建完全分布式Hadoop,在这里插入图片描述,第41张

                                                                                  搭建完全分布式Hadoop,在这里插入图片描述,第42张

                                                                                • common.Storage: Storage directory /usr/local/hadoop-3.3.4/tmp/namenode has been successfully formatted. 表明名称节点格式化成功。

                                                                                  五、启动Hadoop集群

                                                                                  • 启动hadoop服务,执行命令:start-all.sh

                                                                                    搭建完全分布式Hadoop,在这里插入图片描述,第43张

                                                                                  • 查看进程,执行命令:jps

                                                                                    搭建完全分布式Hadoop,在这里插入图片描述,第44张

                                                                                  • 如果缺少进程,大多是因为响应的配置文件有问题,请仔细对照检查
                                                                                  • hadoop-env.sh没有刷新,导致HADOOP_CONF_DIR环境变量找到不到
                                                                                  • core-site.xml,fs.defaultFS写成了fs.defaultFs,导致启动Hadoop之后,没有HDFS的三个进程:NameNode、SecondaryNameNode、DateNode

                                                                                    搭建完全分布式Hadoop,在这里插入图片描述,第45张

                                                                                    六、初试HDFS Shell

                                                                                    搭建完全分布式Hadoop,在这里插入图片描述,第46张

                                                                                    (一)查看目录

                                                                                    1、命令

                                                                                    • hdfs dfs -ls <路径>

                                                                                      2、演示

                                                                                      • 执行命令:hdfs dfs -ls /

                                                                                        搭建完全分布式Hadoop,在这里插入图片描述,第47张

                                                                                        (二)创建目录

                                                                                        1、创建单层目录

                                                                                        (1)命令
                                                                                        • hdfs dfs -mkdir <单层目录>
                                                                                          (2)演示
                                                                                          • 执行命令:hdfs dfs -mkdir /BigData

                                                                                            搭建完全分布式Hadoop,在这里插入图片描述,第48张

                                                                                          • 在slave1节点上查看新建的目录

                                                                                            搭建完全分布式Hadoop,在这里插入图片描述,第49张

                                                                                            2、创建多层目录

                                                                                            (1)命令
                                                                                            • hdfs dfs -mkdir -p <多层目录>
                                                                                              (2)演示
                                                                                              • 在slave1节点上执行命令:hdfs dfs -mkdir -p /china/sichuan/luzhou/lzy

                                                                                                搭建完全分布式Hadoop,在这里插入图片描述,第50张

                                                                                              • 在master节点上查看新建的多层目录,执行命令:hdfs dfs -ls -R /china

                                                                                                搭建完全分布式Hadoop,在这里插入图片描述,第51张

                                                                                              • 说明:-R (- recursive)表示递归查看目录里全部东西

                                                                                                (三)上传文件

                                                                                                1、命令

                                                                                                • hdfs dfs -put <文件> <路径>

                                                                                                  2、演示

                                                                                                  • 执行命令:hdfs dfs -put /etc/hosts /BigData

                                                                                                    搭建完全分布式Hadoop,在这里插入图片描述,第52张

                                                                                                  • 查看上传的文件

                                                                                                    搭建完全分布式Hadoop,在这里插入图片描述,第53张

                                                                                                  • 执行命令:hdfs dfs -D dfs.replication=2 -put /etc/profile /BigData (上传文件时指定副本数)

                                                                                                    搭建完全分布式Hadoop,在这里插入图片描述,第54张

                                                                                                  • 查看上传的文件

                                                                                                    搭建完全分布式Hadoop,在这里插入图片描述,第55张

                                                                                                  • 修改副本数,执行命令:hdfs dfs -setrep 3 /BigData/profile

                                                                                                    搭建完全分布式Hadoop,在这里插入图片描述,第56张

                                                                                                  • 检验副本数是否已修改

                                                                                                    搭建完全分布式Hadoop,在这里插入图片描述,第57张

                                                                                                    (四)查看文件内容

                                                                                                    1、命令

                                                                                                    • hdfs dfs -cat <文件>

                                                                                                      2、演示

                                                                                                      • 执行命令:hdfs dfs -cat /BigData/hosts

                                                                                                        搭建完全分布式Hadoop,在这里插入图片描述,第58张

                                                                                                        (五)删除文件

                                                                                                        1、命令

                                                                                                        • hdfs dfs -rm <文件>

                                                                                                          2、演示

                                                                                                          • 执行命令:hdfs dfs -rm /BigData/hosts

                                                                                                            搭建完全分布式Hadoop,在这里插入图片描述,第59张

                                                                                                          • 查看文件是否真的被删除

                                                                                                            搭建完全分布式Hadoop,在这里插入图片描述,第60张

                                                                                                            (六)删除目录

                                                                                                            七、查看Hadoop WebUI

                                                                                                            八、运行MR应用 - 词频统计

                                                                                                            九、关闭Hadoop集群

网友评论

搜索
最新文章
热门文章
热门标签