Ubuntu伪分布式hadoop安装
生活随笔
收集整理的这篇文章主要介绍了
Ubuntu伪分布式hadoop安装
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
有勇气的牛排
官方地址: https://www.920vip.net/
hdoop官网:https://hadoop.apache.org/docs/r3.2.2/
1. 前期环境搭建
1.1 java环境配置
先解压到下面目录
/usr/lib/jvm/jdk-15.0.2然后到home里面cd ~
vim .bashrc将下面配置粘贴到任意位置
#java environment export JAVA_HOME=/usr/lib/jvm/jdk-15.0.2 #export PATH=$PATH:$JAVA_HOME/bin export PATH=${JAVA_HOME}/bin:$PATH # Hadoop Enviroment export HADOOP_HOME=/usr/local/hadoop-3.2.2 export HADOOP_MAPRED_HOME=$HADOOP_HOME export CLASSPATH=$($HADOOP_HOME/bin/hadoop classpath):$CLASSPATH export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib" export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin1.2 安装免密
sudo apt instll ssh ssh-keygen查看
ls .ssh cat .ssh/id_rsa.pub>> .ssh/authorized_keys登陆其他电脑
ssh localhost2.hadoop 配置
2.1 权限配置
将hadoop解压到 /usr/loca/目录下
并且给 /usr/local/hadoop-3.2.2 授权超级用户
chown -R charles /usr/local/hadoop-3.2.22.2 修改配置文件
2.2.1 hadoop-env.sh
vim /usr/local/hadoop-3.2.2/etc/hadoop/hadoop-env.sh在54行左右
export JAVA_HOME=/usr/lib/jvm/jdk-15.0.22.2.2 核心配置core-site.xml
临时目录不用自己建,系统会自动生成
vim /usr/local/hadoop-3.2.2/etc/hadoop/core-site.xml <configuration><!--配置hdfs默认的命名--><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property><!--配置临时目录--><property><name>hadoop.tmp.dir</name><value>file:/usr/local/hadoop-3.2.2/tmp</value></property> </configuration>2.2.3 hdfs-site.xml
vim /usr/local/hadoop-3.2.2/etc/hadoop/hdfs-site.xml <configuration><!--配置副本个数 伪分布 默认为1--><property><name>dfs.replication</name><value>1</value></property><!--配置元数据的存储位置--><property><name>dfs.namenode.name.dir</name><value>file:/usr/local/hadoop-3.2.2/hadoop_data/hdfs/namenode</value></property><!--配置datanode数据存放位置--><property><name>dfs.datanode.data.dir</name><value>file:/usr/local/hadoop-3.2.2/hadoop_data/hdfs/datanode</value></property></configuration>2.2.4 mapreduce设置 mapred-site.xml
分配计算任务位若干个任务,再分配到各个节点
vim /usr/local/hadoop-3.2.2/etc/hadoop/mapred-site.xml <configuration><!--指定mapreduce运行框架--><property><name>mapreduce.framework.name</name><value>yarn</value><final>true</final> <!--此处是否加上待定--></property><!----><property><name>mapreduce.application.classpath</name><value>$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/*:$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/lib/*</value></property></configuration>2.2.5 yarn设置 yarn-site.xml
资源、节点管理器,看各个节点是否可用
vim /usr/local/hadoop-3.2.2/etc/hadoop/yarn-site.xml <configuration><!--指定mapreduce的shuffle--><property> <name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><!-- --><property> <name>yarn.nodemanager.env-whitelist</name><value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value></property> </configuration>2.3 格式化名字节点
接下来构建分布式文件系统
hadoop namenode -format后面这个删除了相当于把分布式文件系统干掉了(一般不执行这里)
ls /usr/local/hadoop-3.2.2/hadoop_data/ rm -rf /usr/local/hadoop-3.2.2/hadoop_data/2.4 启动全分布式文件系统
start-dfs.sh查看节点 有4个进程
jps2.5 启动资源管理器
这里启动了两个服务
start-yarn.sh这时候后台有5个服务
hadoop jar /usr/local/hadoop-3.2.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jar pi 5 103 ubuntu软件安装
传送门:Ubuntu 软件安装
总结
以上是生活随笔为你收集整理的Ubuntu伪分布式hadoop安装的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: Java安卓 使用视图组 布局
- 下一篇: Ubuntu 配置大数据平台hadoop