Quantcast
Channel: CodeSection,代码区,数据库(综合) - CodeSec
Viewing all articles
Browse latest Browse all 6262

hadoop2.x单机搭建分布式集群超详细教程

$
0
0
【前言】

1.个人PC机配置:戴尔,笔记本,内存8G,硬盘西数500G,CPU酷睿i5

2.由于工作中需要经常在集群上做测试,另外我一直想学习大数据,因此结合百度+同事,有了此篇教程,初学者,不足之处,可在下方留言

【准备工作】

下载如下5个软件:

1.VMware,版本10

2.CentOS系统iso镜像,版本6.5

3.Xshell软件

4.jdk,linux版本1.8

5.hadoop软件包,版本2.7

【注:为方便起见,教程中所有密码均设置为123456】

【搭建步骤】 1.安装VMware软件

详见我博客:

http://blog.csdn.net/wy_0928/article/details/51320437

http://blog.csdn.net/wy_0928/article/details/51320549

2.安装CentOS虚拟机系统以及配置网络和远程连接

详见我博客:

网络设置为NAT模式

http://blog.csdn.net/wy_0928/article/details/51320640

博客中用的是SecureCRT工具,个人目前偏爱Xshell,连接方法很简单,这里不赘述

此时ifconfig查看网卡,应该直接有ip了,试着在虚拟机和本地宿主机ping下:


hadoop2.x单机搭建分布式集群超详细教程
hadoop2.x单机搭建分布式集群超详细教程

切换root用户:


hadoop2.x单机搭建分布式集群超详细教程
3.关闭虚拟机防火墙

首先查看当前防火墙状态:


hadoop2.x单机搭建分布式集群超详细教程

关闭防火墙:


hadoop2.x单机搭建分布式集群超详细教程

查看iptables服务是否开启:


hadoop2.x单机搭建分布式集群超详细教程

重启虚拟机:


hadoop2.x单机搭建分布式集群超详细教程
4.安装并配置jdk

这部分用root权限操作

(1)先输入jave-version查看当前jdk版本,不是1.8就先删除已有版本的jdk软件包:


hadoop2.x单机搭建分布式集群超详细教程

(2)去oracle官网下载jdk1.8的Linux版本(记得下载rpm自安装版本),然后上传到/usr/local/src目录;


hadoop2.x单机搭建分布式集群超详细教程

(3)输入如下命令开始安装jdk:

rpm -i jdk-8u91-linux-i586.rpm

等待安装完成


hadoop2.x单机搭建分布式集群超详细教程

在/usr/java路径下查看是否有jdk1.8文件夹:


hadoop2.x单机搭建分布式集群超详细教程

有就安装成功了。

(3)配置环境变量,让系统用1.8版本的jdk:

首先修改系统配置文件:vi /etc/profile


hadoop2.x单机搭建分布式集群超详细教程

在文件末尾加上如下几行(注意等号前后不要留空格):


hadoop2.x单机搭建分布式集群超详细教程

保存退出

(4)设置修改后的配置文件生效:


hadoop2.x单机搭建分布式集群超详细教程

(5)查看服务器当前jdk版本:


hadoop2.x单机搭建分布式集群超详细教程

至此jdk安装配置结束。

5.创建hadoop相应的文件系统

这部分在root权限下操作

(1)配置hosts文件,路径在/etc/hosts:


hadoop2.x单机搭建分布式集群超详细教程

之后在虚拟机ping master看看是否通:


hadoop2.x单机搭建分布式集群超详细教程

(2)查看虚拟机系统中是否安装lvm工具


hadoop2.x单机搭建分布式集群超详细教程

这就表示已安装。

(3)在虚拟机中添加3块硬盘(均为20G)

虚拟机先关机

a)点击 “编辑虚拟机设置”---“添加”---“硬盘”---“下一步”,然后一直点击 “下一步”直到完成:


hadoop2.x单机搭建分布式集群超详细教程

b)接着,重复此操作2遍,会得到以下图片。最后,点击“确定”并开启虚拟机:


hadoop2.x单机搭建分布式集群超详细教程

开启后fdisk -l查看硬盘是否开启成功:


hadoop2.x单机搭建分布式集群超详细教程
hadoop2.x单机搭建分布式集群超详细教程

可以看到3个20G的硬盘(sdb、sdc、sdd)

(4)创建物理卷

(pvcreate指令用于将物理硬盘分区初始化为物理卷,以便被LVM使用。)

a)使用sdb创建基于sdb的物理卷

pvcreate /dev/sdb

b)使用sdc创建基于sdc的物理卷

pvcreate /dev/sdc

c)使用sdd创建基于sdd的物理卷

pvcreate /dev/sdd


hadoop2.x单机搭建分布式集群超详细教程

d)查看物理卷是否创建成功

pvdisplay


hadoop2.x单机搭建分布式集群超详细教程
hadoop2.x单机搭建分布式集群超详细教程

(5)创建卷组和添加新的物理卷到卷组

a)创建一个卷组

vgcreate test_document /dev/sdb

(vgcreate 命令第一个参数是指定该卷组的逻辑名,后面参数是指定希望添加到该卷组的所有分区和磁盘)

b)将sdc物理卷添加到已有的卷组(注意vgcreate与vgextend用法的区别)

vgextend test_document /dev/sdc

c)将sdd物理卷添加到已有的卷组(注意vgcreate与vgextend用法的区别)

vgextend test_document /dev/sdd


hadoop2.x单机搭建分布式集群超详细教程

d)查看卷组大小(发现已经60G了)


hadoop2.x单机搭建分布式集群超详细教程

(6)激活卷组


hadoop2.x单机搭建分布式集群超详细教程

(7)创建逻辑卷

a) lvcreate -L5120 -n lvhadooptest_document

(该命令是在卷组test_document上创建名字为lvhadoop,大小为5120M的逻 辑卷,并且设备入口为/dev/test_document/lvhadoop ,test_document为卷组名,lvhadoop为逻辑卷名)

b) lvcreate -L51200 -n lvdatatest_document

(该命令是在卷组test_document上创建名字为lvdata,大小为51200M的逻 辑卷,并且设备入口为/dev/test_document/lvdata ,test_document为卷组名,lvdata为逻辑卷名)


hadoop2.x单机搭建分布式集群超详细教程

注意,如果分配过大的逻辑卷 lvcreate -L10240 -n lvhadoop test_document 会提示剩余空间不足,此时可用命令 vgdisplay 去产查看剩余空间的大小。


hadoop2.x单机搭建分布式集群超详细教程

(8)创建文件系统

a) mkfs -t ext4/dev/test_document/lvhadoop


hadoop2.x单机搭建分布式集群超详细教程

b) mkfs -t ext4/dev/test_document/lvdata


hadoop2.x单机搭建分布式集群超详细教程

(9)创建文件夹

a)在linux根目录下创建hadoop文件夹 mkdir -p /hadoop

b)在linux根目录下创建data文件夹 mkdir -p /data


hadoop2.x单机搭建分布式集群超详细教程

(10)挂载

a)mount /dev/test_document/lvhadoop /hadoop

b)mount /dev/test_document/lvdata /data

c)挂载后,再使用 df -kh 命令查看


hadoop2.x单机搭建分布式集群超详细教程

(11)修改自动挂载的配置文件

如果下次重启linux系统后,挂载设备就又看不到了,我们需要把这个文件写入到fstab 分区表文件里面。

a)vi /etc/fstab


hadoop2.x单机搭建分布式集群超详细教程

在文件末尾加上如上两行,然后按“ESC”---“shirt”+“:”---输入“x”---回车,之后reboot重启虚拟机。

6.创建hadoop组和用户

(1)创建组

groupadd -g 3000 cloudadmin

(2)创建用户

useradd -u3001 -g cloudadmin hadoop


hadoop2.x单机搭建分布式集群超详细教程

(3)修改密码

passwd hadoop 密码改为: 123456 (与 root 用户的密码一致)


hadoop2.x单机搭建分布式集群超详细教程

(4)修改文件的系统权限

a)修改hadoop文件的系统权限 chown -Rhadoop:cloudadmin /hadoop

b)修改data文件的系统权限 chown -Rhadoop:cloudadmin /data

c)查看ls -l / | grep cloudadmin


hadoop2.x单机搭建分布式集群超详细教程
7.下载hadoop软件包

打开hadoop官网 http://hadoop.apache.org :


hadoop2.x单机搭建分布式集群超详细教程

点击左侧的Download Hadoop


hadoop2.x单机搭建分布式集群超详细教程

单击releases


hadoop2.x单机搭建分布式集群超详细教程

单击binary,注意source是源码,不要下载错了


hadoop2.x单机搭建分布式集群超详细教程

单击上图的链接进行下载


hadoop2.x单机搭建分布式集群超详细教程

上图中-src是源码文件,我们用另外一个。

8.在虚拟机中解压hadoop

(1)将下载的压缩包上传到/hadoop目录下(rz命令):


hadoop2.x单机搭建分布式集群超详细教程

(2)切换到hadoop用户

重启虚拟机,用hadoop用户登录,注意Xshell远程连接的时候,新建个hadoop用户登录窗口

(退出hadoop用户exit,查看当前用户whoami)


Viewing all articles
Browse latest Browse all 6262

Trending Articles