ubuntu10.04+hadoop0.20.2平台配置(完全分布式模式)
配置環(huán)境及有關(guān)工具:ubuntu10.04? 、hadoop0.20.2 、 jdk1.6.0_29
我們的機(jī)器有三臺(tái),一臺(tái)當(dāng)作namenode、兩臺(tái)當(dāng)作datanode:
namenode:IP:192.168.0.25、機(jī)器名:kiddenzj (這里的機(jī)器名要注意:機(jī)器名不能包含下劃線“_”,一開(kāi)始沒(méi)注意后來(lái)找了半天才發(fā)現(xiàn)這個(gè)原因)
datanode:IP:192.168.0.8 、機(jī)器名:kiddenxcc??
???????????????????? IP192.168.0.66、機(jī)器名: kiddenhw
集群里所有登陸的用戶名和密碼都要保持相同,我在這里創(chuàng)建了名為grid的用戶,后面的步驟就是在這個(gè)用戶下進(jìn)行的。
配置步驟:
1)安裝ssh
輸入命令:
[java]?view plaincopy2)SSH配置
SSH配置主要是為了實(shí)現(xiàn)在機(jī)器間執(zhí)行指令時(shí)不再需要輸入密碼,在所有的機(jī)器上建立.ssh目錄,這里我們建立在/home/grid下面:
[html]?view plaincopy繼續(xù)執(zhí)行如下命令,把密鑰傳遞給每個(gè)datanode節(jié)點(diǎn):
[java]?view plaincopy可以通過(guò)如下命令發(fā)起連接:
[html]?view plaincopy3)jdk的安裝(namenode機(jī)和datanode機(jī)均按此安裝)
下載jdk-6u29-linux-i586.bin,安裝到/usr/java下,cd到usr/java下,
[python] view plaincopy接下來(lái)要設(shè)置java的環(huán)境變量輸入命令:
[javascript]?view plaincopy[html]?view plaincopy
保存退出,然后執(zhí)行source /etc/profile即可。
輸入java -version 命令,出現(xiàn)如下信息就表示配置成功
[java]?view plaincopy在這里,下載hadoop-0.20.2.tar.gz,然后解壓到/home/grid/下即可,
在hadoop文的件夾下需要建立幾個(gè)文件夾,如下:
(這里一開(kāi)始沒(méi)有創(chuàng)建,結(jié)果查看運(yùn)行信息的時(shí)候,雖然datanode節(jié)點(diǎn)都有進(jìn)程在運(yùn)行,但livenodes節(jié)點(diǎn)依然為0)
[html]?view plaincopy修改hadoop-env.sh,加入如下語(yǔ)句,使得hadoop能夠找到j(luò)ava的路徑。:
[java]?view plaincopy修改core-site.xml,如下:
[java]?view plaincopy修改hdfs-site.xml,如下
[cpp]?view plaincopy修改mapred-site.xml,如下:
[java]?view plaincopyslaves里寫(xiě)入作為datanode節(jié)點(diǎn)的機(jī)器名,這里是:kiddenhw和kiddenxcc
到此,hadoop的有關(guān)配置已經(jīng)完成,namenode端通過(guò)如下命令把配置好的hadoop發(fā)送到各個(gè)datanode處:
[html]?view plaincopy5)修改每臺(tái)機(jī)器上/etc下面的hosts文件,也就是寫(xiě)入所有的機(jī)器名和對(duì)應(yīng)IP地址(包括namenode和datanode節(jié)點(diǎn)),我們這里修改后如下:
[java]?view plaincopy到此基本配置已經(jīng)完成,在namenode端cd到hadoop文件夾下,格式化分布式文件系統(tǒng): [html]?view plaincopy
下面接著在namenode端啟動(dòng)hadoop進(jìn)程:
[html]?view plaincopy在namenode端用jps命令查看啟動(dòng)情況,如下:
[html]?view plaincopy在datanode端用jps查看啟動(dòng)情況,如下:
[html]?view plaincopy然后可以通過(guò)如下地址來(lái)查看集群運(yùn)行狀況:
[html]?view plaincopy總結(jié)
以上是生活随笔為你收集整理的ubuntu10.04+hadoop0.20.2平台配置(完全分布式模式)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Hadoop0.20.2版本在Ubunt
- 下一篇: hadoop0.20.0第一个例子