Hadoop系列七:Hadoop之sqoop篇
Sqoop安裝和運行
sqoop是一個把關(guān)系型數(shù)據(jù)庫數(shù)據(jù)抽向hadoop的工具。同時,也支持將hive、pig等查詢的結(jié)果導(dǎo)入關(guān)系型數(shù)據(jù)庫中存儲。
1)安裝和配置
Ubuntu操作系統(tǒng),主機名hp。
官網(wǎng)http://sqoop.apache.org/ 下載sqoop-1.4.6.bin __hadoop-2.0.4-alpha.tar.gz并解壓。
復(fù)制mysql的jdbc驅(qū)動mysql-connector-java-5.1.38.bin.jar到sqoop項目lib目錄下。
HADOOP_HOME、HBASE_HOME、HIVE_HOME以及ZOOKEEPER_HOME都在etc/profile已配置。配置/etc/profile文件sqoop的環(huán)境變量
$sudo gedit/etc/profile
export SQOOP_HOME=/home/hp/sqoop
export PATH=$PATH:${SQOOP_HOME}/bin
$source /etc/profile
配置sqoop-env.sh文件
sqoop/conf目錄下
$mv sqoop-env-template.sh??sqoop-env.sh
$gedit sqoop-env.sh
#Set?path?to?where?bin/hadoop?is?available
export?HADOOP_COMMON_HOME=/home/hp/hadoop/
?
#Set?path?to?where?hadoop-*-core.jar?is?available
export?HADOOP_MAPRED_HOME=/home/hp/hadoop
?
#set?the?path?to?where?bin/hbase?is?available
export?HBASE_HOME=/home/hp/hbase
?
#Set?the?path?to?where?bin/hive?is?available
export?HIVE_HOME=/home/hp/hive
?
#Set?the?path?for?where?zookeper?config?dir?is
export?ZOOCFGDIR=/home/hp/zookeeper/conf
3)運行使用
啟動Hadoop服務(wù)。
mysql數(shù)據(jù)庫hive中數(shù)據(jù)表xp導(dǎo)入到HDFS中:
$sqoop import --connectjdbc:mysql://127.0.0.1:3306/hive --username hive --password hive --table xp --fields-terminated-by?'\t'?-m?1??
$hadoop fs –ls/user/hp/xp/??? //可以看到已遷移過來的文件part-m-00000。
把hdfs的數(shù)據(jù)導(dǎo)出到mysql中:
mysql中創(chuàng)建數(shù)據(jù)表xp2,和xp一樣有兩個字段(id int,name char(20))
mysql>create tablexp2(id int,name char(20));
$sqoop export --connectjdbc:mysql://127.0.0.1:3306/hive --username hive --password hive --table xp2--export-dir ‘/user/hp/xp/part-m-00000’ --fields-terminated-by?'\t'
進入mysql查看xp2內(nèi)容
$mysql –u hive –p
mysql>use hive;
mysql>select* from xp2;//和xp原來內(nèi)容一樣總結(jié)
以上是生活随笔為你收集整理的Hadoop系列七:Hadoop之sqoop篇的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hadoop系列六:Hadoop之HBa
- 下一篇: SSL加密包解析的几个概念梳理