當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

动态分区装载数据

發布時間：2025/3/11 编程问答 16 豆豆

生活随笔收集整理的這篇文章主要介紹了动态分区装载数据小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

不開啟

一個個分區導入，分區需要做到一對一。

hive (zmgdb)> insert overwrite table p_t3 partition (city='ningbo')
? ? ? ? ? ? > select name,post,address from p_t1 where city='ningbo';

會啟動mapreduce進行導入，mr卡在kill job_xxxx，等了很久沒反應，原因是分配給yarn的內存太小。需要修改yarn-site.xml里的配置。

見博客：?http://blog.csdn.net/zengmingen/article/details/52609873

（如果按照上面的博客配置了，時而行，時而不行。如果是vm虛擬機搭建的，那就重啟吧）

如果一張表，比如按全國的城市分區的表，那一個個分區導入，費時費力。

于是需要有自動能一對一導入的功能，即動態分區裝載數據。

開啟

hive>set hive.exec.dynamic.partition=true;
hive>set hive.exec.dynamic.partition.mode=nostrict;
hive>set hive.exec.max.dynamic.partitions.pernode=1000;

hive (zmgdb)?> create table p_t4 like p_t1;

hive (zmgdb)> ?insert overwrite table p_t4 partition (city)
? ? ? ? ? ? > select * from p_t1;

hive會啟動mapreduce導入。

hive (zmgdb)> select * from p_t4;
OK
p_t4.name ? ? ? p_t4.post ? ? ? p_t4.address ? ?p_t4.city
1 ? ? ? dddd ? ?dddd ? ?beijing
2 ? ? ? www ? ? www ? ? beijing
3 ? ? ? eeee ? ?wwww ? ?beijing
4 ? ? ? tttt ? ?cccc ? ?beijing
5 ? ? ? yyycc ? dddd ? ?beijing
1 ? ? ? dddd ? ?dddd ? ?ningbo
2 ? ? ? www ? ? www ? ? ningbo
3 ? ? ? eeee ? ?wwww ? ?ningbo
4 ? ? ? tttt ? ?cccc ? ?ningbo
5 ? ? ? yyycc ? dddd ? ?ningbo
1 ? ? ? dddd ? ?dddd ? ?taizhou
2 ? ? ? www ? ? www ? ? taizhou
3 ? ? ? eeee ? ?wwww ? ?taizhou
4 ? ? ? tttt ? ?cccc ? ?taizhou
5 ? ? ? yyycc ? dddd ? ?taizhou
Time taken: 0.155 seconds, Fetched: 15 row(s)
hive (zmgdb)>?

table p_t1

table p_t4

創作挑戰賽新人創作獎勵來咯，堅持創作打卡瓜分現金大獎

總結

以上是生活随笔為你收集整理的动态分区装载数据的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： mysql 跳表 b 树_简单谈谈Mys
下一篇： Oracle 自带sqldevelope

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

动态分区装载数据

不開啟

開啟

總結