hive 之多表查询
                                                            生活随笔
收集整理的這篇文章主要介紹了
                                hive 之多表查询
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.                        
                                
                            
                            
                            hive 多表查詢,轉化為一個mapreduce的作業
hive>desc dept;
deptno double
dname string
loc string
hive>desc emp;
empno double
ename string
job string
mgr double
hiredate string
sal double
comm double
deptno double
hive>desc salgrade;
grade double
losal double 工資下限
hisal double 工資上限
等值連接
查詢員工信息:員工號,姓名,月薪,部門名稱
select e.empno,e.ename,e.sal,d.dname
from emp e,dept d
where e.deptno=d.deptno;
不等值連接
查詢員工信息:員工號,姓名,月薪,工資級別
select e.empno,e.ename,e.sal,s.grade
from emp e,salgrade s
where e.sal between s.losal and s.hisal ;
外連接
? 按部門統計員工人數:部門號,部門名稱,人數
? select d.deptno,d.dname,count(e.empno)
? from emp e,dept d
? where e.deptno=d.deptno
? group by d.deptno,d.dname;
? 注意:沒有包含在聚合函數中的列,都必須在group by 子句的后面
? 可以用以下的語句進行檢查
? hive>select count(*) from emp;
? hive>select count * from dept;
? 通過外連接可以將對于連接條件不成立的記錄仍然包含在最后的結果中
? ? 左外連接,連接條件不成立,連接條件左邊的表仍然可以包含在最后的結果中
? ? 右外連接,連接條件不成立,連接條件右邊的表仍然可以包含在最后的結果中
? ? 右外連接操作
? ? select d.deptno,d.dname,count(e.empno)
? ? from emp e right outer join dept d
? ? on (e.deptno=d.deptno)
? ? group by d.deptno,d.dname;
自連接
? 自連接的核心:通過表的別名將同一張表視為多張表
? 查詢員工的姓名和員工的老板姓名
? select e.ename,b.ename
? from emp e,emp b
? where e.mgr=b.empno;
                        
                        
                        hive>desc dept;
deptno double
dname string
loc string
hive>desc emp;
empno double
ename string
job string
mgr double
hiredate string
sal double
comm double
deptno double
hive>desc salgrade;
grade double
losal double 工資下限
hisal double 工資上限
等值連接
查詢員工信息:員工號,姓名,月薪,部門名稱
select e.empno,e.ename,e.sal,d.dname
from emp e,dept d
where e.deptno=d.deptno;
不等值連接
查詢員工信息:員工號,姓名,月薪,工資級別
select e.empno,e.ename,e.sal,s.grade
from emp e,salgrade s
where e.sal between s.losal and s.hisal ;
外連接
? 按部門統計員工人數:部門號,部門名稱,人數
? select d.deptno,d.dname,count(e.empno)
? from emp e,dept d
? where e.deptno=d.deptno
? group by d.deptno,d.dname;
? 注意:沒有包含在聚合函數中的列,都必須在group by 子句的后面
? 可以用以下的語句進行檢查
? hive>select count(*) from emp;
? hive>select count * from dept;
? 通過外連接可以將對于連接條件不成立的記錄仍然包含在最后的結果中
? ? 左外連接,連接條件不成立,連接條件左邊的表仍然可以包含在最后的結果中
? ? 右外連接,連接條件不成立,連接條件右邊的表仍然可以包含在最后的結果中
? ? 右外連接操作
? ? select d.deptno,d.dname,count(e.empno)
? ? from emp e right outer join dept d
? ? on (e.deptno=d.deptno)
? ? group by d.deptno,d.dname;
自連接
? 自連接的核心:通過表的別名將同一張表視為多張表
? 查詢員工的姓名和員工的老板姓名
? select e.ename,b.ename
? from emp e,emp b
? where e.mgr=b.empno;
總結
以上是生活随笔為你收集整理的hive 之多表查询的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: NPR-Hatching素描渲染
- 下一篇: C语言期末考试知识点总结
