Hive hang without response
前些天Hive查詢的接口一直超時報警,登錄上去查看發現這個超時報警的曲線很有規律,每個小時開始就出現,過了大約3分鐘左右就好了.在這個期間里,也發現hive根本就執行不了,完全hang住了,機器負載,HDFS,Jobtracker的負載響應都完全正常!
立刻查看下日志發現幾點:
1.對比其他時間的同一個job發現兩個時間點的上傳job文件到hdfs以及mapreduce的執行時間完全一致,也就是說排除了hdfs,jobtracker的問題
2.出問題時,hive的執行基本阻塞在Initialized ObjectStore部分
那么基本猜想就是MySQL出問題了,查看MySQL的監控日志發現果然每到這個時間點都會出現highsession,找到一個時間點用percona的工具分析了一下slow log發現了最終的元兇:
? ?原來是每個整點都會執行一次backup,但是在backup之前會有一個分析的query也在跑(cron),mysqldump在backup之前會先進行flush table,但是由于那個long running query在導致flush table一直在等待,從而導致后來的所有操作都在waitingfor flushing table.
找到原因就好辦了,把備份遷移到從庫,另外優化那個long running query,解決.
轉載于:https://blog.51cto.com/boylook/1367256
總結
以上是生活随笔為你收集整理的Hive hang without response的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: github和git@osc提交问题
- 下一篇: 参加第三届信息化创新克拉玛依国际学术论坛