[svc][op]从历险压缩日志里网站pv uv统计
生活随笔
收集整理的這篇文章主要介紹了
[svc][op]从历险压缩日志里网站pv uv统计
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
http://myhoop.blog.51cto.com/5556534/1367523
tomcat日志格式: http://www.cnblogs.com/anic/archive/2012/12/13/2817126.html
一,統(tǒng)計1.27日到2.2日的日志
蛋疼點:
1,天數(shù)多,機器多
先想辦法列出所有要統(tǒng)計的壓縮包
2,日志都已壓縮
bzcat可以在不解壓情況下查壓縮內容
pv統(tǒng)計:
bzcat node{1,2,3,4}/ access_log.2017-02-0{1,2}*.bz2 node{1,2,3,4}/access_log.2017-01-{27,28,29,30,31}.txt.bz2|grep "your keywords"|wc -lbzcat node{1,2,3,4}/ access_log.2017-02-0{1,2}*.bz2 node{1,2,3,4}/access_log.2017-01-{27,28,29,30,31}.txt.bz2|grep " your keywords"|wc -luv統(tǒng)計:
蛋疼點: X-Forwarded-For對應用戶真實ip,日志|分割,從日志看,有些|分割第一項有2個ip,有些日志條目有1個ip. 解決:先按|awk過濾,再按,過濾,過濾出第一列,之后去重,然后后統(tǒng)計.
bzcat node{1,2,3,4}/access_log.2017-02-0{1,2}*.bz2 java{1,2,3,4}/access_log.2017-01-{27,28,29,30,31}.txt.bz2|grep " your keywords "|awk -F '|' '{print$1}'|awk -F ',' '{print $1}'|sort|uniq -c|sort -rn|wc -lbzcat node{1,2,3,4}/access_log.2017-02-0{1,2}*.bz2 java{1,2,3,4}/access_log.2017-01-{27,28,29,30,31}.txt.bz2|grep " your keywords "|awk -F '|' '{print$1}'|awk -F ',' '{print $1}'|sort|uniq -c|sort -rn|wc –l?
轉載于:https://www.cnblogs.com/iiiiher/p/6371321.html
總結
以上是生活随笔為你收集整理的[svc][op]从历险压缩日志里网站pv uv统计的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mysql数据开启远程登录,修改端口,开
- 下一篇: 如何一步一步用DDD设计一个电商网站(十