shell之实战应用一(查找xml文档中的关键字段)
生活随笔
收集整理的這篇文章主要介紹了
shell之实战应用一(查找xml文档中的关键字段)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前幾天同事問我一個問題,說如下的文檔中,如何把name后面的字段(紅色框中的字段)單獨打印出來?
?
其實這個很簡單,先用sed過濾,然后用cut分割顯示即可實現,如下:
sed -n '/name/p' a.xml | cut -d '"' -f 2?使用sed命令的name匹配(或者field也可以)行,然后用cut把"作為分割符取第2列即可
?
或者使用awk也可以實現:
awk -F '"' '$0~"name"{print $2}' a.xml #或者 awk 'BEGIN{FS="\""}$0~"name"{print $2}' a.xml?上面語句是把界定符放在了外面,使用參數標識
下面語句是把界定符放在了語句里面,因為雙引號是特殊字符,所以使用反斜杠轉義一下
?
但我同事說,這個可不止只有一條數據,如果是多條數據,會重復打印字段,部分數據如下:
這時我們需要對語句進行稍微的加工,如果使用sed,則需要如下操作:
sed -n '/name/p' b.xml | cut -d '"' -f 2 | sort |uniq?后面多加了倆個命令sort和uniq,sort是排序,uniq是去重,只有排序了才能去重,否則不生效。這里也可以把sort和uniq直接寫成sort -u,當然如果需要反序,可以寫成sort -ur
?
當然使用awk也是可以的,寫成如下:
awk 'BEGIN{FS="\""}nameflag[$2]==$2{next}$0~"name"{print $2;nameflag[$2]=$2}' b.xml?我們這里加了一個數列來存儲第二個字段,然后來比較第二個字段是否再出現,如果出現就跳過執行后面的行,這樣就避免了重復
?
大家有什么更好的解決辦法可以留言!
?
轉載于:https://www.cnblogs.com/watertaro/p/9311449.html
總結
以上是生活随笔為你收集整理的shell之实战应用一(查找xml文档中的关键字段)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: sublime text3 最新 lic
- 下一篇: 安装仪表盘控件Iocomp会遇到的几个常