shell脚本详解(七)——正则表达式、sort、uniq、tr
生活随笔
收集整理的這篇文章主要介紹了
shell脚本详解(七)——正则表达式、sort、uniq、tr
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
shell腳本詳解(七)——正則表達式、sort、uniq、tr
- 一、排序命令——sort
- 1、格式
- 2、常用選項
- 3、示例
- 二、去除重復行操作命令——uniq
- 1、格式
- 2、常用選項
- 3、示例
- 三、字符轉換命令——tr
- 1、格式
- 2、常用選項
- 3、參數
- 4、示例
- 四、顯示、連接文件命令——cut
- 1、格式
- 2、常用選項
- 3、示例
- 五、正則表達式
- 1、基礎正則表達式常見元字符(支持工具:egrep、awk、grep、sed)
- 2、擴展正則表達式元字符(支持工具:egrep、awk)
- 3、示例
- ①、首先顯示文件中以13和15開頭的手機號碼,然后顯示區域座機號碼
- ②、顯示郵件,用戶名要求字母開頭,中間可用最多2種符號 "-" 或 "." ,不能使用符號結尾,用戶名長度為最少6個字符
一、排序命令——sort
- 以行為單位對文件內容進行排序,也可以根據不同的數據類型來排序
1、格式
2、常用選項
| -f | 忽略大小寫,默認會大寫字母排在前面 |
| -b | 忽略每行前面的空格 |
| -n | 按照數字進行排序 |
| -r | 反向排序 |
| -u | 等同uniq,表示相同的數據僅顯示一行,去重 |
| -t | 指定字段分隔符,默認使用tab鍵分隔 |
| -k | 指定排序字段 |
| -o <輸出文件> | 將排序后的結果轉存至指定文件 |
3、示例
二、去除重復行操作命令——uniq
- 用于報告或者忽略文件中連續的重復行,常與sort命令結合使用
1、格式
2、常用選項
| -c | 進行計數,并刪除文件中重復出現的行 |
| -d | 僅顯示連續的重復行 |
| -u | 僅顯示出現一次的行 |
3、示例
三、字符轉換命令——tr
- 常用于對來自標準輸入的字符進行替換、壓縮和刪除
1、格式
2、常用選項
| -c | 保留字符集1的字符,其他的字符(包括換行符\n)用字符集2替換 |
| -d | 刪除所有屬于字符集1的字符 |
| -s | 將重復出現的字符串壓縮為一個字符串,用字符集2 替換 字符集1 |
| -t | 字符集2 替換 字符集1,不加選項同結果 |
3、參數
-
字符集1:
- 指定要轉換或刪除的原字符集。當執行轉換操作時,必須使用參數”字符集2“指定轉換操作時,必須使用參數”字符集2“指定轉換的目標字符集。但執行刪除操作時,不需要參數”字符集2“
-
字符集2:
- 指定要轉換成的目標字符集
4、示例
四、顯示、連接文件命令——cut
- cut命令有兩個主要的功能,第一是顯示文件內容,第二是連接多個或多個文件
1、格式
2、常用選項
| -b | 以字節為單位進行分割 ,僅顯示行中指定直接范圍的內容 |
| -c | 以字符為單位進行分割 , 僅顯示行中指定范圍的字符 |
| -d | 自定義分隔符,默認為制表符”TAB” |
| -f | 顯示指定字段的內容 , 與-d一起使用 |
| -n | 取消分割多字節字符 |
| –complement | 補足被選擇的字節、字符或字段 |
| –out-delimiter | 指定輸出內容是的字段分割符 |
3、示例
五、正則表達式
-
通常用于判斷語句中,用于檢查某一字符串是否滿足某一格式
-
正則表達式是由普通字符與元字符組成
-
普通字符包括大小寫字母、數字、標點符號及一些其他符號
-
元字符是指在正則表達式中具有特殊意義的專用字符,可以用來規定其前導字符(即位于元字符前面的字符)在目標對象中的出現模式
1、基礎正則表達式常見元字符(支持工具:egrep、awk、grep、sed)
| \ | 轉義字符,用于取消特殊符號的含義,例: !、\n、$等 |
| ^ | 匹配字符串開始的位置,例: ^a、 ^the、 #、[a-z] |
| $ | 匹配字符串結束的位置,例: wordKaTeX parse error: Expected group after '^' at position 3: 、 ^?匹配空行 |
| . | 匹配除\n之外的任意的一個字符,例: go.d、 g…d |
| * | 匹配前面子表達式0次或者多次,例: goo*d、 go.*d |
| [list] | 匹配list列表中的一個字符,例: go[ola]d, [abc]、 [a-z]、 [a-z0-9]、 [0-9]匹配任意一位數字 |
| [^list] | 匹配任意非list列表中的一個字符,例: [^0-9]、 [^A-Z0-9]、 [^a-z]匹配任意一位非小寫字母 |
| {n} | 匹配前面的子表達式n次,例: go{2}d、 '[0-9]{2} '匹配兩位數字 |
| {n,} | 匹配前而的子表達式不少于n次,例: go{2, }d、’[0-9]{2, }'匹配兩位及兩位以上數字 |
| {n,m} | 匹配前面的子表達式n到m次,例: go{2,3}d、 ’ [0-9]{2,3}'匹配兩位到三位數字 |
注:egrep、 awk使用{n}、{n,}、{n, m}匹配時“{}”前不用加“\”
2、擴展正則表達式元字符(支持工具:egrep、awk)
| 元字符 | 說明 |
| + | 匹配前面子表達式1次以上,例: go+d, 將匹配至少一個o, 如god、 good、 goood等 |
| ? | 匹配前面子表達式0次或者1次,例: go?d, 將匹配gd或god |
| () | 將括號中的字符串作為h一個整體,例1: g(oo)+d," 將匹配oo整體1次以上,如good、gooood等 |
| | | 以或的方式匹配字條串,例: g (oo|la)d," 將匹配good或者glad |
3、示例
①、首先顯示文件中以13和15開頭的手機號碼,然后顯示區域座機號碼
②、顯示郵件,用戶名要求字母開頭,中間可用最多2種符號 “-” 或 “.” ,不能使用符號結尾,用戶名長度為最少6個字符
總結
以上是生活随笔為你收集整理的shell脚本详解(七)——正则表达式、sort、uniq、tr的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 内存翻倍!全球首款智能手机震撼问世
- 下一篇: AMD专用内存:电脑秒变跑车,内存大杯饮