2015年9月13日-9月15日课程作业(sed、awk)
一、sed命令
sed?是一種在線編輯器,它一次處理一行內容。處理時,把當前處理的行存儲在臨時緩沖區(qū)中,稱為“模式空間”(pattern?space),接著用sed命令處理緩沖區(qū)中的內容,處理完成后,把緩沖區(qū)的內容送往屏幕。接著處理下一行,這樣不斷重復,直到文件末尾。文件內容并沒有?改變,除非你使用重定向存儲輸出。Sed主要用來自動編輯一個或多個文件;簡化對文件的反復操作;編寫轉換程序等。
sed語法:
????sed [選項]... {腳本(如果沒有其他腳本)} [輸入文件]...
??-n,?--quiet,?--silent取消自動打印模式空間-e?腳本,?--expression=腳本添加“腳本”到程序的運行列表-f?腳本文件,?--file=腳本文件添加“腳本文件”到程序的運行列表-i?直接修改源文件-r,?--regexp-extended在腳本中使用擴展正則表達式-s,?--separate將輸入文件視為各個獨立的文件而不是一個長的連續(xù)輸入-u,?--unbuffered從輸入文件讀取最少的數據,更頻繁的刷新輸出sed的編輯命令
參數????????說明????????????????????????????????????????????????????????????????舉例 a???\text:附加text,在當前行后面加入一行文本????????????????????????????????????sed?'/^UUID/a?\new?text'?/etc/fstab =????????:顯示行號?????????????????????????????????????????????????????????????sed?'1,4='?/etc/fstab c???\text:用text替換匹配到的行?????????????????????????????????????????????????sed?'/^UUID/c?\new?text\nsecond?line'?/etc/fstab? d????:刪除模式空間中的行???????????????????????????????????????????????????????sed?'/^UUID/d'?/etc/fstab i???\text:插入text,支持\n實現多行插入?????????????????????????????????????????sed?'/^UUID/i?\new?text\nsecond?line'?/etc/fstab p????:打印模式空間中的行???????????????????????????????????????????????????????sed?'1,3p'?/etc/fstab s/regexp/replacement/:替換由regexp所匹配到的內容為replacement;????????????????sed?'s/^UUID/uuid/'?/etc/fstab g????:全局替換;??? w??/path/to/somefile:把指定的內容另存至/path/to/somefile路徑所指定的文件中;???sed?'1~2w?/tmp/fstab.odd'?/etc/fstab r??/path/from/somefile:在文件的指定位置插入另一個文件的所有內容,完成文件合并;sed?'5r?/etc/issue'?/etc/fstabsed的地址定界
示例:
????(1) 刪除/boot/grub/grub.conf文件中所有行的行首的空白字符;
????(2) 刪除/etc/fstab文件中所有以#開頭,后跟至少一個空白字符的行的行首的#和空白字符;
????(3) 把/etc/fstab文件的奇數行另存為/tmp/fstab.3;
????(4) echo一個文件路徑給sed命令,取出其基名;進一步地,取出其路徑名;
????(5)刪除/etc/fstab文件中除了第一行到第三行的內容
?????sed?'1,3!d'?/etc/fstabsed的高級命令
示例:
????(1)在文件中的每行后方添加空白行
????sed?'G'?/etc/issue????(2)保留最后一行
????sed?'$!d'?/etc/fstab????(3)保證指定的文件每一行后方有且只有一個空白行
????(4)保留奇數行
????(5)逆序顯示整個文件,相當于tac? /etc/issue
?二、awk命令
awk是一個強大的文本分析工具,相對于grep的查找,sed的編輯,awk在其對數據分析并生成報告時,顯得尤為強大。簡單來說awk就是把文件逐行的讀入,以空格為默認分隔符將每行切片,切開的部分再進行各種分析處理。
awk有3個不同版本: awk、nawk和gawk,未作特別說明,一般指gawk,gawk 是 AWK 的 GNU 版本。
awk其名稱得自于它的創(chuàng)始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首個字母。實際上 AWK 的確擁有自己的語言: AWK 程序設計語言 , 三位創(chuàng)建者已將它正式定義為“樣式掃描和處理語言”。它允許您創(chuàng)建簡短的程序,這些程序讀取輸入文件、為數據排序、處理數據、對輸入執(zhí)行計算以及生成報表,還有無數其他的功能。
語法
awk?'{pattern?+?action}'?{filenames}awk命令的一般形式: awk?'?BEGIN?{?actions?} awk_pattern1?{?actions?} ............ awk_patternN?{?actions?} END?{?actions?} '? inputfile 其中?BEGIN?{?actions?}?和?END?{?actions?}?是可選的。-F?fs?:?使用fs作為輸入記錄的字段分隔符,如果省略該選項,awk使用環(huán)境變量IFS的值-f?filename?:?從文件filename中讀取awk_script-v?var=value?:?為awk_script設置變量盡管操作可能會很復雜,但語法總是這樣,其中 pattern 表示 AWK 在數據中查找的內容,而 action 是在找到匹配內容時所執(zhí)行的一系列命令。花括號({})不需要在程序中始終出現,但它們用于根據特定的模式對一系列指令進行分組。 pattern就是要表示的正則表達式,用斜杠括起來。
awk語言的最基本功能是在文件或者字符串中基于指定規(guī)則瀏覽和抽取信息,awk抽取信息后,才能進行其他文本操作。完整的awk腳本通常用來格式化文本文件中的信息。
通常,awk是以文件的一行為處理單位的。awk每接收文件的一行,然后執(zhí)行相應的命令,來處理文本。
例如:
(1)顯示/etc/passwd以冒號分割的第一個字段
awk?-F:?'{print?$1}'?/etc/passwd cat?/etc/passwd?|awk??-F?':'??'{print?$1}' root bin daemon adm lp sync這種是awk+action的示例,每行都會執(zhí)行action{print $1}.
-F指定域分隔符為':'
(2)給文件編號,顯示/etc/fstab和/etc/issue文件合計行號
[root@localhost?test]#?awk?'{print?NR,$0}'?/etc/fstab?/etc/issue 1? 2?# 3?#?/etc/fstab 4?#?Created?by?anaconda?on?Thu?Sep?10?09:39:03?2015 5?# 6?#?Accessible?filesystems,?by?reference,?are?maintained?under?'/dev/disk' 7?#?See?man?pages?fstab(5),?findfs(8),?mount(8)?and/or?blkid(8)?for?more?info 8?# 9?UUID=0cc75725-6fc7-4b47-a029-2595d9e99632?/???????????????????????btrfs???subvol=root?????0?0 10?UUID=2d9e58b1-d649-45d3-bb04-fab60538fba0?/boot???????????????????xfs?????defaults????????0?0 11?UUID=0cc75725-6fc7-4b47-a029-2595d9e99632?/home???????????????????btrfs???subvol=home?????0?0 12?UUID=0cc75725-6fc7-4b47-a029-2595d9e99632?/usr????????????????????btrfs???subvol=usr??????0?0 13?UUID=0cc75725-6fc7-4b47-a029-2595d9e99632?/var????????????????????btrfs???subvol=var??????0?0 14?UUID=af2279f4-e85d-429b-926d-66f1054935ec?swap????????????????????swap????defaults????????0?0 15?/dev/sda5???????????????????????????/mydata????ext4???defaults???0?0 16?\S 17?Kernel?\r?on?an?\m 18(3)如果只是顯示/etc/passwd的賬戶和賬戶對應的shell,而賬戶與shell之間以tab鍵分割
[root@localhost?test]#?cat?/etc/passwd?|awk??-F?':'??'{print?$1"\t"$7}' root?/bin/bash bin?/sbin/nologin daemon?/sbin/nologin adm?/sbin/nologin lp?/sbin/nologin sync?/bin/sync shutdown?/sbin/shutdown halt?/sbin/halt mail?/sbin/nologin operator?/sbin/nologin(4)如果只是顯示/etc/passwd的賬戶和賬戶對應的shell,而賬戶與shell之間以逗號分割,而且在所有行添加列名name,shell,在最后一行添加"blue,/bin/nosh"。
[root@localhost?test]#?cat?/etc/passwd?|awk??-F?':'??'BEGIN?{print?"name,shell"}??{print?$1","$7}?END?{print?"blue,/bin/nosh"}' name,shell root,/bin/bash bin,/sbin/nologin daemon,/sbin/nologin adm,/sbin/nologin lp,/sbin/nologin sync,/bin/sync shutdown,/sbin/shutdown halt,/sbin/halt mail,/sbin/nologin blue,/bin/noshawk工作流程是這樣的:先執(zhí)行BEGING,然后讀取文件,讀入有/n換行符分割的一條記錄,然后將記錄按指定的域分隔符劃分域,填充域,$0則表示所有域,$1表示第一個域,$n表示第n個域,隨后開始執(zhí)行模式所對應的動作action。接著開始讀入第二條記錄······直到所有的記錄都讀完,最后執(zhí)行END操作。
搜索/etc/passwd有root關鍵字的所有行
#awk?-F:?'/root/'?/etc/passwd root:x:0:0:root:/root:/bin/bash這種是pattern的使用示例,匹配了pattern(這里是root)的行才會執(zhí)行action(沒有指定action,默認輸出每行的內容)。
搜索支持正則,例如找root開頭的:?awk -F: '/^root/' /etc/passwd
搜索/etc/passwd有root關鍵字的所有行,并顯示對應的shell
#?awk?-F:?'/root/{print?$7}'?/etc/passwd????????????? /bin/bash?這里指定了action{print $7}
awk內置變量
awk有許多內置變量用來設置環(huán)境信息,這些變量可以被改變,下面給出了最常用的一些變量。
ARGC?????????????????????命令行變元個數 ARGV?????????????????????命令行變元數組 FILENAME?????????????????當前輸入文件名 FNR??????????????????????當前文件中的記錄號 FS???????????????????????輸入域分隔符,默認為一個空格 RS???????????????????????輸入記錄分隔符 NF???????????????????????當前記錄里域個數 NR???????????????????????到目前為止記錄數 OFS??????????????????????輸出域分隔符 ORS??????????????????????輸出記錄分隔符此外,$0變量是指整條記錄。$1表示當前行的第一個域,$2表示當前行的第二個域,......以此類推。
統(tǒng)計/etc/passwd:文件名,每行的行號,每行的列數,對應的完整行內容:
使用printf替代print,可以讓代碼更加簡潔,易讀
?awk??-F?':'??'{printf("filename:%10s,linenumber:%s,columns:%s,linecontent:%s\n",FILENAME,NR,NF,$0)}'?/etc/passwdprint和printf
awk中同時提供了print和printf兩種打印輸出的函數。
其中print函數的參數可以是變量、數值或者字符串。字符串必須用雙引號引用,參數用逗號分隔。如果沒有逗號,參數就串聯在一起而無法區(qū)分。這里,逗號的作用與輸出文件的分隔符的作用是一樣的,只是后者是空格而已。
printf函數,其用法和c語言中printf基本相似,可以格式化字符串,輸出復雜時,printf更加好用,代碼更易懂。
awk編程
?變量和賦值
除了awk的內置變量,awk還可以自定義變量。
下面統(tǒng)計/etc/passwd的賬戶人數
awk?'{count++;print?$0;}?END{print?"user?count?is?",?count}'?/etc/passwdroot:x:0:0:root:/root:/bin/bash ...... user?count?is??40count是自定義變量。之前的action{}里都是只有一個print,其實print只是一個語句,而action{}可以有多個語句,以;號隔開。
這里沒有初始化count,雖然默認是0,但是妥當的做法還是初始化為0:
awk?'BEGIN?{count=0;print?"[start]user?count?is?",?count}?{count=count+1;print?$0;}?END{print?"[end]user?count?is?",?count}'?/etc/passwd[start]user?count?is??0root:x:0:0:root:/root:/bin/bash ... [end]user?count?is??40統(tǒng)計某個文件夾下的文件占用的字節(jié)數
ls?-l?|awk?'BEGIN?{size=0;}?{size=size+$5;}?END{print?"[end]size?is?",?size}' [end]size?is??8657198如果以M為單位顯示:
ls?-l?|awk?'BEGIN?{size=0;}?{size=size+$5;}?END{print?"[end]size?is?",?size/1024/1024,"M"}'? [end]size?is??8.25889?M注意,統(tǒng)計不包括文件夾的子目錄。
條件語句
?awk中的條件語句是從C語言中借鑒來的,見如下聲明方式:
if?(expression)?{statement;statement;...?... }if?(expression)?{statement; }?else?{statement2; }if?(expression)?{statement1; }?else?if?(expression1)?{statement2; }?else?{statement3; }統(tǒng)計某個文件夾下的文件占用的字節(jié)數,過濾4096大小的文件(一般都是文件夾):
ls?-l?|awk?'BEGIN?{size=0;print?"[start]size?is?",?size}?{if($5!=4096){size=size+$5;}}?END{print?"[end]size?is?",?size/1024/1024,"M"}'? [end]size?is??8.22339?M循環(huán)語句
awk中的循環(huán)語句同樣借鑒于C語言,支持while、do/while、for、break、continue,這些關鍵字的語義和C語言中的語義完全相同。
?
數組
? 因為awk中數組的下標可以是數字和字母,數組的下標通常被稱為關鍵字(key)。值和關鍵字都存儲在內部的一張針對key/value應用hash的表格里。由于hash不是順序存儲,因此在顯示數組內容時會發(fā)現,它們并不是按照你預料的順序顯示出來的。數組和變量一樣,都是在使用時自動創(chuàng)建的,awk也同樣會自動判斷其存儲的是數字還是字符串。一般而言,awk中的數組用來從記錄中收集信息,可以用于計算總和、統(tǒng)計單詞以及跟蹤模板被匹配的次數等等。
顯示/etc/passwd的賬戶
awk?-F?':'?'BEGIN?{count=0;}?{name[count]?=?$1;count++;};?END{for?(i?=?0;?i?<?NR;?i++)?print?i,?name[i]}'?/etc/passwd 0?root1?daemon2?bin3?sys4?sync 5?games ......轉載于:https://blog.51cto.com/253737/1696302
總結
以上是生活随笔為你收集整理的2015年9月13日-9月15日课程作业(sed、awk)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微通道横屏的问题
- 下一篇: 信息安全系统设计基础学习总结第二周