正则表达式 BRE 与 ERE的区别
傳統(tǒng)上,POSIX 定義了兩種正則表達式語法, 即:基本正則表達式(BRE)和擴展正則表 達式(ERE)。大多數LINUX程序至少要符合BRE規(guī)范。linux中,不同的程序支持的REGXP也不同,如sed只支持BRE的大部分,這主要是收到速度的限制。sed編輯器要盡可能快的處理數據流中的文本。而grep可以支持ERE,不過要使用-E 選項。gawk使用BRE引擎。 其中, BRE 定義的語法符號包括: . - 匹配任意一個字符。 [] - 字符集匹配,匹配方括號中定義的字符集之一。 [^] - 字符集否定匹配,匹配沒有在方括號中定義的字符。 ^ - 匹配開始位置。 $ - 匹配結束位置。 /(/) - 定義子表達式。 /n - 子表達式向前引用,n 為 1-9 之間的數字。 由于此功能已超出正則語義,需 要在字符串中回溯,因此需要使用 NFA 算法進行匹配。 * - 任意次匹配(零次或多次匹配)。 /{m,n/} - 至少 m 次,至多 n 次匹配;/{m/} 表示 m 次精確匹配;/{m,/} 表示至少 m 次匹配。 ERE 修改了 BRE 中的部分語法,并增加了以下語法符號: ? - 最多一次匹配(零次或一次匹配)。 + - 至少一次匹配(一次或更多次匹配)。 | - 或運算,其左右操作數均可以為一個子表達式。 同時,ERE 取消了子表達式 "()" 和 次數匹配 "{m,n}" 語法符號的轉義符引用語法,在 使用這兩種語法符號時,不在需要添加轉義符。 與此同時, ERE 也取消了非正則語義的 子表達式向前引用能力。 BRE 和 ERE 共享同樣的 POSIX 字符類定義。同時,它們還支持字符類比較操作 "[. .]" 和字符來等效體 "[= =]" 操作,但很少被使用。 f / fr / wfr / bwfr 等工具默認使用 ERE 模式,同時支持以下 PERL 風格的字符類: POSIX 類 perl類 描述
----------------------------------------------------------------------------
[:alnum:] 字母和數字
[:alpha:] /a 字母
[:lower:] /l 小寫字母
[:upper:] /u 大寫字母
[:blank:] 空白字符(空格和制表符)
[:space:] /s 所有空格符(比[:blank:]包含的范圍廣)
[:cntrl:] 不可打印的控制字符(退格、刪除、警鈴...)
[:digit:] /d 十進制數字
[:xdigit:] /x 十六進制數字
[:graph:] 可打印的非空白字符
[:print:] /p 可打印字符
[:punct:] 標點符號 -
此外,還有以下特殊字符類:
perl類 等效POSIX表達式 描述
----------------------------------------------------------------------------
/o [0-7] 八進制數字
/O [^0-7] 非八進制數字
/w [[:alnum:]_] 單詞構成字符
/W [^[:alnum:]_] 非單詞構成字符
/A [^[:alpha:]] 非字母
/L [^[:lower:]] 非小寫字母
/U [^[:upper:]]
總結
以上是生活随笔為你收集整理的正则表达式 BRE 与 ERE的区别的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux shell 时间运算以及时间
- 下一篇: ORACLE 效率测试小工具 Runst