18、正则表达式中常用字符
1、基本規則
錨點----標識位置
??? ^: 表示句首.?? $: 表示句尾.
??? \<: 表示詞首.? \>: 表示詞尾.?
修飾符
*: 表示前一個 char. set 的出現次數為 0 或多次,[a-z]+able.
?: 表示前一個 char. set 的出現次數為 0 或 1 次.
+: 表示前一個 char. set 的出現次數為 1 或多次.
{n}: 表示前一個 char. set 的出現次數必須為 n 次.
|: 或匹配,如a|b|c匹配a或b或c
(): 分組符號,如,love(able|rs)ov+匹配loveable或lovers,匹配一個或多個ov
{n,}: 表示前一個 char. set 的出現次數至少為 n 次.
{n,m}: 表示前一個 char. set 的出現次數為 n 到 m 次.
\:轉義字符,如\{5,3\}來表示括號
[ ]:單個字符;如[A] 即A符合要求
[^A-F]:匹配不在指定范圍內的字符所在行
[ - ]: 范圍;如[A-Z]即A,B,C一直到Z都符合要求
.: 匹配任意一個字符(1個)
.*合起來表示該位置可以出現0個以上的任意字符。
[]:匹配其中之一的字符
\(\):標記字符串,將匹配到的結果存放入寄存器中,如’\(love\)’,love被標記為1
\w: 匹配文字和數字字符,也就是[A-Za-z0-9],如:’G\w*p’匹配以G后跟零個或多個文字或數字字符,然后是p。
\W \w: 的反置形式,匹配一個或多個非單詞字符,如點號句號等。
\b: 單詞鎖定符,如: ‘\bgrep\b’只匹配grep。
2、4. POSIX字符類
??? 為了在不同國家的字符編碼中保持一至,POSIX(The Portable Operating System Interface)增加了特殊的字符類,如[:alnum:]是A-Za-z0-9的另一個寫法。要把它們放到[]號內才能成為正則表達式,如[A- Za-z0-9]或[[:alnum:]]。
[:alnum:]文字數字字符
[:alpha:]文字字符
[:digit:]數字字符
[:graph:]非空字符(非空格、控制字符)
[:lower:]小寫字符
[:cntrl:]控制字符
[:print:]非空字符(包括空格)
[:punct:]標點符號
[:space:]所有空白字符(新行,空格,制表符)
[:upper:]大寫字符
[:xdigit:]十六進制數字(0-9,a-f,A-F)
參考
【1】 http://www.cnblogs.com/mydomain/archive/2010/10/17/1853661.html
轉載于:https://www.cnblogs.com/mydomain/archive/2011/08/27/2155340.html
總結
以上是生活随笔為你收集整理的18、正则表达式中常用字符的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C#数据同步中基本步骤和用到的相关函数
- 下一篇: [转]如何将属性表嵌入对话框中显示