當前位置：首頁 > 编程语言 > java >内容正文

java

Javascript与正则表达式

發布時間：2025/4/16 java 34 豆豆

生活随笔收集整理的這篇文章主要介紹了 Javascript与正则表达式小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、正則表達式

1、定義

regular expression，簡稱res，一個正則表達式就是由普通字符以及特殊字符（稱為元字符）組成的文字模式。該模式描述在查找文字主體時待匹配的一個或多個字符串。正則表達式作為一個模板，將某個字符模式與所搜索的字符串進行匹配

2、作用

正則表達式提供了功能強大、靈活而又高效的方法來處理文本。正則表達式的全面模式匹配表示法可以快速地分析大量的文本以找到特定的字符模式；提取、編輯、替換或刪除文本子字符串；或將提取的字符串添加到集合以生成報告

3、主要用途

正則表達式被用來匹配一組文字。通常，它有兩類用途：

數據有效性驗證
查找和替換

4、如何來構造正則表達式

構造正則表達式的方法和創建數學表達式的方法一樣。也就是用多種元字符與操作符將小的表達式結合在一起來創建更大的表達式。可以通過在一對分隔符之間放入表達式模式的各種組件來構造一個正則表達式。對 JScript 而言，分隔符為一對正斜杠 (/) 字符

構造器函數方法使用方法如下

new RegExp("pattern"[, "flags"])

文本格式： /pattern/flags

pattern ：一個正則表達式文本
flags：如果存在，將是以下值：
g： global match(全局匹配)
i：ignore case(忽略大小寫)
gi： both global match and ignore case(匹配所有可能的值，也忽略大小寫)

注意：文本格式中的參數不要使用引號標記，而構造器函數的參數則要使用引號標記。所以下面的表達式建立同樣的正則表達式：/ab+c/i 等價于new RegExp(“ab+c”, “i”)

使用文本格式文本的長度最大支持128個字符

描述：

當使用構造函數的時候，必須使用正常的字符串避開規則(在字符串中加入前導字符\ )是必須的。

例如，下面的兩條語句是等價的：

re = new RegExp("\\w+") re = /\w+/

二、下表是元字符及其在正則表達式上下文中的行為的一個完整列表

字符描述

\	將下一個字符標記為一個特殊字符、或一個原義字符、或一個后向引用、或一個八進制轉義符。例如，’n’ 匹配字符 “n”。’\n’ 匹配一個換行符。序列 ‘\’ 匹配 “\” 而 “(” 則匹配 “(“
^	匹配輸入字符串的開始位置。如果設置了 RegExp 對象的 Multiline 屬性，^ 也匹配 ‘\n’ 或 ‘\r’ 之后的位置
$	匹配輸入字符串的結束位置。如果設置了RegExp 對象的 Multiline 屬性，$ 也匹配 ‘\n’ 或 ‘\r’ 之前的位置
*	匹配前面的子表達式零次或多次。例如，zo* 能匹配 “z” 以及 “zoo”。 * 等價于{0,}
+	匹配前面的子表達式一次或多次。例如，’zo+’ 能匹配 “zo” 以及 “zoo”，但不能匹配 “z”。+ 等價于 {1,}
?	匹配前面的子表達式零次或一次。例如，”do(es)?” 可以匹配 “do” 或 “does” 中的”do” 。? 等價于 {0,1}
{n}	n 是一個非負整數。匹配確定的 n 次。例如，’o{2}’ 不能匹配 “Bob” 中的 ‘o’，但是能匹配 “food” 中的兩個o
{n,}	n 是一個非負整數。至少匹配n 次。例如，’o{2,}’ 不能匹配 “Bob” 中的 ‘o’，但能匹配 “foooood” 中的所有 o。’o{1,}’ 等價于 ‘o+’。’o{0,}’ 則等價于 ‘o*’
{n,m}	m 和 n 均為非負整數，其中n <= m。最少匹配 n 次且最多匹配 m 次。劉， “o{1,3}” 將匹配 “fooooood” 中的前三個 o。’o{0,1}’ 等價于 ‘o?’。請注意在逗號和兩個數之間不能有空格
?	當該字符緊跟在任何一個其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面時，匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字符串，而默認的貪婪模式則盡可能多的匹配所搜索的字符串。例如，對于字符串 “oooo”，’o+?’ 將匹配單個 “o”，而 ‘o+’ 將匹配所有 ‘o’
.	匹配除 “\n” 之外的任何單個字符。要匹配包括 ‘\n’ 在內的任何字符，請使用象 ‘[.\n]’ 的模式
(pattern)	匹配pattern 并獲取這一匹配。在JScript 中則使用 1…9 屬性。要匹配圓括號字符，請使用 ‘(’ 或 ‘)’
(?:pattern)	匹配 pattern 但不獲取匹配結果，也就是說這是一個非獲取匹配，不進行存儲供以后使用。這在使用 “或” 字符 (
(?=pattern)	正向預查，在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配，也就是說，該匹配不需要獲取供以后使用。例如， ‘Windows (?=95
(?!pattern)	負向預查，在任何不匹配的字符串開始處匹配查找字符串。這是一個非獲取匹配，也就是說，該匹配不需要獲取供以后使用。例如’Windows (?!95
x\|y	匹配 x 或 y。例如，’z\|food’ 能匹配 “z” 或 “food”。’(z\|f)ood’ 則匹配 “zood” 或 “food”
[xyz]	字符集合。匹配所包含的任意一個字符。例如， ‘[abc]’ 可以匹配 “plain” 中的 ‘a’
[^xyz]	負值字符集合。匹配未包含的任意字符。例如， ‘[^abc]’ 可以匹配 “plain” 中的’p’
[a-z]	字符范圍。匹配指定范圍內的任意字符。例如，’[a-z]’ 可以匹配 ‘a’ 到 ‘z’ 范圍內的任意小寫字母字符。例如:[a-z] [A-Z] [0-9]
[^a-z]	負值字符范圍。匹配任何不在指定范圍內的任意字符。例如，’[^a-z]’ 可以匹配任何不在 ‘a’ 到 ‘z’ 范圍內的任意字符
\b	匹配一個單詞邊界，也就是指單詞和空格間的位置。例如， ‘er\b’ 可以匹配”never” 中的 ‘er’，但不能匹配 “verb” 中的 ‘er’
\B	匹配非單詞邊界。’er\B’ 能匹配 “verb” 中的 ‘er’，但不能匹配 “never” 中的 ‘er’
\cx	匹配由x指明的控制字符。例如， \cM 匹配一個 Control-M 或回車符。 x 的值必須為 A-Z 或 a-z 之一。否則，將 c 視為一個原義的 ‘c’ 字符
\d	匹配一個數字字符。等價于 [0-9]
\D	匹配一個非數字字符。等價于 [^0-9]
\f	匹配一個換頁符。等價于 \x0c 和 \cL
\n	匹配一個換行符。等價于 \x0a 和 \cJ
\r	匹配一個回車符。等價于 \x0d 和 \cM
\s	匹配任何空白字符，包括空格、制表符、換頁符等等。等價于 [ \f\n\r\t\v]
\S	匹配任何非空白字符。等價于 [^ \f\n\r\t\v]
\t	匹配一個制表符。等價于 \x09 和 \cI
\v	匹配一個垂直制表符。等價于 \x0b 和 \cK
\w	匹配包括下劃線的任何單詞字符。等價于’[A-Za-z0-9_]’
\W	匹配任何非單詞字符。等價于 ‘[^A-Za-z0-9_]’
\xn	匹配 n，其中 n 為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。例如， ‘\x41’ 匹配 “A”。’\x041’ 則等價于 ‘\x04’ & “1”。正則表達式中可以使用 ASCII 編碼
\num	匹配 num，其中 num 是一個正整數。對所獲取的匹配的引用。例如，’(.)\1’ 匹配兩個連續的相同字符
\n	標識一個八進制轉義值或一個后向引用。如果 \n 之前至少 n 個獲取的子表達式，則 n 為后向引用。否則，如果 n 為八進制數字 (0-7)，則 n 為一個八進制轉義值
\nm	標識一個八進制轉義值或一個后向引用。如果 \nm 之前至少有is preceded by at least nm 個獲取得子表達式，則 nm 為后向引用。如果 \nm 之前至少有 n 個獲取，則 n 為一個后跟文字 m 的后向引用。如果前面的條件都不滿足，若 n 和 m 均為八進制數字 (0-7)，則 \nm 將匹配八進制轉義值 nm
\nml	如果 n 為八進制數字 (0-3)，且 m 和 l 均為八進制數字 (0-7)，則匹配八進制轉義值 nml
\un	匹配 n，其中 n 是一個用四個十六進制數字表示的 Unicode 字符。例如， \u00A9 匹配版權符號 (?)

三、正則表達式的常用方法：

//用來測試一個字符串是否能夠被匹配。它返回ture或false兩個值 regexp.test(string);//在指定的字符串中執行搜尋一個匹配，匹配的結果是通過一個數組返回 regexp.exec(string);

四、與正則表達式有關的字符串對象的方法

//替換在正則表達式查找中找到的文本 string.replace(pattern,string);//通過正則表達式查找相應的字符串，只是判斷有無匹配的字符串。 //如果查找成功，search返回匹配串的位置，否則返回-1 string.search(pattern); //match方法執行全局查找，查找結果存放在一個數組里 string.match(pattern);

五、常用的正則表達式的操作符

SymbolFunction

\	轉義符
(), (?:), (?=), []	括號
*, +, ?, {n}, {n,}, {n,m}	限定符
^, $, \anymetacharacter	定位符
\|	或

八、一些常用的正則表達式示例

功能描述正則表達式

匹配所有的正數	^[0-9]+$
匹配所有的小數	^-?[0-9].?[0-9]$
匹配所有的整數	^-?[0-9]+$
提取信息中的中文字符串	[\u4e00-\u9fa5]*
匹配所有的正數	^[0-9]+$
匹配所有的小數	^-?[0-9].?[0-9]$
匹配所有的整數	^-?[0-9]+$
提取信息中的中文字符串	[\u4e00-\u9fa5]* ;
提取信息中的郵件地址	\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*
提取信息中的中國手機號碼	(86)013\d{9}
提取信息中的中國固定電話號碼	((\d{3,4})
提取信息中的中國郵政編碼	[1-9]{1}(\d+){5}
提取信息中的中國身份證號碼	\d{18}
提取信息中的任何數字	(-?\d*)(.\d+)?
匹配HTML標記的正則表達式	/<(.)>.<\/\1>

正則表達式用于字符串處理、表單驗證等場合，實用高效。現將一些常用的表達式收集于此，以備不時之需。匹配中文字符的正則表達式： [\u4e00-\u9fa5] 評注：匹配中文還真是個頭疼的事，有了這個表達式就好辦了匹配雙字節字符(包括漢字在內)：[^\x00-\xff] 評注：可以用來計算字符串的長度（一個雙字節字符長度計2，ASCII字符計1）匹配空白行的正則表達式：\n\s*\r 評注：可以用來刪除空白行匹配HTML標記的正則表達式：<(\S*?) [^>]*>.*?</\1>|<.*? /> 評注：網上流傳的版本太糟糕，上面這個也僅僅能匹配部分，對于復雜的嵌套標記依舊無能為力匹配首尾空白字符的正則表達式：^\s*|\s*$ 評注：可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等)，非常有用的表達式匹配Email地址的正則表達式：\w+([-+.]\w+)*@\w+([-.] \w+)*\.\w+([-.]\w+)* 評注：表單驗證時很實用匹配網址URL的正則表達式：[a-zA- z]+://[^\s]* 評注：網上流傳的版本功能很有限，上面這個基本可以滿足需求匹配帳號是否合法(字母開頭，允許5-16 字節，允許字母數字下劃線)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 評注：表單驗證時很實用匹配國內電話號碼：\d{3}-\d{8}|\d{4}-\d{7} 評注：匹配形式如 0511-4405222 或 021-87888822匹配騰訊QQ號：[1-9][0-9]{4,} 評注：騰訊QQ號從10000開始匹配中國郵政編碼：[1-9]\d{5}(?! \d) 評注：中國郵政編碼為6位數字匹配身份證：\d{15}|\d{18} 評注：中國的身份證為15位或18位匹配ip地址：\d+\.\d+\.\d+\.\d+ 評注：提取ip地址時有用匹配特定數字： ^[1-9]\d*$　　 //匹配正整數 ^-[1-9]\d*$ 　 //匹配負整數 ^-?[1-9]\d*$　　 //匹配整數 ^[1-9]\d*|0$ 　 //匹配非負整數（正整數 + 0） ^-[1-9]\d*|0$　　 //匹配非正整數（負整數 + 0） ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 　　 //匹配正浮點數 ^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$　 //匹配負浮點數 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ 　 //匹配浮點數 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$　　 //匹配非負浮點數（正浮點數 + 0） ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$　　//匹配非正浮點數（負浮點數 + 0）評注：處理大量數據時有用，具體應用時注意修正匹配特定字符串： ^[A-Za-z]+$　　//匹配由26 個英文字母組成的字符串 ^[A-Z]+$　　//匹配由26個英文字母的大寫組成的字符串 ^[a-z]+$　　//匹配由26個英文字母的小寫組成的字符串 ^[A-Za-z0-9]+$　　//匹配由數字和26個英文字母組成的字符串 ^\w+$　　//匹配由數字、26個英文字母或者下劃線組成的字符串評注：最基本也是最常用的一些表達式加了時間驗證的 ^((((1[6-9]|[2-9]\d)\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\d|3[01]))|(((1[6-9]|[2-9]\d)\d{2})-(0?[13456789]|1[012])-(0?[1-9]|[12]\d|30))|(((1[6-9]|[2-9]\d)\d{2})-0?2-(0?[1-9]|1\d|2[0-8]))|(((1[6-9]|[2-9]\d)(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00))-0?2-29-)) (20|21|22|23|[0-1]?\d):[0-5]?\d:[0-5]?\d$

總結

以上是生活随笔為你收集整理的Javascript与正则表达式的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： JavaWeb：CSS层叠样式表
下一篇：二进制运算误差问题