正規表示式速查表
字元 | 描述 |
---|---|
\ |
將下一個字元標記為一個特殊字元、或一個原義字元、或一個向後引用、或一個八進制轉義符。例如,“
n
」匹配字元「
n
」。「
\n
」匹配一個換行符。序列「
\\
」匹配「
\
」而「
\(
」則匹配「
(
」。 |
^ |
匹配輸入字串的開始位置。如果設定了RegExp對象的Multiline屬性,^也匹配“
\n
」或「
\r
」之後的位置。 |
$ |
匹配輸入字串的結束位置。如果設定了RegExp對象的Multiline屬性,$也匹配“
\n
」或「
\r
」之前的位置。 |
* |
匹配前面的子表達式零次或多次。例如,zo*能匹配“
z
」以及「
zoo
」。*等價于{0,}。 |
+ |
匹配前面的子表達式一次或多次。例如,“
zo+
」能匹配「
zo
」以及「
zoo
」,但不能匹配「
z
」。+等價于{1,}。 |
? |
匹配前面的子表達式零次或一次。例如,“
do(es)?
」可以匹配「
does
」或「
does
」中的「
do
」。?等價于{0,1}。 |
{ n } |
n
是一個非負整數。匹配確定的
n
次。例如,“
o{2}
」不能匹配「
Bob
」中的「
o
」,但是能匹配「
food
」中的兩個o。 |
{ n ,} |
n
是一個非負整數。至少匹配
n
次。例如,“
o{2,}
」不能匹配「
Bob
」中的「
o
」,但能匹配「
foooood
」中的所有o。「
o{1,}
」等價于「
o+
」。「
o{0,}
」則等價于「
o*
」。 |
{ n , m } |
m
和
n
均為非負整數,其中
n
<=
m
。最少匹配
n
次且最多匹配
m
次。例如,“
o{1,3}
」將匹配「
fooooood
」中的前三個o。「
o{0,1}
」等價于「
o?
」。請注意在逗號和兩個數之間不能有空格。 |
? |
當該字元緊跟在任何一個其他限制符(*,+,?,{
n
},{
n
,},{
n
,
m
})後面時,匹配模式是非貪婪的。非貪婪模式儘可能少的匹配所搜索的字串,而預設的貪婪模式則儘可能多的匹配所搜索的字串。例如,對於字串“
oooo
」,「
o+?
」將匹配單個「
o
」,而「
o+
」將匹配所有「
o
」。 |
. |
匹配除“
\
n
」之外的任何單個字元。要匹配包括「
\
n
」在內的任何字元,請使用像「
(.|\n)
」的模式。 |
(pattern) |
匹配pattern並獲取這一匹配。所獲取的匹配可以從產生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中則使用$0…$9屬性。要匹配圓括號字元,請使用“
\(
」或「
\)
」。 |
(?:pattern) |
匹配pattern但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行儲存供以後使用。這在使用或字元“
(|)
」來組合一個模式的各個部分是很有用。例如「
industr(?:y|ies)
」就是一個比「
industry|industries
」更簡略的表達式。 |
(?=pattern) |
正向肯定預查,在任何匹配pattern的字串開始處匹配查詢字串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。例如,“
Windows(?=95|98|NT|2000)
」能匹配「
Windows2000
」中的「
Windows
」,但不能匹配「
Windows3.1
」中的「
Windows
」。預查不消耗字元,也就是說,在一個匹配發生后,在最後一次匹配之後立即開始下一次匹配的搜索,而不是從包含預查的字元之後開始。 |
(?!pattern) |
正向否定預查,在任何不匹配pattern的字串開始處匹配查詢字串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。例如“
Windows(?!95|98|NT|2000)
」能匹配「
Windows3.1
」中的「
Windows
」,但不能匹配「
Windows2000
」中的「
Windows
」。預查不消耗字元,也就是說,在一個匹配發生后,在最後一次匹配之後立即開始下一次匹配的搜索,而不是從包含預查的字元之後開始 |
(?<=pattern) |
反向肯定預查,與正向肯定預查類擬,只是方向相反。例如,“
(?<=95|98|NT|2000)Windows
」能匹配「
2000Windows
」中的「
Windows
」,但不能匹配「
3.1Windows
」中的「
Windows
」。 |
(?<!pattern) |
反向否定預查,與正向否定預查類擬,只是方向相反。例如“
(?<!95|98|NT|2000)Windows
」能匹配「
3.1Windows
」中的「
Windows
」,但不能匹配「
2000Windows
」中的「
Windows
」。 |
x|y |
匹配x或y。例如,“
z|food
」能匹配「
z
」或「
food
」。「
(z|f)ood
」則匹配「
zood
」或「
food
」。 |
[xyz] |
字符集合。匹配所包含的任意一個字元。例如,“
[abc]
」可以匹配「
plain
」中的「
a
」。 |
[^xyz] |
負值字符集合。匹配未包含的任意字元。例如,“
[^abc]
」可以匹配「
plain
」中的「
p
」。 |
[a-z] |
字元範圍。匹配指定範圍內的任意字元。例如,“
[a-z]
」可以匹配「
a
」到「
z
」範圍內的任意小寫字母字元。 |
[^a-z] |
負值字元範圍。匹配任何不在指定範圍內的任意字元。例如,“
[^a-z]
」可以匹配任何不在「
a
」到「
z
」範圍內的任意字元。 |
\b |
匹配一個單詞邊界,也就是指單詞和空格間的位置。例如,“
er\b
」可以匹配「
never
」中的「
er
」,但不能匹配「
verb
」中的「
er
」。 |
\B |
匹配非單詞邊界。“
er\B
」能匹配「
verb
」中的「
er
」,但不能匹配「
never
」中的「
er
」。 |
\cx |
匹配由x指明的控制字元。例如,\cM匹配一個Control-M或回車符。x的值必須為A-Z或a-z之一。否則,將c視為一個原義的“
c
」字元。 |
\d | 匹配一個數字字元。等價于[0-9]。 |
\D | 匹配一個非數字字元。等價于[^0-9]。 |
\f | 匹配一個換頁符。等價于\x0c和\cL。 |
\n | 匹配一個換行符。等價于\x0a和\cJ。 |
\r | 匹配一個回車符。等價于\x0d和\cM。 |
\s | 匹配任何空白字元,包括空格、製表符、換頁符等等。等價于[ \f\n\r\t\v]。 |
\S | 匹配任何非空白字元。等價于[^ \f\n\r\t\v]。 |
\t | 匹配一個製表符。等價于\x09和\cI。 |
\v | 匹配一個垂直製表符。等價于\x0b和\cK。 |
\w |
匹配包括下劃線的任何單詞字元。等價于“
[A-Za-z0-9_]
」。 |
\W |
匹配任何非單詞字元。等價于“
[^A-Za-z0-9_]
」。 |
\x n |
匹配
n
,其中
n
為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。例如,“
\x41
」匹配「
A
」。「
\x041
」則等價于「
\x04&1
」。正規表示式中可以使用ASCII編碼。. |
\ num |
匹配
num
,其中
num
是一個正整數。對所獲取的匹配的引用。例如,“
(.)\1
」匹配兩個連續的相同字元。 |
\ n | 標識一個八進制轉義值或一個向後引用。如果\ n 之前至少 n 個獲取的子表達式,則 n 為向後引用。否則,如果 n 為八進制數字(0-7),則 n 為一個八進制轉義值。 |
\ nm | 標識一個八進制轉義值或一個向後引用。如果\ nm 之前至少有 nm 個獲得子表達式,則 nm 為向後引用。如果\ nm 之前至少有 n 個獲取,則 n 為一個後跟文字 m 的向後引用。如果前面的條件都不滿足,若 n 和 m 均為八進制數字(0-7),則\ nm 將匹配八進制轉義值 nm 。 |
\ nml | 如果 n 為八進制數字(0-3),且 m和l 均為八進制數字(0-7),則匹配八進制轉義值 nm l。 |
\u n | 匹配 n ,其中 n 是一個用四個十六進制數字表示的Unicode字元。例如,\u00A9匹配版權符號(©)。 |
常用正規表示式
帳號 | /^[a-z0-9_-]{3,16}$/ |
---|---|
密碼 | /^[a-z0-9_-]{6,18}$/ |
十六進制值 | /^#?([a-f0-9]{6}|[a-f0-9]{3})$/ |
電子電子信箱 |
/^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$/ /^[a-z\d]+(\.[a-z\d]+)*@([\da-z](-[\da-z])?)+(\.{1,2}[a-z]+)+$/ |
URL | /^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$/ |
IP 地址 |
/((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)/ /^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$/ |
HTML 標籤 | /^<([a-z]+)([^<]+)*(?:>(.*)<\/\1>|\s+\/>)$/ |
刪除程式碼\\註釋 | (?<!|\S)//.*$ |
Unicode編碼中的漢字範圍 | /^[\u2E80-\u9FFF]+$/ |