1、“.”為通配符,表示任何一個字符,例如:“a.c”可以匹配“anc”、“abc”、“acc”;
2、“[]”,在[]內可以指定要求匹配的字符,例如:“a[nbc]c”可以匹配“anc”、“abc”、“acc”
;但不可以匹配“ancc”,a到z可以寫成[a-z],0到9可以寫成[0-9];
3、數量限定符號,表示匹配次數(或者叫做長度)的符號:
包括:“*”——0次或者多次
“+”——1次或者多次
“?”——0次或者1次
“{n}”——匹配n次,n為整數
“{n,m}”——匹配從n到m之間的某個數的次數;n和m都是整數;
“{n,}”——匹配n到無窮次之間任意次數;
“{,m}”——匹配0到m之間任意次數;
他們放到匹配格式的後面:
例如:
電話號碼:024-84820482,02484820482(假設前面3或者4位,後面7或者8位,並且中間的減號可有可無)
都是符合規定的,那麼可以用如下格式來匹配:[0-9]{3,4} -? [0-9]{7,8};
注意:“”為轉義字符,因為“-”在正則表達式用有代表一個范圍的意義,例如:前面所說的[0-9],
所以它需要轉義字符“”進行轉義才可使用;
4、“^”為否符號,表示不想匹配的符號,例如:[^z][a-z]+可以匹配所有除“z”開頭的以外的所有字
符串(長度大於2,因為“+”表示大於等於1的次數,從第二位開始都是小寫英文字符);
如果^放到[]的外邊則表示以[]開頭的字符串;^[az][a-z]+表示a或者z開頭的長度大於等於2的英文字符
串;
5、“|”或運算符,例如:a[n|bc|cb]c可以匹配“abcc”,“anc”,“acbc”;
6、“$”以它前面的字符結尾的;例如:ab+$就可以被“abb”,“ab”匹配;
7、一些簡單表示方法:
d表示[0-9];D表示[^0-9];w表示[A-Z0-9];W表示[^A-Z0-9];s表示[tnrf],就是空格字符包括tab
,空格等等;S表示[^tnrf],就是非空格字符;
8、常用的匹配:
匹配中文字符: “[u4e00-u9fa5]”;
匹配雙字節字符(包括漢字在內):“[^x00-xff]”;
匹配空行的正則表達式:“n[s| ]*r”;
匹配HTML標記的正則表達式:“/.*|/”;
匹配首尾空格的正則表達式:“(^s*)|(s*$)”;
匹配非負整數(正整數 + 0):“^d+$”;
匹配正整數:“^[0-9]*[1-9][0-9]*$”;
匹配非正整數(負整數 + 0):“^((-d+)|(0+))$”;
匹配負整數:“^-[0-9]*[1-9][0-9]*$”;
匹配整數:“^-?d+$”;
匹配非負浮點數(正浮點數 + 0):“^d+(.d+)?$”
匹配正浮點數:“^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*
))$”;
^((-d+(.d+)?)|(0+(.0+)?))$ //匹配非正浮點數(負浮點數 + 0)
^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$ //匹配
負浮點數
匹配浮點數:“^(-?d+)(.d+)?$”;
匹配由數字、26個英文字母或者下劃線組成的字符串:“^w+$”;
匹配email地址:“^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$”;
匹配url:“^[a-zA-z]+://匹配(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$”
1、“.”為通配符,表示任何一個字符,例如:“a.c”可以匹配“anc”、“abc”、“acc”;
2、“[]”,在[]內可以指定要求匹配的字符,例如:“a[nbc]c”可以匹配“anc”、“abc”、“acc”
;但不可以匹配“ancc”,a到z可以寫成[a-z],0到9可以寫成[0-9];