萬盛學電腦網

 萬盛學電腦網 >> 網絡編程 >> php編程 >> PHP中正則表達式模式修飾符詳解

PHP中正則表達式模式修飾符詳解

修飾符是php中正則表達式的一個重要的參考,下面我來給大家轉一篇關於PHP中正則表達式模式修飾符詳解,有需要了解的朋友可進入參考參考。

PHP模式修飾符又叫模式修正符,是在正則表達式的定界符之外使用。主要用來調整正則表達式的解釋,提擴展了正則表達式在匹配、替換等操作的某些功能,增強了正則的能力。但是有很多地方的解釋都是錯誤的,也容易誤導別人,所以今天我把這個文檔整理出來,供大家參考。

模式修正符號 功能描述

i 在和正則匹配是不區分大小寫
m 將字符串視為多行。默認的正則開始“^”和結束“$”將目標字條串作為一單一的一“行”字符(甚至其中包括換行符也是如此)。如果在修飾符中加上“m”,那麼開始和結束將會指點字符串的每一行的開頭就是“^”結束就是“$”。
s 如果設定了這個修正符,那麼,被匹配的字符串將視為一行來看,包括換行符,換行符將被視為普通字符串。
x 忽略空白,除非進行轉義的不被忽略。
e 只用在preg_replace()函數中,在替換字符串中逆向引用做正常的替換,將其作為PHP代碼求值,並用其結果來替換所搜索的字符串。
A 如果使用這個修飾符,那麼表達式必須是匹配的字符串中的開頭部分。比如說”/a/A”匹配”abcd”。
D 模式中的$字符權匹配目標字符的結尾。沒有此選項時,如果最後一個字符是換行符的話,美元符號也會匹配此字符之前。如果設定了修正符m則忽略此項。
E 與”m”相反,如果使用這個修飾符,那麼”$”將匹配絕對字符串的結尾,而不是換行符前面,默認就打開了這個模式。
U 貪婪模式,和問號的作用差不多,最大限度的匹配就是貪婪模式。

貪婪模式:

比如我們要匹配以字母“a”開頭字母“b”結尾的字符串,但是需要匹配的字符串在“a”後面含有很多個“b”,比如“a bbbbbbbbbbbbbbbbb”,那正則表達式是會匹配第一個“b”還是最後一個“b”呢?如果你使用了貪婪模式,那麼會匹配到最後一個“b”,反之只是匹配到第一個“b”。

PHP正則表達式貪婪模式使用實例:

1./a.+?b/  
2./a.+b/U
對比不使用貪婪模式的實例如下:

1./a.+b/ 
上面使用了一個修飾符U,詳見關於修飾符的介紹。

其他資料:

模式修正符: 解說正則表達式模式中使用的修正符

說明:下面列出了當前在 PCRE 中可能使用的修正符。括號中是這些修正符的內部 PCRE 名。修正符中的空格和換行被忽略,其它字符會導致錯誤。

i (PCRE_CASELESS)

如果設定此修正符,模式中的字符將同時匹配大小寫字母。

m(PCRE_MULTILINE)

默認情況下,PCRE 將目標字符串作為單一的一“行”字符所組成的(甚至其中包含有換行符也是如此)。“行起始”元字符(^)僅僅匹配字符串的起始,“行結束”元字符($)僅 僅匹配字符串的結束,或者最後一個字符是換行符時其前面(除非設定了 D 修正符)。這和 Perl 是一樣的。
當設定了此修正符,“行起始”和“行結束”除了匹配整個字符串開頭和結束外,還分別匹配其中的換行符的之後和之前。這和 Perl 的 /m 修正符是等效的。如果目標字符串中沒有“n”字符或者模式中沒有 ^ 或 $,則設定此修正符沒有任何效果。

s(PCRE_DOTALL)

如果設定了此修正符,模式中的圓點元字符(.)匹配所有的字符,包括換行符。沒有此設定的話,則不包括換行符。這和 Perl 的 /s 修正符是等效的。排除字符類例如 [^a] 總是匹配換行符的,無論是否設定了此修正符。

x(PCRE_EXTENDED)

如果設定了此修正符,模式中的空白字符除了被轉義的或在字符類中的以外完全被忽略,在未轉義的字符類之外的 # 以及下一個換行符之間的所有字符,包括兩頭,也都被忽略。這和 Perl 的 /x 修正符是等效的,使得可以在復雜的模式中加入注釋。然而注意,這僅適用於數據字符。空白字符可能永遠不會出現於模式中的特殊字符序列,例如引入條件子模式 的序列 (?( 中間。

e

如果設定了此修正符,preg_replace() 在替換字符串中對逆向引用作正常的替換,將其作為 PHP 代碼求值,並用其結果來替換所搜索的字符串。
只有 preg_replace() 使用此修正符,其它 PCRE 函數將忽略之。
注: 本修正符在 PHP3 中不可用。

A(PCRE_ANCHORED)

如果設定了此修正符,模式被強制為“anchored”,即強制僅從目標字符串的開頭開始匹配。此效果也可以通過適當的模式本身來實現(在 Perl 中實現的唯一方法)。

D(PCRE_DOLLAR_ENDONLY)

如果設定了此修正符,模式中的美元元字符僅匹配目標字符串的結尾。沒有此選項時,如果最後一個字符是換行符的話,美元符號也會匹配此字符之前(但不會匹配任何其它換行符之前)。如果設定了 m 修正符則忽略此選項。Perl 中沒有與其等價的修正符。

S

當一個模式將被使用若干次時,為加速匹配起見值得先對其進行分析。如果設定了此修正符則會進行額外的分析。目前,分析一個模式僅對沒有單一固定起始字符的 non-anchored 模式有用。

U(PCRE_UNGREEDY)

本修正符反轉了匹配數量的值使其不是默認的重復,而變成在後面跟上“?”才變得重復。這和 Perl 不兼容。也可以通過在模式之中設定 (?U) 修正符或者在數量符之後跟一個問號(如 .*?)來啟用此選項。

X(PCRE_EXTRA)

此修正符啟用了一個 PCRE 中與 Perl 不兼容的額外功能。模式中的任何反斜線後面跟上一個沒有特殊意義的字母導致一個錯誤,從而保留此組合以備將來擴充。默認情況下,和 Perl 一樣,一個反斜線後面跟一個沒有特殊意義的字母被當成該字母本身。當前沒有其它特性受此修正符控制。

u(PCRE_UTF8)

此修正符啟用了一個 PCRE 中與 Perl 不兼容的額外功能。模式字符串被當成 UTF-8。本修正符在 Unix 下自 PHP 4.1.0 起可用,在 win32 下自 PHP 4.2.3 起可用。自 PHP 4.3.5 起開始檢查模式的 UTF-8 合法性。


PHP正則表達式的基本語法:

一個正則表達式,分為三個部分:分隔符,表達式和修飾符。

分隔符可以是除了特殊字符以外的任何字符(比如"/ !"等等),常用的分隔符是"/"。表達式由一些特殊字符(特殊字符詳見下面)和非特殊的字符串組成,比如"[a-z0-9_-]+@[a-z0-9_-.]+"可以匹配一個簡單的電子郵件字符串。修飾符是用來開啟或者關閉某種功能/模式。下面就是一個完整的正則表達式的例子:

/hello.+?hello/is  上面的正則表達式"/"就是分隔符,兩個"/"之間的就是表達式,第二個"/"後面的字符串"is"就是修飾符。

在表達式中如果含有分隔符,那麼就需要使用轉義符號"",比如"/hello.+?/hello/is"。轉義符號除了用於分隔符外還可以執行特殊字符,全部由字母構成的特殊字符都需要""來轉義,比如"d"代表全體數字。

copyright © 萬盛學電腦網 all rights reserved