字符串操作和正則表達式
字符串格式化;
用字符串函數連接和分隔字符串;
字符串比較;
使用字符串函數匹配和替換子字符串;
使用正則表達式;
字符串格式化
1,去空格:trim(),ltrim(),rtrim()
trim()函數去掉頭尾兩邊的空格。
ltrim()函數去掉開始的空格。
rtrim()函數去掉結尾的空格。
2,格式化字符串:printf(),sprintf()
printf()函數和sprintf()函數,和echo的功能相同,都會打印字符串。但是它們可以實現更復雜的格式(象C#中string.Format()類似)。
printf()和sprintf()原型如下:
1 string sprintf(string format[,mixed args..]);
2 void printf(string format[,mixed args...]);
sprintf()返回格式化後的字符串。而printf直接將結果輸出。它們兩個的功能類似,所以就已printf()為例。
1 $boy = "boy";
2 echo "i am a $boy";
3 echo '<br />';
4 printf("i am a %s",$boy);
上面輸出的結果一樣。
其中format中的類型可以有以下幾種:
format中的所有轉換類型都以%開始。如果想打印一個“%”符號,必須使用兩個“%%”
3,改變字符串中的字符大小寫
a).將字符轉換為大寫:strtoupper()
1 $str = "i am a boy";
2 echo strtoupper($str);
b).將字符轉換為小寫 :strtolower()
1 $str = "I Am A Boy";
2 echo strtolower($str);
c).如果第一個字符是字母,就轉換成大寫:ucfirst()
1 $str = "i am a boy";
2 echo ucfirst($str);
d).將字符串中每個單詞的第一個字母轉成大寫:ucwords()
1 $str = "i am a boy";
2 echo ucwords($str);
4,轉義字符串
addslashes()函數就是把“轉換成”,或者把轉成雙斜槓\等等之類的操作。
1 $str = '"i am a [] boy."';
2 echo addslashes($str);
輸出:"i am a [\] boy."
addslashes()函數相反的函數就是strips教程lashes()。
用字符串函數連接和分隔字符串
1,分隔字符串:explode()
它的原型如下:
1 array explode(string separator,string input[,int limit]);
可以看出返回數組。使用如下:
1 $str = "1,2,3,4,5";
2 $arr = explode(',',$str);
3 foreach($arr as $v){
4 echo $v.'<br />';
5 }
返回1 2 3 4 5
既然有分隔就會有整合。不錯,implode()和join()函數實現就是和explode()相反的操作。
1 $str = "1,2,3,4,5";
2 $arr = explode(',',$str);
3 echo implode(',',$arr);
2,截取字符串:substr()
substr()函數的原型如下:
1 string substr(string input,int start[,int length]);
第二個參數表示截取的開始位置。
第三個參數表示截取的長度。
使用如下:
1 $str = "i am a boy";
2 echo substr($str,2);
輸出:am a boy
需要注意的是,第二個參數和第三個參數可以為負,如果為負,就意味著從後邊開始。
view sourceprint?function reverse_i($str){
for($i=1;$i<=strlen($str);$i++){
echo substr($str,-$i,1);
}
return;
}
reverse_i('word');
返回:drow;
字符串比較
1,字符串排序:strcmp(),strcasecmp(),strnatcmp()
strcmp()的原型如下:
1 int strcmp(string str1,string str2);
如果兩個字符串相等,返回0;如果按字典順序str1在str2後面就返回一個正數,反之。這個函數是區分大小寫的。
1 $str1 = "2";
2 $str2 = "12";
3 echo strcmp($str1,$str2);
返回1,說明它是按字典順序排列的,$str1的第一個字符大於$str2的第一個字符。
strcasecmp()函數除了不區分大小寫之外,其他和strcmp()函數一樣。
而strnatcmp()則是按照人們習慣的順序進行排序。它也不區分大小寫。
1 $str1 = "2";
2 $str2 = "12";
3 echo strnatcmp($str1,$str2);
返回-1,說明12比2大。
2,獲得字符串的長度:strlen()
strlen(“hello”),輸出結果為5。
使用字符串函數匹配和替換子字符串
1,在字符串中查找字符串:strstr(),strchr(),strrchr()和strissr()
這些函數看起來張得差不多,真是難記啊!~~
最常用的是strstr()函數,strchr()函數和strstr()函數時一樣的,雖然感覺strchr()是查找一個字符的意思。
strstr()函數的原型如下:
1 string strstr(string haystack,string needle);
1 第一個參數為整個字符串。
第二個參數為需要查找的子字符串。
如果找到一個匹配,函數會從needle前面返回haystack,否則返回false。如果存在不止一個needle,返回的字符串從出現第一個needle的位置開始。
a).一個精確匹配
1 $str1 = "To all, I am very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.";
2 echo strstr($str1,'very');
輸出:very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.
b).多個匹配
1 $str1 = "To all, I am very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward";
2 echo strstr($str1,'been');
輸出:been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.
函數strstr()有兩個變體。第一個是stristr()函數,它幾乎和strstr()函數一樣,但區別就是不區分大小寫。
第二個是strrchr()函數,它幾乎和strstr()一樣,但會從最後出現needle的位置的前面返回字符串haystack。
此函數第二個參數為字符。
1 $str1 = "To all, I am very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.";
2 echo strrchr($str1,'w');
輸出:ward.
2,查找字符串的位置:strpos(),strrpos()
strpos()函數和strstr()函數的操作類似。但它不是返回一個字符串,而是返回子字符串在整個字符串中的位置。我們平常使用的也是這個。而且比strstr()速度也快。
strpos()函數原型如下:
1 int strpos(string haystack,string needle,int offset);
第三個參數是可選的,標示開始搜索的位置。
1 $str1 = "hello word";
2 echo strpos($str1,'o');
輸出:4,位置是從0開始起。也可以用子字符串,這裡只是出於演示目的。
1 $str1 = "hello word";
2 echo strpos($str1,'o',5);
輸出:7。是從位置5開始搜索,也就看不到位置4的那個“o”了。
函數strrpos()也幾乎一樣,但返回的是子字符串在整個字符串中最後一次出現的位置。
1 $str1 = "hello word";
2 echo strrpos($str1,'o');
輸出:7。說明“o”在hello word中最後一個位置的7。
這裡需要注意一下,PHP中的false等於0,如果strpos()或者strrpos()都返回false(沒有找到)或者在第一個字符就找到了(第一個字符的起始位置是0),
那麼就區分不出來是找到,還是未找到了。那怎麼辦呢?只能用“===”恆等式來避免這個問題了。
1 $str1 = "hello word";
2 $position = strrpos($str1,'h'); //第一個字符就找到了,$position ==0
3 if($position === false){
4 echo '沒有找到';
5 }else{
6 echo $position;
7 }
3,替換子字符串:str_replace(),substr_replace()
str_replace()函數的原型如下:
1 mixed str_replace(mixed needle,mixed new_needle,mixed haystack[,int &count]);
第三個參數是可選的。它包含了要執行的替換操作次數。
返回替換過的字符串。
1 $str1 = "hello word";
2 echo str_replace('word','china',$str1);
輸出:hello china
函數substr_replace()則用來在給定位置中查找和替換字符串中特定的子字符串。原型如下:
1 string substr_replace(string string,string replacement,int start[,int length]);
這個函數使用字符串replacement替換整個字符串string中的一部分。具體是那一部分則取決於起始位置和可選參數length的值。
需要注意的是,start的值如果是0或者一個正值,就是從字符串開始計算偏移量;如果是一個負值,就從字符串末尾開始的一個偏移量。
使用正則表達式
1,查找子字符串:ereg(),eregi()
ereg()函數的原型如下:
1 int ereg(string pattern,string search,array [matches]);
在search字符串中查找正則為pattern的表達式,如果發現了與pattern的字表達式相匹配的字符串,這些字符串將會存儲在數組matches中,每個數組元素對應一個子表達式。
函數eregi()函數除了不區分大小寫外,其功能與ereg()一樣。
1 $str1 = "[email protected]";
2 if(!eregi('[A-Z0-9._%+-]+@[A-Z0-9.-]+.[A-Z]{2,4}',$str1)){
3 echo '不是正確的Email';
4 }else{
5 echo '正確';
6 }
2,替換子字符串:ereg_replace(),eregi_replace()
於str_replace()函數一樣,只不過這兩個使用正則表達式當做參數。
ereg_replace()的原型如下:
1 string ereg_replace(string pattern,string replacement,string search);
1 $str1 = "[email protected]";
2 echo ereg_replace('[A-Z0-9._%+-]+@','**@',$str1);
輸出:**@gmail.com.cn
函數eregi_replace除了不區分大小寫外,其他與ereg_replace()相同。
3,分隔字符串:split()
函數split()的原型如下:
1 array split(string pattern,string search[,int max]);
第三個參數為可選,表示進入數組中的元素個數。
返回值是數組。
1 $str1 = "[email protected]";
2 $arr = split('.|@',$str1);
3 while(list($key,$value) = each($arr)){
4 echo '<br />'.$key.'--'.$value;
5 }
輸出:
0--123123
1--gmail
2--com
3--cn
split()函數和explode()函數有點相似,前者是用正則表達式當做分隔符,後者是用字符串當做分隔符。