萬盛學電腦網 >> 網絡編程 >> php編程 >> php中正則匹配中文漢字

php中正則匹配中文漢字

在php中如果你想正則來獲取字符串中漢字我們先需要知道頁面編碼，正則匹配中文漢字根據頁面編碼不同而略有區別：GBK/GB2312編碼：[x80-xff>]+ 或 [xa1-xff]+ 而UTF-8編碼：[x{4e00}-x{9fa5}]+/u 。

例

代碼如下復制代碼

echo (mb_eregi("[x80-xff].","中d文") ? "有" : "無") ."漢字";
echo (mb_eregi("^([x80-xff].)+$","中文") ? "全是漢字" : ""); 看一判斷全中文字符串函數

以下以PHP為例進行匹配：

代碼如下復制代碼

<?php
   $str = "學習php是一件快樂的事。";
   preg_match_all("/[x80-xff]+/", $str, $match);
   //UTF-8 使用：
   //preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match);
   print_r($match);
?>

輸出：

Array
(
    [0] => Array
        (
            [0] => 學習
            [1] => 是一件快樂的事。
        )

)

正則漢字

代碼如下復制代碼

$str = "請問php中的eregi如何匹配漢字";
if (preg_match("/^[".chr(0x80)."-".chr(0xff)."]+$/",$str)) {
echo "這是一個純中文字符串";
} else{
echo "這不是一個純中文字串";
}
preg_match_all($pat,……)與preg_replace($pat,……)……

preg_match_all("/(漢字)+/ism","我是漢字，看你把我怎麼著！",$m_a);
了各個編碼的高位與低位的開始與結束，那麼自然就可以寫出正則，而且直接是十六位的，有啥困難？呵呵。不過要注意，在php裡面，表示十六位是用的x

我們還可以用該正則表達式來判斷是否是gb2312的漢字

代碼如下復制代碼

<?php
$str = "小小子";
if(preg_match("/^[xb0-xf7][xa0-xfe]+$/",$str)){
print($str."確實全是漢字");
} else {
print($str."這個真tc不全是漢字");
}
?>

上一頁:php中global static和$GLOBALS使用與區別
下一頁:php 讀取文件的各種時間

萬盛學電腦網

萬盛學電腦網 >> 網絡編程 >> php編程 >> php中正則匹配中文漢字

php中正則匹配中文漢字

php編程排行

程序編程推薦

熱門文章

相關文章

圖片文章

最大限度的分離table的樣式與結構

vs2012編譯的程序不能在XP和2003下執行問題的解決方法

有哪些方法可以吸引用戶主動參與活動？

播放器關聯Kmplayer讓電驢邊下邊看

萬盛學電腦網 | 設為首頁 | 加入收藏