萬盛學電腦網

 萬盛學電腦網 >> 網絡編程 >> php編程 >> php中正則匹配中文漢字

php中正則匹配中文漢字

在php中如果你想正則來獲取字符串中漢字我們先需要知道頁面編碼,正則匹配中文漢字根據頁面編碼不同而略有區別:GBK/GB2312編碼:[x80-xff>]+ 或 [xa1-xff]+ 而UTF-8編碼:[x{4e00}-x{9fa5}]+/u 。

 代碼如下 復制代碼

echo (mb_eregi("[x80-xff].","中d文") ? "有" : "無") ."漢字";
echo (mb_eregi("^([x80-xff].)+$","中文") ? "全是漢字" : ""); 看一判斷全中文字符串函數

以下以PHP為例進行匹配:

 代碼如下 復制代碼

<?php
   $str = "學習php是一件快樂的事。";
   preg_match_all("/[x80-xff]+/", $str, $match);
   //UTF-8 使用:
   //preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match);
   print_r($match);
?>

輸出:

Array
(
    [0] => Array
        (
            [0] => 學習
            [1] => 是一件快樂的事。
        )

)

正則漢字

 代碼如下 復制代碼

$str = "請問php中的eregi如何匹配漢字";
if (preg_match("/^[".chr(0x80)."-".chr(0xff)."]+$/",$str)) {
   echo "這是一個純中文字符串";
} else{
   echo "這不是一個純中文字串";
}
preg_match_all($pat,……)與preg_replace($pat,……)……


preg_match_all("/(漢字)+/ism","我是漢字,看你把我怎麼著!",$m_a);
了各個編碼的高位與低位的開始與結束,那麼自然就可以寫出正則,而且直接是十六位的,有啥困難?呵呵。不過要注意,在php裡面,表示十六位是用的x


我們還可以用該正則表達式來判斷是否是gb2312的漢字

 代碼如下 復制代碼

<?php
$str = "小小子";
if(preg_match("/^[xb0-xf7][xa0-xfe]+$/",$str)){
print($str."確實全是漢字");
} else {
print($str."這個真tc不全是漢字");
}
?>

copyright © 萬盛學電腦網 all rights reserved