萬盛學電腦網

 萬盛學電腦網 >> 網絡編程 >> php編程 >> PHP編碼轉換函數mb

PHP編碼轉換函數mb

   將一個短信接口代碼從apache遷移到nginx+php-fpm後,發現無法發出短信了,查看php日志,

  [25-Sep-2014 20:15:21] WARNING: [pool www] child 9617 said into stderr: “NOTICE: PHP message: PHP Fatal error: Call to undefined function mb_convert_encoding() in /data/htdocs/xx.php on line 13″

  發現函數mb_convert_encoding沒定義,看著像某個模塊沒裝,google了把,要裝個mbstring擴展,之前都是一下裝好多擴展(雖然不知道這個擴展是干啥的,按照網絡文檔來),現在是要應用需要哪個裝哪個,逼格略有提高(至少這樣能讓我知道哪個模塊是干啥的)。

  mb-convert-encoding

  string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding = mb_internal_encoding() ] )

  將 string 類型 str 的字符編碼從可選的 from_encoding 轉換到 to_encoding。

  官網文檔 http://php.net/manual/zh/function.mb-convert-encoding.php 需要安裝mbstring擴展庫,如果已經編譯好的php可以這樣熱編譯下

 代碼如下  


cd /tmp/php-5.3.28/ext/mbstring/
usr/local/services/php/bin/phpize
./configure --with-php-config=/usr/local/services/php/bin/php-config
make && make install
vim /usr/local/services/php/etc/php.ini
extension="/usr/local/services/php/lib/php/extensions/no-debug-non-zts-20090626/mbstring.so";
 iconv
string iconv ( string in_charset, string out_charset, string str )

  iconv函數庫能夠完成各種字符集間的轉換

  注意:第二個參數,除了可以指定要轉化到的編碼以外,還可以增加兩個後綴://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 會自動將不能直接轉化的字符變成一個或多個近似的字符,//IGNORE 會忽略掉不能轉化的字符,而默認效果是從第一個非法字符截斷。

  Returns the converted string or FALSE on failu

  官網地址 http://php.net/manual/zh/book.iconv.php

  已經安裝好php的,同樣也可以使用上面的方法安裝iconv模塊

  mb_convert_encoding例子

  mb_convert_encoding這個函數是用來轉換編碼的。英文一般不會存在編碼問題,只有中文數據才會有這個問題。比如你用Zend Studio或Editplus寫程序時,用的是gbk編碼,如果數據需要入數據庫,而數據庫的編碼為utf8時,這時就要把數據進行編碼轉換,不然進到數據庫就會變成亂碼

  做一個GBK To UTF-8

 代碼如下   <?php
header(“content-Type: text/html; charset=Utf-8″);
echo mb_convert_encoding(“???S我的友仔”, “UTF-8″, “GBK”);
?>

  再來個GB2312 To Big5

 代碼如下  

<?php
header(“content-Type: text/html; charset=big5″);
echo mb_convert_encoding(“你是我的朋友”, “big5″, “GB2312″);
?>

  mb_strtolower() – 使字符串小寫

  mb_strtoupper() – 使字符串大寫

  strtolower() – 將字符串轉化為小寫

  strtoupper() – 將字符串轉化為大寫

  ucfirst() – 將字符串的首字母轉換為大寫

  ucwords() – 將字符串中每個單詞的首字母轉換為大寫

  iconv例子

  把gb2312置換成utf-8:

 代碼如下  

$text=iconv("GB2312","UTF-8",$text);

  在用$text=iconv(“UTF-8″,”GB2312″,$text)過程中,如果遇到一些特別字符時,如:”—”,英文名中的”.”等等字符,轉換就斷掉了。這些字符後的文字都沒法繼續轉換了。

  針對這的問題,可以用如下代碼實現:

 代碼如下  

$text=iconv("UTF-8","GBK",$text);

  你沒有看錯,就這麼簡單,不使用gb2312,而寫成GBK,就可以了。

  還有一種方法,第二個參數,加上//IGNORE,忽略錯誤,如下:

 代碼如下  

iconv("UTF-8","GB2312//IGNORE",$data);

  一般情況下用 iconv,只有當遇到無法確定原編碼是何種編碼,或者iconv轉化後無法正常顯示時才用mb_convert_encoding 函數。

 代碼如下  


$content = iconv("GBK", "UTF-8″, $content);
$content = mb_convert_encoding($content, "UTF-8″, "GBK");

copyright © 萬盛學電腦網 all rights reserved