萬盛學電腦網

 萬盛學電腦網 >> 數據庫 >> mysql教程 >> mysqli_set_charset和SET NAMES優劣分析

mysqli_set_charset和SET NAMES優劣分析

本文章來分析一下關於mysqli_set_charset和SET NAMES吧,有需要學習的朋友可參考參考。

我最常用會用set names來解決php與mysql亂碼問題

程序設置

 代碼如下 復制代碼

mysql_query("SET NAMES UTF8");

my.ini設置

# CLIENT SECTION

[mysql]

default-character-set=utf8

# SERVER SECTION

[mysqld]

default-character-set=utf8


 

這兩個字段來更改數據庫的默認字符集。第一個是客戶端默認的字符集,第二個是服務器端默認的字符集。假設我們把兩個都設為utf8,然後在MySQL Command Line Client裡面輸入“show variebles like“character_set_%”;”,可看到如下字符:

 代碼如下 復制代碼 character_set_client   latin1
character_set_connection    latin1
character_set_database     utf8
character_set_results    latin1
character_set_server   utf8
character_set_system     utf8

其中的utf8隨著我們上面的設置而改動。此時,要是我們通過采用UTF-8的PHP程序從數據庫裡讀取數據,很有可能是一串“?????”或者是其他亂碼。網上查了半天,解決辦法倒是簡單,在連接數據庫之後,讀取數據之前,先執行一項查詢“SET NAMES UTF8”,即在PHP裡為

即可顯示正常(只要數據庫裡信息的字符正常)。為什麼會這樣?這句查詢“SET NAMES UTF8”到底是什麼作用?
到MySQL命令行輸入“SET NAMES UTF8;”,然後執行“show variebles like“character_set_%”;”,發現原來為latin1的那些變量“character_set_client”、“character_set_connection”、“character_set_results”的值全部變為utf8了,原來是這3個變量在搗蛋。查閱手冊,上面那句等於:

 代碼如下 復制代碼


SET character_set_client = utf8;

SET character_set_results = utf8;

SET character_set_connection = utf8;


這裡要聲明一點,“SET NAMES UTF8”作用只是臨時的,MySQL重啟後就恢復默認了。
接下來就說到MySQL在服務器上的配置問題了。豈不是我們每次對數據庫讀寫都得加上“SET NAMESUTF8”,以保證數據傳輸的編碼一致?能不能通過配置MySQL來達到那三個變量默認就為我們要想的字符集?手冊上沒說,我在網上也沒找到答案。所以,從服務器配置的角度而言,是沒辦法省略掉那行代碼的


那mysql_set_character_set又做了什麼呢?

 代碼如下 復制代碼

//mysql-5.1.30-SRC/libmysql/client.c, line 3166:
 int STDCALLmysql_set_character_set(MYSQL*mysql, const char *cs_name)
 {
   structcharset_info_st *cs;
   const char *save_csdir= charsets_dir;
 
   if (mysql->options.charset_dir)
     charsets_dir= mysql->options.charset_dir;
 
   if (strlen(cs_name) < MY_CS_NAME_SIZE &&
      (cs= get_charset_by_csname(cs_name, MY_CS_PRIMARY, MYF(0))))
   {
     char buff[MY_CS_NAME_SIZE + 10];
     charsets_dir= save_csdir;
     /* Skip execution of "SET NAMES" for pre-4.1 servers */
     if (mysql_get_server_version(mysql) < 40100)
       return 0;
     sprintf(buff, "SET NAMES %s", cs_name);
     if (!mysql_real_query(mysql, buff, strlen(buff)))
     {
       mysql->charset= cs;
     }
   }
   //以下省略

我們可以看到, mysqli_set_charset除了做了”SET NAMES”以外, 還多做了一步:

 代碼如下 復制代碼

 sprintf(buff, "SET NAMES %s", cs_name);
 if (!mysql_real_query(mysql, buff, strlen(buff)))
 {
   mysql->charset= cs;
 }


而對於mysql這個核心結構的成員charset又有什麼作用呢?

這就要說說mysql_real_escape_string()了, 這個函數和mysql_escape_string的區別就是, 它會考慮”當前”字符集. 那麼這個當前字符集從哪裡來呢?

對了, 你猜的沒錯, 就是mysql->charset.

mysql_real_string在判斷寬字符集的字符的時候, 就根據這個成員變量來分別采用不同的策略, 比如如果是utf-8, 那麼就會采用libmysql/ctype-utf8.c.

 代碼如下 復制代碼


<?php
     $db = mysql_connect('localhost:3737', 'root' ,'123456');
     mysql_select_db("test");
     $a = "x91x5c";//"?"的gbk編碼, 低字節為5c, 也就是ascii中的""
 
     var_dump(addslashes($a));
     var_dump(mysql_real_escape_string($a, $db));
 
     mysql_query("set names gbk");
     var_dump(mysql_real_escape_string($a, $db));
 
     mysql_set_charset("gbk");
     var_dump(mysql_real_escape_string($a, $db));
 ?>

copyright © 萬盛學電腦網 all rights reserved