這篇文章主要介紹了php導入csv文件碰到亂碼問題的解決方法,需要的朋友可以參考下
今天主要是想寫一個php導入csv文件的方法,其實網上一搜一大把。都是可以實現怎麼去導入的。但是我導入的時候遇到了兩個問題,一個是在windows上寫代碼的時候測試發生了亂碼問題,然後解決了。第二個是提交到linux系統上的時候又發生了亂碼。我開始還不清楚是亂碼的原因,一開始我還以為是代碼svn提交發生的錯誤,到最後我在我的一個群裡提問了一下,一朋友是做phpcms的,他說他遇到從Windows提交到Linux的時候剛開始也總是發生錯誤,後來排查原因就是亂碼導致成的。下面切入正題看怎麼解決兩個問題的吧! 問題一解決: php讀取csv文件,在windows上出現中文讀取不到的情況,本人立馬想到一個函數mb_convert_encoding();作如下設置 $str = mb_convert_encoding($str, "UTF-8", "GBK");然後就可以了。當然你也可以用iconv();作如下設置iconv(‘GBK',”UTF-8//TRANSLIT//IGNORE”,$str);這兩個函數來解決在windows上面發生亂碼的問題。 問題二解決: php讀取csv文件,在linux上出現中文讀取不到的情況,百度,google後找到解決辦法 就是添加了一行代碼setlocale(LC_ALL, 'zh_CN');對,亮瞎你的眼了吧。就這麼簡單,如果你不知道,可能會花很多時間去解決這個問題。 PHP setlocale() 函數解釋 定義和用法 setlocale() 函數設置地區信息(地域信息)。 地區信息是針對一個地理區域的語言、貨幣、時間以及其他信息。該函數返回當前的地區設置,若失敗則返回 false。 以下是在資料上收集常用的地區標識: 代碼如下: zh_CN GB2312 en_US.UTF-8 UTF-8 zh_TW BIG5 zh_HK BIG5-HKSCS zh_TW.EUC-TW EUC-TW zh_TW.UTF-8 UTF-8 zh_HK.UTF-8 UTF-8 zh_CN.GBK GBK 例如、 utf-8: setlocale(LC_ALL, ‘en_US.UTF-8′); 簡體:setlocale(LC_ALL, ‘zh_CN'); 之所以給大家講 setlocale()這個函數,是因為我導入csv文件到linux系統的時候發生了亂碼,包括用了mb_convert_encoding()和iconv()兩個函數都是沒搞定最後問題的。最後就加了這一句setlocale(LC_ALL, ‘zh_CN');加在導入csv文件開始的代碼前面就輕松搞定了,然後我又找了一下資料,發現fgetcsv()函數對區域設置是敏感的。比如說 LANG 設為 en_US.UTF-8 的話,單字節編碼的文件就會出現讀取錯誤,所以我們需要對其進行區域性的設置。特分享給大家。 我還嘗試用了以下代碼也沒能搞定,這些都是生成csv文件的header的設置。可能在我這裡不起作用,但是在你那裡也說不定哦。所以我都整理出來,盡可能的幫助遇到導入csv文件亂碼的同行,因為在沒辦法的情況下真的太難處理了。大家可以都試試!總有一個是屬於你的。 代碼如下: <?php $csvContent="csvzero,csvone,csvtwo,csvthree,csvfour,csvfive"; header("Content-Type: application/vnd.ms-excel; charset=GB2312"); header("Pragma: public"); header("Expires: 0"); header("Cache-Control: must-revalidate, post-check=0, pre-check=0"); header("Content-Type: application/force-download"); header("Content-Type: application/octet-stream"); header("Content-Type: application/download"); header("Content-Disposition: attachment;filename=CSV數據.csv "); header("Content-Transfer-Encoding: binary "); $csvContent = iconv("utf-8","gb2312",$csvContent); echo $csvContent; exit; ?> 下面就再來具體看看php導入csv文件的代碼: 兩個函數簡單介紹一下, mb_detect_encoding()檢測到的字符編碼,或者無法檢測指定字符串的編碼時返回FALSE。 fgetcsv() 函數從文件指針中讀入一行並解析 CSV 字段。與fgets() 類似,不同的是 fgetcsv() 解析讀入的行並找出 CSV 格式的字段,然後返回一個包含這些字段的數組。fgetcsv() 出錯時返回 FALSE,包括碰到文件結束時。 注釋:從 PHP 4.3.5 起,fgetcsv() 的操作是二進制安全的。 注釋:CSV 文件中的空行將被返回為一個包含有單個 null 字段的數組,不會被當成錯誤。 注釋:該函數對區域設置是敏感的。比如說 LANG 設為 en_US.UTF-8 的話,單字節編碼的文件就會出現讀取錯誤。 注釋:如果碰到 PHP 在讀取文件時不能識別 Macintosh 文件的行結束符,可以激活 auto_detect_line_endings 運行時配置選項。 復制代碼 代碼如下: <?php setlocale(LC_ALL, 'zh_CN'); //設置地區信息(地域信息) $file = $_FILES['files']; $file_type = substr(strstr($file['name'],'.'),1); if ($file_type != 'csv'){ echo "<script type="text/javascript">alert("文件格式錯誤,請重新上傳!"); </script>"; exit; } $handle = fopen($file['tmp_name'],"r"); $file_encoding = mb_detect_encoding($handle); if ($file_encoding != 'ASCII'){ echo "<script type="text/javascript">alert("文件編碼錯誤,請重新上傳!"); </script>"; exit; } $row = 0; $str=""; $sy=""; while ($data = fgetcsv($handle,1000,',')){ $row++; if ($row == 0) continue; $num = count($data); for ($i=0; $i<$num; $i++){ $str = (string)$data[$i].'|'; $str = mb_convert_encoding($str, "UTF-8", "GBK"); //已知源碼為GBK,轉換為utf-8 $sy .= $str; //我這裡做的比較復雜,是用'|'將csv文件裡面的內容用'|'全部拼起來,因為我導入的是商品信息,需要根據用戶需 //要導入的數據去定義哪些數據是需要導入的。 } } if ($sy) { $sy = rtrim($sy, '|'); } $arr = explode('|',$sy); $key = array_slice($arr,0,$num); //這個數組就是csv文件裡面標題,就是商品id,標題,賣點等等的數據 $skey = array(); $length = array(); $co = count($arr); $p = $co/$num; //求出要取出的數據的長度 for($j=0;$j<$p;$j++){ $offset=($j-1)*$num; //偏移量,就像分頁一樣,我這裡根據偏移量取出的一個數組就是一個商品的信息。 if($j==0){ $length[] = array_slice($arr,0,$num); }else{ $length[] = array_slice($arr,$num+$offset,$num);//取出有哪些字段和商品 } } $arrtitle = array(); $arrfileds = array(); $arrtagname = DB::select('字段標識', '字段名稱')->from('字段表')->fetch_all(); foreach ($arrtagname as $value) { $arrfileds[$value['fileds_tags']] = $value['fileds_name']; } foreach ($fileds as $v) { $temarr= explode('-', $v); if (isset($temarr[0]) && !empty($temarr[0])) { if (isset($temarr[1]) && !empty($temarr[1])) { if ($temarr[1] == 'wenben') { $arrtitle[] = $arrfileds[$temarr[0]].'文本'; } } else { if ($temarr[0] != 'pic') { //是取出字段是圖片就給去掉 $arrtitle[] = $arrfileds[$temarr[0]]; } } } } $skey = array(); $order = array(); $order[] = 'act_tag'; $order[] = 'channel_tag'; $order[] = 'created_time'; $order[] = 'orderby'; $rows =''; $f = $co/$num;//求出有多少件商品 for($p=0;$p<count($arrtitle);$p++){ //這裡就是根據自己的需求查出自己需要的數據,通過用戶需要的商品字段標識查出表裡相對應的英文標識。 $skey[]= DB::select('字段標識')->from('字段表')->where('字段名稱', '=', $arrtitle[$p])->fetch_row(); $rows .= $skey[$p]['字段標識'].'|'; } if($rows){ $rows = rtrim($rows,'|'); } if(!empty($rows)){ $exrows = explode('|',$rows); }else{ $exrows = array(); } $skeys = array_merge($order,$exrows); $count1 = count($skeys); //字段的個數 if(!empty($length)){ for($x=1;$x<$f;$x++){ //求出有多少件商品就的循環多少次 $orders = array(); $orders[] = $act_tag; $orders[] = $channel_tag; $orders[] = time(); $newlen = array_merge($orders,$length[$x]); if($count1 !== count($newlen)){ //如果商品字段的長度和商品的長度不等就證明用戶有哪個字段沒錄入 $newrs = array(); echo "<script type="text/javascript">alert("<font color=#f00;>".'請檢