程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> php上傳中文文件名亂碼問題處理方案

php上傳中文文件名亂碼問題處理方案

編輯:PHP綜合

php上傳文件是最最基礎的一個技術點,但是深入進去也有不少問題需要解決,這不,上傳中文文件後,文件名變成了亂碼。

下面是問題代碼,很簡單:

1.問題代碼

html部分:

復制代碼 代碼如下:
 <html>
 <body>
 <form action="upload_file.php" method="post"
 enctype="multipart/form-data">
 <label for="file">Filename:</label>
 <input type="file" name="file" id="file" />
 <br />
 <input type="submit" name="submit" value="Submit" />
 </form>
 </body>
 </html>

php部分:
 
復制代碼 代碼如下:
 <?php
 if ($_FILES["file"]["error"] > 0)
 {
     echo "Return Code: " . $_FILES["file"]["error"] . "<br />";
 }else
 {
     echo "Upload: " . $_FILES["file"]["name"] . "<br />";
     echo "Type: " . $_FILES["file"]["type"] . "<br />";
     echo "Size: " . ($_FILES["file"]["size"] / 1024) . " Kb<br />";
     echo "Temp file: " . $_FILES["file"]["tmp_name"] . "<br />";
     if (file_exists("upload/" . $_FILES["file"]["name"]))
     {
         echo $_FILES["file"]["name"] . " already exists. ";
     }
     else
     {
       move_uploaded_file($_FILES["file"]["tmp_name"],
       "upload/" . $_FILES["file"]["name"]);
     }
 }

上傳了一個文件名為“測試數據.txt”的文件,oh ho,文件是傳上去了,但是文件名為亂碼。

2.初試

網上搜索一下解決方案,將

復制代碼 代碼如下:
move_uploaded_file($_FILES["file"]["tmp_name"], "upload/" . $_FILES["file"]["name"]);

改成

復制代碼 代碼如下:
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("UTF-8","gbk",$_FILES["file"]["name"]));

結果發現iconv函數返回值為false。

查一下函數手冊,發現第二個參數有特別的用法,簡單翻譯一下就是我可以在編碼的後面追加//TRANSLIT 或 //IGNORE ,前者會將無法翻譯的字符轉成最接近的字符,後者就是直接忽略不能轉化的字符。

試一下:

復制代碼 代碼如下:
var_dump( iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"]));
var_dump( iconv("UTF-8","gbk//IGNORE",$_FILES["file"]["name"]));

結果:

bool(false) string(4) ".txt"

也就是說中文都沒法轉化,甚至連接近的字符都沒有,看來網上介紹的方法也並非萬能。

3.網上介紹方法失敗,再嘗試

猜測一下,也許我的系統在創建中文文件的時候會亂碼,於是我將代碼改寫了一下:

復制代碼 代碼如下:
move_uploaded_file($_FILES["file"]["tmp_name"], "upload/測試數據.txt");

結果創建成功,沒有亂碼。。。也就是說不是系統問題。

想一下,我的php文件本身是utf8編碼的,那麼

復制代碼 代碼如下:
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/測試數據.txt");

這個語句肯定使用的是utf8編碼,那麼之前上傳的文件名肯定就不是utf8編碼了,那麼以下的語句肯定是錯誤的,因為源字符串本身就不是utf8編碼的:

復制代碼 代碼如下:
iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"]);

使用函數檢查源字符串的編碼:

復制代碼 代碼如下:
$e=mb_detect_encoding($text, array(‘UTF-8', ‘GBK','gb2312'));
echo $e;

結果是CP936,也就是源字符串編碼是GBK。

試一下

復制代碼 代碼如下:
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("gbk","UTF-8",$_FILES["file"]["name"]));

問題解決,不再亂碼

4.另一種解決辦法

實際上還有一種解決辦法,就是在html文件的head標簽中間加入

復制代碼 代碼如下:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

從而使編碼保持統一,也就不需要再轉碼了

5.下面是結論

使用iconv函數可以解決上傳中文文件名亂碼的問題,實際上iconv能解決各種各樣的由於編碼不統一造成的亂碼問題。
使用iconv函數請先檢查源字符串的編碼,除非你已經確定了源字符串的編碼。
盡量保證所有的代碼的編碼一致,萬不得已才使用iconv函數。
吐槽一下,盡量不使用中文文件名作為服務器上保存的文件名,請將文件名轉化成自己的文件名(即使是英文文件名也請轉化一下)。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved