程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> 網頁UTF8編碼開發中空白的問題

網頁UTF8編碼開發中空白的問題

編輯:PHP綜合
開發中一直沒辦法解決的一個問題
  頁面采用UTF8編碼,頭部和尾部用了模板包含文件的方法,結果頭部和尾部無端端各多出一個約10px的空行,什麼也沒有。
  原因是全部采用utf8編碼,包含文件的時候,最後的二進制流中包含了多次UTF8 BOM標記,IE不能正常解析包含多個UTF8 BOM 標記的頁面,直接替換成實際顯示的回車,這樣導致一個空行,而Firefox卻沒有這個問題。
  故如果模板采用包含的方法包含多個utf8文件需要用ultraedit保存時另存為功能 選擇utf8 無bom格式保存即可。
  另外,如果中文頁面在html head標記中將title標記放在<meta http-equiv=”content-type” content=”text/Html; charset=UTF-8″ />前面會導致頁面空白。
  所以utf8頁面應該使用標准順序

<meta http-equiv=”content-type” content=”text/Html; charset=UTF-8″ />
<meta http-equiv=”content-language” content=”zh-CN” />
<meta name=”robots” content=”index,follow” />
<meta name=”keyWords” content=”" />
<meta name=”description” content=”" />
<meta name=”rating” content=”general” />
<meta name=”author” content=”" />
<meta name=”copyright” content=”" />
<meta name=”generator” content=”" />
<title></title>

BOM頭:\xEF\xBB\xBF,PHP4、5尚對BOM無視,所以在解析前直接輸出。
對此 w3.org 標准 FAQ 中對此問題有一個專門的描述:

http://www.w3.org/International/questions/qa-utf8-bom

具體如下:

在UCS 編碼中有一個叫做”ZERO WIDTH NO-BREAK SPACE”的字符,它的編碼是FEFF。而FFFE在UCS中是不存在的字符,所以不應該出現在實際傳輸中。UCS規范建議我們在傳輸字節流前,先傳輸 字符”ZERO WIDTH NO-BREAK SPACE”。這樣如果接收者收到FEFF,就表明這個字節流是Big-Endian的;如果收到FFFE,就表明這個字節流是Little- Endian的。因此字符”ZERO WIDTH NO-BREAK SPACE”又被稱作BOM。

UTF-8不需要BOM來表明字節順序,但可以用BOM來表明編碼方式。字符”ZERO WIDTH NO-BREAK SPACE”的UTF-8編碼是EF BB BF。所以如果接收者收到以EF BB BF開頭的字節流,就知道這是UTF-8編碼了。

Windows就是使用BOM來標記文本文件的編碼方式的操作系統: WindowsXP Professional , 缺省字符集:中文

1) notepad : 可以自動識別出沒有帶 bom 的 utf-8 編碼格式文件,但不可以控制保存文件時是否添加 bom , 如果保存文件,那麼會統一添加 bom 。

2)editplus : 不能自動識別出沒有 bom 的 utf-8 編碼格式文件,文件保存時,選擇UTF-8 格式,不會在文件頭寫上 BOM header.

3) UltraEdit : 對於字符編碼的功能最為強大, 可以自動識別帶 bom 和不帶 bom 的 utf-8 文件 (可以配置) ; 保存的時候可以通過配置選擇是否添加 bom.

(特別需要注意的是,保存一個新建立的文件時,需要選擇另存為 utf-8 no bom 格式)

後來發現 Notepad ++ 也對於 utf-8 bom 支持比較好,推薦大家使用。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved