程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> JSP編程 >> 關於JSP >> jsp 編碼問題

jsp 編碼問題

編輯:關於JSP

使用Tomcat進行JSP開發最頭疼的莫過於中文亂碼問題了,總結Tomcat亂碼問題出現的原因必須明白以下幾點:

 

1.Tomcat一般總是默認使用ISO-8859-1作為字符編碼方式的。所以,除非你在Servlet中使用了request.setCharacterEncoding("編碼方式");指定了特殊的編碼方式,否則Tomcat默認使用ISO-8859-1的編碼方式。

 

2.在JSP頁面中pageEncoding和charset和含義是不同的。pageEncoding是指頁面的編碼格式(請記住!,十分重要~,與顯示無關),也就是說無論你JSP裡的pageEncoding采用什麼方式,如果出現中文亂碼,原因不在於pageEncoding的所指定的編碼方式不對,而在於charset的屬性不對。charset是負責JSP頁面中的字符按什麼編碼方式顯示。pageEncoding只負責頁面的編碼格式,而後JAVA虛擬機負責按照pageEncoding指定的編碼轉換成Unicode編碼的字節碼文件。(也就是說,無論你pageEncoding指定什麼方式,最終都是轉換成了Unicode編碼。)另外請大家注意,如果從客戶端提交的用戶請求裡的中文也是使用pageEncoding方式編碼的。也就是說,在Servlet中request.getParameter("參數");Tomcat默認是使用ISO-8859-1方式去讀取的,但實際裡面的字符編碼方式應該是JSP頁面pageEncoding所指定的方式。除非用戶自己加上request.setCharacterEncoding("編碼方式");

 

3.明白pageEncoding和charset之間的關系。一般而言,如果頁面裡指定了pageEncoding的方式也就是說,比如:<%@page language="java" import="java.util.*" pageEncoding="GBK"%>這句話,而沒有指定charset的話,那麼頁面默認是按照charset=ISO-8859-1編碼方式顯示字符,按照pageEncoding="GBK"方式進行頁面的編碼。如果你的JSP頁面裡面沒有指定pageEncoding方式,而只是說明了charset的話,比如:

<%@ pagecontentType="text/html;charset=utf-8"%>這句話,那麼JSP默認是按照pageEncoding="utf-8"進行頁面編碼的,字符集按照charset=utf-8"顯示。

 

4.使用request.setCharacterEncoding("編碼方式");注意:request.setCharacterEncoding()僅僅對POST提交方式起作用,對於GET方式提交還是會出現亂碼問題。要解決GET提交中文的亂碼問題,可以在Server.xml的<Connector port="8888" protocol="HTTP/1.1"
 
             connectionTimeout="20000"
              redirectPort="8443" />

加入:URIEncoding="utf-8" useBodyEncodingForURI="true"

另外,request.setCharacterEncoding()這句話一定要放在要讀取的第一參數之前調用。否則也不起作用了!!

 

下來我們看一個小例子:

  在index.jsp頁面中,指定pageEncoding方式:

------------------------------------------------------------------

<%@ page language="java" import="java.util.*"pageEncoding="GBK" %>

<html>
  <head>
   <basehref="<%=basePath%>">
 
   <title>My JSP 'index.jsp' startingpage</title>
 
<meta http-equiv="pragma"content="no-cache">
<meta http-equiv="cache-control"content="no-cache">
<meta http-equiv="expires"content="0"> 
<meta http-equiv="keywords"content="keyword1,keyword2,keyword3">
<meta http-equiv="description" content="This is mypage">
<!--
<link rel="stylesheet" type="text/css"href="styles.css">
-->

  </head>

  <body>
    <form action=servlet/Loginmethod=post>
      用戶名:<input type=text name="username"size=20><br>
      密碼:<input type="password" name="password"size=20><br>
      <input type=submitname="submit">
  </form>
  </body>
</html>
-------------------------------------------------------------

在Login.java Servlet源文件中:

public void doPost(HttpServletRequest request, HttpServletResponseresponse)
   throws ServletException,IOException {

 
  PrintWriter out = response.getWriter();
 out.print("<H>welcome you comehere!</H>");
 out.print("<br>");
 out.println(request.getParameter("username"));
 out.print("<br>");
 out.println(request.getParameter("password"));
 out.print("<br>");
  out.flush();
 System.out.println(response.getCharacterEncoding());
  out.close();
}

當輸入中文的用戶名,調用Login Servlet後,結果能正常顯示中文,讀者看到這裡似乎感到很奇怪。

因為,在LoginServlet中並沒有使用request.setCharacterEncoding("編碼方式");指定特點的編碼方式,也就是說Tomcat默認是使用ISO-8859-1的方式,怎麼能正常顯示中文了呢?問題出在IE浏覽器上,請大家注意!因為,大家默認使用的都是中文IE浏覽器,所以中文IE浏覽器默認使用的字符集是charset=GBK,再請大家注意了,在上面這段LoginServlet代碼中並沒有指定response.setContentType("text/html;charset=GBK");這樣的語句,也就是說IE浏覽器認為,既然用戶自己沒有指定字符集,那麼就使用默認的字符集,也就是默認使用了charset=GBK,

所以你所看到的中文顯示,是IE浏覽器默默幫你轉換了,從ISO-8859-1到GBK的轉換,也就是說IE浏覽器幫你做了這麼一句話:

out.println(newString(request.getParameter("username").getBytes("ISO-8859-1"),"gbk"));

再請大家注意,如果你在Login Servlet原碼中加入了response.setContentType("text/html;charset=GBK");那麼你就畫蛇添足了,反而起到不好的效果,因為IE浏覽器認為用戶自己已經指定了特定的字符集方式,而且就是charset=GBK方式,所以就不需要從ISO-8859-1到GBK的轉換,因為IE浏覽認為你頁面裡的字符就應該是GBK編碼方式的,但是其實不然,是ISO-8859-1方式的,所以反而顯示的中文亂碼了。

 

下來,我們把上面的小例子改一下:index.jsp頁面中只指定charset方式:

<%@ pagecontentType="text/html;charset=utf-8"%>

<html>
  <head>
   <basehref="<%=basePath%>">
 
   <title>My JSP 'index.jsp' startingpage</title>
 
<meta http-equiv="pragma"content="no-cache">
<meta http-equiv="cache-control"content="no-cache">
<meta http-equiv="expires"content="0"> 
<meta http-equiv="keywords"content="keyword1,keyword2,keyword3">
<meta http-equiv="description" content="This is mypage">
<!--
<link rel="stylesheet" type="text/css"href="styles.css">
-->

  </head>

  <body>
    <form action=servlet/Loginmethod=post>
      用戶名:<input type=text name="username"size=20><br>
      密碼:<input type="password" name="password"size=20><br>
      <input type=submitname="submit">
  </form>
  </body>
</html>
-------------------------------------------------------

在Login.java Servlet源文件中:

public void doPost(HttpServletRequest request, HttpServletResponseresponse)
   throws ServletException,IOException {

 response.setContentType("text/html;charset=utf-8");

 //response.setContentType("text/html;charset=GBK");//也可以正常顯示中文

  request.setCharacterEncoding("utf-8");
  PrintWriter out = response.getWriter();
 out.print("<H>welcome you comehere!</H>");
 out.print("<br>");
 out.println(request.getParameter("username"));
 out.print("<br>");
 out.println(request.getParameter("password"));
 out.print("<br>");
  out.flush();
 System.out.println(response.getCharacterEncoding());
  out.close();
}

 

因為在index.jsp中

<%@ pagecontentType="text/html;charset=utf-8"%>有這句話,所以JSP默認使用的pageEncoding=utf-8

所以在Login Servlet你必須加上:

response.setContentType("text/html;charset=utf-8");

request.setCharacterEncoding("utf-8");
這兩句話,才能正常顯示中文!
作者:mark_qi

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved