javascript
JSP中文乱码分析和解决
轉載自:http://bijian1013.iteye.com/blog/1841029
在JSP的開發過程中,經常出現中文亂碼的問題。
? ? ? ? 首先了解一下Java中文問題的由來:
? ? ? ? Java的內核和class文件是基于unicode的,這使Java程序具有良好的跨平臺性,但也帶來了一些中文亂碼問題的麻煩。原因主要有兩方面,Java和JSP文件本身編譯時產生的亂碼問題和Java程序于其他媒介交互產生的亂碼問題。首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字節流的,如果Java和JSP編譯成class文件過程中,使用的編碼方式與源文件的編碼不一致,就會出現亂碼。基于這種亂碼,建議在Java文件中盡量不要寫中文(注釋部分不參與編譯,寫中文沒關系),如果必須寫的話,盡量手動帶參數-ecoding GBK或-ecoding gb2312或-ecoding UTF-8編譯;對于JSP,在文件頭加上<%@ page contentType="text/html;charset=GBK"%>或<%@ page contentType="text/html;charset=gb2312"%>基本上就能解決這類亂碼問題。
? ? ? ??下面是一些常見中文亂碼問題的解決方法
? ? ? ?
? ? ? ? 一.JSP頁面亂碼
? ? ? ? 這種亂碼問題比較簡單,一般是頁面編碼不一致導致的亂碼,一般新手容易出現這樣的問題,具體分以下兩種情況:
? ? ? ??1.未指定使用字符集編碼
? ? ? ? ?下面的顯示頁面(display.jsp)就出現亂碼
Html代碼??? ? ? ? ?這種亂碼的原因是沒有在頁面里指定使用的字符集編碼,JSP頁面中出現了中文字符,而默認的ISO-8859-1字符集中無中文字符,解決方法:只要在頁面開始地方用下面代碼指定字符集編碼即可,在JSP頁面中指定編碼方式(gb2312),和瀏覽器解碼方式設置相同,即在頁面的第一行加上:<%@ page contentType="text/html; charset=gb2312"%>,就可以消除亂碼了。
完整頁面如下:
Html代碼??? ? ? ???2.編碼字符集設置不一致
? ? ? ? ?下面的顯示頁面(display.jsp)就出現亂碼:
Html代碼??? ? ? ? ?這個出現亂碼原因是由于頁面編碼不一致導致的亂碼,在這個例子中我們可以看到有三處設置字符集的地方,下面分別了解一下這三處設置具體含義:
? ? ? ? ?第一處<%@ page language="java" pageEncoding="gb2312"%>的編碼格式為jsp文件的存儲格式。Eclipse會根據這個編碼格式保存文件。并編譯jsp文件,包括里面的漢字。
? ? ? ? ? 第二處編碼為解碼格式。因為存為gb2312的文件被解碼為iso8859-1,這樣如有中文肯定出亂碼。也就是必須一致。而第二處所在的這一行,可以沒有。缺省也是使用iso8859-1的編碼格式。所以如果沒有這一行的話,也會出現亂碼。必須一致才可以。
? ? ? ? ? 第三處編碼為控制瀏覽器的解碼方式。如果前面的解碼都一致并且無誤的話,這個編碼格式用不用設置都可以。有的網頁出現亂碼,就是因為瀏覽器不能確定使用哪種編碼格式。因為頁面有時候會嵌入頁面,導致瀏覽器混淆了編碼格式出現了亂碼。
? ? ? ? ? 完整解決代碼如下:
Html代碼??? ? ? ? ?
? ? ??? 二.表單提交中文時出現亂碼
? ? ? ? 下面是一個提交頁面(submit.jsp),代碼如下:
Html代碼??? ? ? ? ?下面是處理頁面(process.jsp)代碼:
Html代碼??? ? ? ? ?如果submit.jsp提交英文字符能正確顯示,如果提交中文時就會出現亂碼。原因:瀏覽器默認使用UTF-8編碼方式來發送請求,而UTF- 8和GB2312編碼方式表示字符時不一樣,這樣就出現了不能識別字符。
? ? ? ??1.POST提交方式
? ? ? ? ?解決辦法:
? ? ? ? ?A.接受參數時進行編碼轉換
String s=new String(request.getParameter("name").getBytes("ISO-8859-1"),"gb2312") ;
修改后的process.jsp代碼如下:
Html代碼??? ? ? ? ?如果使用該方法的話,每一個參數都必須這樣進行轉碼。很麻煩。但確實可以拿到漢字。
? ? ? ? ?B.通過request.seCharacterEncoding ("gb2312")對請求進行統一編碼,就實現了中文的正常顯示。
修改后的process.jsp代碼如下:
Html代碼??? ? ? ??如果使用該方法接受此參數的頁面就不必在轉碼了,即可得到漢字參數。但每頁都需要執行這句話。
? ? ? ? C.為了避免每頁都要寫request.setCharacterEncoding("gb2312"),可以使用過濾器對所有jsp進行編碼
處理。就是使用Servlet規范中的過慮器指定編碼,主要代碼如下:
Java代碼??? ? ? ? ?過濾器在web.xml中的配置如下:
Xml代碼??? ? ? ? ?修改后的process.jsp代碼如下:
Html代碼??? ? ? ? ?以上方法只對POST方式提交有效果。
? ? ? ? ?2.GET提交方式
? ? ? ? ?如果使用get方式提交中文,接受參數的頁面也會出現亂碼,這個亂碼的原因也是tomcat的內部編碼格式iso8859-1導致。Tomcat會以get的缺省編碼方式iso8859-1對漢字進行編碼,編碼后追加到url,導致接受頁面得到的參數為亂碼。
解決辦法:
? ? ? ? A.使用POST提交方式解決辦法的第一種方式,對接受到的字符進行解碼,再轉碼。
? ? ? ? B.首先配置tomcat下server.xml的Connector節點增加useBodyEncodingForURI="true"屬性配置,然后在JSP頁面中加入<%request.seCharacterEncoding("gb2312");%>所設置的編碼格式進行編碼。
? ? ? ? a.Tomcat中server.xml配置如下:
Xml代碼??? ? ? ? ?b.修改后的process.jsp代碼如下:
Html代碼??? ? ? ? ?
? ? ? ??三.數據庫連接出現亂碼
? ? ? ? 這種亂碼會使你插入數據庫的中文變成亂碼,或者讀出顯示時也是亂碼,解決方法如下: 在數據庫連接字符串中加入編碼字符集
String Url="jdbc:sqlserver://localhost:1433;DataBaseName=mydb;user=sa&password=sa&useUnicode=true&characterEncoding=GB2312";
? ?并在JSP頁面中使用如下代碼:
Jsp代碼??? ? ? ? ?
? ? ? ??四.關于jsp在MyEclipse中打開的亂碼問題
對于一個已經存在的項目,Jsp文件的存儲格式可能是utf-8。如果新安裝的eclipse,則缺省打開使用的編碼格式可能iso8859-1。所以導致?jsp里面的漢字出現亂碼。這個亂碼魚解決方式如下:
? ? ? ? A.Myeclispe Window - > Preferences彈出屬性窗口 ?General - > Workspace?設置Text file encoding?全局設置。
? ? ? ? B.右鍵你的項目---屬性---Text file encoding?項目設置
? ? ? ?
? ? ? ? 五.關于html頁面在eclipse中打開出現亂碼情況
? ? ? ? 由于大部分頁面都是由dreamweaver制作,其存儲格式跟eclipse的識別有差別導致。一般這種情況,在eclipse中新建一個jsp,直接從dreamweaver復制頁面內容粘貼到jsp即可。
? ? ? ?
? ? ? ? 六、JSP頁面通過URL傳遞中文參數的亂碼問題
在項目中,我們經常遇到需要在jsp頁面切換中傳遞中文字符。例如:http://website/test1.jsp?act=add&type=蘋果
? ? ? ? 1.一般來說我們很少直接在URL里面把參數寫成中文,如例子中的"type=蘋果"這樣傳遞。如果出現這種情況,在我們的接收參數的頁面我們只需要做個簡單的轉換就可以了。
代碼test1.jsp:(主要部分)
Jsp代碼??? ? ? ? ?2.更普遍的做法,就是對url中的中文字符進行編碼,變成類似type=%20D%20B這樣的字符。
代碼MyJsp1.jsp:
Jsp代碼??? ? ? ? ?代碼MyJsp2.jsp:
Jsp代碼???
總結
以上是生活随笔為你收集整理的JSP中文乱码分析和解决的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java.lang.Exception:
- 下一篇: org.hibernate.LazyIn