一次tomcat源碼啟動(dòng)控制臺(tái)中文亂碼的調(diào)試過(guò)程記錄
發(fā)現(xiàn)問(wèn)題
今天準(zhǔn)備學(xué)習(xí)下tomcat源碼,于是從官網(wǎng)下載了tomcat的源碼,導(dǎo)入到IDEA中,使用maven工具build完項(xiàng)目之后,啟動(dòng)項(xiàng)目,控制臺(tái)打印了tomcat日志,但是中文都是亂碼。
一開(kāi)始我懷疑是IDEA的問(wèn)題,于是在網(wǎng)上找了各種解決辦法嘗試。大致有這幾種:
1、修改run/debug configurations,添加VM options參數(shù):-Dfile.encoding=utf-8;
2、修改run/debug configurations,添加Enviroment variables參數(shù):JAVA_TOOL_OPTIONS:-Dfile.encoding=utf-8和JAVA_OPTS:-Dfile.encoding=utf-8;
3、修改IDEA配置file encodings的3處編碼為UTF-8;
4、修改IDEA的Custom VM options,添加-Dfile.encoding=utf-8;
5、修改IDEA的安裝目錄bin下的idea.exe.vmoptions和idea64.exe.vmoptions文件,添加-Dfile.encoding=utf-8;
6、修改項(xiàng)目下的.idea文件夾下的encodings.xml文件,不是UTF-8的改為UTF-8;
7、修改tomcat的配置文件logging.properties,將里面的UTF-8改為GBK;
8、修改完刪除target文件夾重新編譯;
9、修改完重啟IDEA。
嘗試完所有方法后,控制臺(tái)日志亂碼問(wèn)題并沒(méi)有解決,如圖:
仔細(xì)觀察后,發(fā)現(xiàn)日志左邊的日志等級(jí)”信息”和”嚴(yán)重”之類(lèi)的中文亂碼解決了,但是日志中還有亂碼。
感覺(jué)應(yīng)該是代碼的問(wèn)題,于是決定debugger代碼,先從日志的第一行開(kāi)始。
17-Feb-2020 10:10:08.585 信息 [main] org.apache.catalina.startup.VersionLoggerListener.log Server.æœåŠ¡å™¨ç‰ˆæœ¬: Apache Tomcat/@VERSION@
找到org.apache.catalina.startup.VersionLoggerListener類(lèi)的log()方法,打斷點(diǎn)一步一步跟蹤
最終發(fā)現(xiàn)所有的值存在了PropertyResourceBundle類(lèi)的lookup的map集合中,集合中的數(shù)據(jù)已經(jīng)亂碼了。
于是繼續(xù)debugger查看lookup的加載,通過(guò)源碼查看lookup集合中的數(shù)據(jù)是從properties文件中讀取出來(lái)的。查看該properties文件編碼也是UTF-8。于是繼續(xù)查看源碼。
ResourceBundle中的is = classLoader.getResourceAsStream(resourceName);加載的這個(gè)properties文件
再通過(guò)PropertyResourceBundle構(gòu)造方法加載的數(shù)據(jù)。
正準(zhǔn)備修改這塊代碼時(shí),發(fā)現(xiàn)這竟是JDK中的類(lèi),無(wú)法修改。(后來(lái)才知道ResourceBundle是用來(lái)做國(guó)際化的)。
后來(lái)查資料知道了:在java中, 讀取文件的默認(rèn)格式是iso8859-1, 而我們中文存儲(chǔ)的時(shí)候一般是UTF-8. 所以導(dǎo)致讀出來(lái)的是亂碼。
解決方案有兩種:
1、使用JDK下的工具native2ascii.exe將properties文件轉(zhuǎn)為Unicode編碼。轉(zhuǎn)換后如圖:
2、在代碼中獲取到了值之后手動(dòng)重新編碼解碼下
try { value = new String(value.getBytes("ISO-8859-1"), "UTF-8");}catch(Exception e){ e.printStackTrace();}
經(jīng)過(guò)測(cè)試,兩種方法都可以解決問(wèn)題。
因?yàn)閠omcat中properties文件過(guò)多,我采用了第二種方法,修改了tomcat源碼,修改如下:
1)org.apache.tomcat.util.res.StringManager類(lèi)中的getString(final String key, final Object... args)方法。
2)org.apache.jasper.compiler.Localizer類(lèi)的getMessage(String errCode)方法
至此,亂碼問(wèn)題解決
總結(jié)
到此這篇關(guān)于一次tomcat源碼啟動(dòng)控制臺(tái)中文亂碼調(diào)試過(guò)程記錄的文章就介紹到這了,更多相關(guān)tomcat源碼啟動(dòng)控制臺(tái)中文亂碼內(nèi)容請(qǐng)搜索以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持!
