亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

Java繁體中文處理完全攻略(二)

瀏覽:3日期:2024-06-22 13:09:00
內容: 出自:csdn 蔡學鏞 Java 繁體中文處理完全攻略(二) I/O 轉碼 Java 現行的 IO 一律使用 Stream 的方式,相關的類別都放在 java.io 中。輸出 binary 的資料使用 OutputStream 的子類別,輸入 binary 的資料使用 InputStream 的子類別,輸出文字的資料使用 Writer 的子類別,輸入文字的資料使用 Reader 的子類別。 你可能會覺得很奇怪:「有必要用不同的方式來處理文字和 binary 嗎?文字資料不也是 binary 的一種?」沒錯,其實他們非常類似,最大的差異在于,InputStream/OutputStream 會原封不動地傳送資料,但是 Reader/Writer 會將資料當作文字對待,所以 Reader/Writer 在「必要時」會把(文字)資料轉碼。什么時候才是所謂的「必要時」呢? Java 的 Stream(包括 Reader 和 Writer)是可以互相串接的。當 Reader 的資料來源是另一個 Reader 時,不轉碼,當 Reader 的資料來源是一個 InputStream 時,就會轉碼。當 Writer 的資料去處是另一個 Writer 時,不轉碼,當 Writer 的資料去處是一個 OutputStream 時,就會轉碼。 由什么碼轉成什么碼?這是可以指定的。因為轉碼只發生在 Reader/InputStream 的交界處與 Writer/OutputStream 的交界處,所以正是由 InputStreamReader 和 OutputStreamWriter 此二類別負責,下面兩個 constructor 的第二個參數,正是用來指定轉碼的方式。 public InputStreamReader(InputStream in, String enc)throws UnsupportedEncodingException;public OutputStreamWriter(OutputStream out, String enc)throws UnsupportedEncodingException; InputStreamReader 負責將 enc 的編碼方式轉成 Unicode(因為資料是從「外部」送過來給「內部」的),OutputStreamWriter 負責將 Unicode 的編碼方式轉成 enc(因為資料要從「內部」送給「外部」)。JRE 內部當然都一定是用 Unicode 編碼,而外部的編碼就不一定,要看當時的環境為何。你可以透過 getEncoding() 的 method,來得知 InputStreamReader 與 OutputStreamWriter 的編碼方式。 請注意:即使你沒用到 InputStreamReader 與 OutputStreamWriter,只有用到其它的 Reader 和 Writer,但是這些 Reader 和 Writer 內部也很有可能(但非絕對)是直接或間接通到 InputStreamReader 與 OutputStreamWriter。比方說:FileReader 內部其實是透過一個 InputStreamReader 的中介來將資料從 FileInputStream 取過來的,此時 InputStreamReader 的轉碼方式是采用 OS 的文字編碼(以繁體中文的 Windows 為例,就是「MS950」)轉成 Unicode。 如果你清楚地知道你要讀寫的檔案(或資料來源 / 去處)是采用某種編碼方式,你也可以主動指定編碼方式。但是,請記得抓取可能導致的 UnsupportedEncodingException,并務必處理之,不可對此例外置之不理,因為該 JRE 有可能沒有附上此種編碼表(也有可能你的編碼名稱給錯)。 檔案 I/O 轉碼 如果你是在泰文版的 Windows 上,想讀取用 MS950 編碼的繁體中文文字文件,你就必須主動指定編碼,不可以直接用 FileReader,否則無法成功讀取。方法如下: FileInputStream fis = new FileInputStream(fileName);InputStreamReader reader = new InputStreamReader(fis, 'MS950'); 然后,透過 Reader 讀出來的就會是正確的中文。 網絡 I/O 轉碼 如果你的網絡程序采用 TCP,那么你可以透過 Socket 類別所提供的 getInputStream() 和 getOutputStream() 來得到 InputStream 和 OutputStream 對象。如果你是在泰文版的 Windows 上,想讀取用 MS950 編碼的繁體中文文字 TCP 網絡串流,你可以用類似上面的技巧來轉碼。方法如下: InputStream is = mySocket.getInputStream();InputStreamReader reader = new InputStreamReader(is, 'MS950'); 如果你的網絡程序采用 UDP,你必須把中文字符串轉成(或轉自)byte 數組。請看下一節「 字符串和 byte 數組的轉碼 」。 如果你的網絡程序采用 RMI,那你完全不用為這部分的轉碼操心,字符串直接用 Unicode 在網絡上傳遞給另一個 JRE,不需要轉碼。 保持刑案現場 如果你不知道你的 I/O 資料來源或去處是用何種編碼方式,那么你最好不要用 Reader 和 Writer,而應該直接用 InputStream 和 OutputStream,因為與其被 Reader 和 Writer 胡亂編碼之后造成信息遺失或錯亂,不如保持資料的完整不變,留待以后進一步解讀。 字符串和 byte 數組的轉碼 java.lang.String 類別是 Java 字符串對象的類別,Java 字符串對象既然是活在 JRE 內部,當然就一定是用 Unicode 編碼。如果你需要將 String 對象和 byte 數組互轉,你可以使用: String(byte[] bytes, int offset, int length, String enc); 或 String(byte[] bytes, String enc); 來將用 enc 編碼的 byte 數組,轉成 Unicode 的 String 對象。你也可以使用 String 對象所提供的: byte[] getBytes(String enc) 來將 String 對象轉成 byte 數組。 另外,你也可以透過 ByteArrayInputStream 或 ByteArrayOutputStream 串接到 InputStreamReader 或 OutputStreamWriter,來達到轉碼的目的。 Java, java, J2SE, j2se, J2EE, j2ee, J2ME, j2me, ejb, ejb3, JBOSS, jboss, spring, hibernate, jdo, struts, webwork, ajax, AJAX, mysql, MySQL, Oracle, Weblogic, Websphere, scjp, scjd
標簽: Java
相關文章:
主站蜘蛛池模板: 一级毛片一级毛片免费毛片 | 一级欧美毛片成人 | 在线视频 自拍 | 1024 cc香蕉在线观看看中文 | 国产精品久久久久久久久电影网 | 欧美一级毛片免费大片 | 欧美3p在线观看一区二区三区 | 毛片网站在线播放 | 在线播放人成午夜免费视频 | 国产成人8x视频一区二区 | 综合网女女网 | 久久精彩 | 国产精品一区二区av | 特级中国aaa毛片 | 999国产高清在线精品 | 国产成人禁片免费观看 | 黄色片子一级 | 操大逼视频| 亚洲午夜大片 | 一级欧美激情毛片 | 欧洲精品码一区二区三区免费看 | 一级毛片a| 欧美日本高清 | 五月婷婷综合基地 | 调教~奴●メイドの馆 | 欧美毛片在线播放观看 | 污网| 精品国产福利第一区二区三区 | 欧美日韩综合 | 亚洲加勒比久久88色综合一区 | 久久综合久久精品 | 欧美三级做爰在线 | 亚洲欧美手机在线观看 | 亚洲麻豆精品果冻传媒 | 日韩在线 中文字幕 | 精品成人免费播放国产片 | 免费观看一级毛片 | 小明永久2015www永久免费观看 | 91精品一区二区三区在线观看 | 免费网站观看 | 在线观看国产视频 |