JAVA實現漢字轉拼音功能代碼實例
JAVA中漢字轉拼音的方法并不復雜,可以使用pinyin4j包來實現。
一、下載pinyin4j的架包,并導入項目中,如下:
如果是maven項目,maven依賴如下:
<dependency> <groupId>com.belerweb</groupId> <artifactId>pinyin4j</artifactId> <version>2.5.0</version> </dependency>
二、漢字轉拼音方法,附上代碼例子,如下:
public class PinyinUtil { public static void main(String[] args) throws Exception { System.out.println(getPinyin('haha你笑起來真好看', ' ')); System.out.println(getPinyinInitials('你笑起來真好看')); } /** * 將漢字轉換為全拼 * * @param text 文本 * @param separator 分隔符 * @return {@link String} */ public static String getPinyin(String text, String separator) { char[] chars = text.toCharArray(); HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat(); // 設置大小寫 format.setCaseType(HanyuPinyinCaseType.LOWERCASE); // 設置聲調表示方法 format.setToneType(HanyuPinyinToneType.WITHOUT_TONE); // 設置字母u表示方法 format.setVCharType(HanyuPinyinVCharType.WITH_V); String[] s; String rs = StringUtils.EMPTY; try { StringBuilder sb = new StringBuilder(); for (int i = 0; i < chars.length; i++) {// 判斷是否為漢字字符if (String.valueOf(chars[i]).matches('[u4E00-u9FA5]+')) { s = PinyinHelper.toHanyuPinyinStringArray(chars[i], format); if (s != null) { sb.append(s[0]).append(separator); continue; }}sb.append(String.valueOf(chars[i]));if ((i + 1 >= chars.length) || String.valueOf(chars[i + 1]).matches('[u4E00-u9FA5]+')) { sb.append(separator);} } rs = sb.substring(0, sb.length() - 1); } catch (BadHanyuPinyinOutputFormatCombination e) { e.printStackTrace(); } return rs; } /** * 獲取漢字首字母 * * @param text 文本 * @return {@link String} */ public static String getPinyinInitials(String text) { StringBuilder sb = new StringBuilder(); for (int i = 0; i < text.length(); i++) { char ch = text.charAt(i); String[] s = PinyinHelper.toHanyuPinyinStringArray(ch); if (s != null) {sb.append(s[0].charAt(0)); } else {sb.append(ch); } } return sb.toString(); }}
其中,拼音格式參數說明:
HanyuPinyinCaseType 設置拼音的大小寫 LOWERCASE 小寫 UPPERCASE 大寫 HanyuPinyinToneType 設置拼音的音調 WITH_TONE_NUMBER 用數字表示音調。如:wo3 WITHOUT_TONE 不表示音調。如:wo WITH_TONE_MARK 用符號表示音調。如:wŏ HanyuPinyinVCharType 設置拼音的表示方法 WITH_U_AND_COLON 用字母u和冒號表示。如:lu: WITH_V 用字母v表示。如:lv WITH_U_UNICODE 用Unicode編碼表示。如:lü
PS:這里有一個注意的點,就是音調和表示方法是配合使用的,所以用符號表示音調的時候,只能使用Unicode編碼的方法顯示,如果設置其他兩種表示方式會報錯。
格式效果:
表示方法 WITH_U_AND_COLON WITH_V WITH_U_UNICODE 聲調 WITH_TONE_NUMBER lu3 lv lü3 WITHOUT_TONE lu lv3 lü WITH_TONE_MARK Exception Exception lǚ
三、使用效果如下:
文本:haha你笑起來真好看
全拼:haha ni xiao qi lai zhen hao kan
首字母:nxqlzhk
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。
相關文章:
1. 解析原生JS getComputedStyle2. Idea 2019.3 本應該搜索到的插件卻搜索不到的解決方法3. SpringBoot+SpringCache實現兩級緩存(Redis+Caffeine)4. IntelliJ IDEA安裝插件的方法步驟5. 在JSP中使用formatNumber控制要顯示的小數位數方法6. ASP.NET MVC視圖頁使用jQuery傳遞異步數據的幾種方式詳解7. ASP.NET泛型三之使用協變和逆變實現類型轉換8. IntelliJ IDEA導入jar包的方法9. 每日六道java新手入門面試題,通往自由的道路10. 每日六道java新手入門面試題,通往自由的道路--多線程
