java开源好用的简繁转换类库推荐

作者:一灰灰 时间:2022-11-09 06:31:32 

引言

今天给大家介绍一个非常有意思类库,基于java实现的简繁体转换,适用于后端、android等开发领域

源码地址:* liuyueyi/quick-chinese-transfer: 简繁转换,支持香港繁体,台湾繁体与简体互转

1. 实例体验

以maven做项目管理,可以直接从中央仓库下载,再pom文件中添加以下依赖即可

<!-- https://mvnrepository.com/artifact/com.github.liuyueyi/quick-transfer-core -->
<dependency>
   <groupId>com.github.liuyueyi</groupId>
   <artifactId>quick-transfer-core</artifactId>
   <version>0.2.6</version>
</dependency>

说明:0.2.6版本于2022-08-11上传,若在mvn仓库搜索不到,不要慌,可以先使用0.2.5

如果是gradle做项目管理,依赖同样很简单

// https://mvnrepository.com/artifact/com.github.liuyueyi/quick-transfer-core
implementation 'com.github.liuyueyi:quick-transfer-core:0.2.6'

此外,针对网络不好的小伙伴,也可以通过jitpack的方式导入依赖,具体姿势如下

maven依赖

<repositories>
   <repository>
       <id>jitpack.io</id>
       <url>https://jitpack.io</url>
   </repository>
</repositories>
<dependency>
   <groupId>com.github.liuyueyi.quick-chinese-transfer</groupId>
   <artifactId>quick-transfer-core</artifactId>
   <version>0.2.6</version>
</dependency>

gradle依赖

allprojects {
repositories {
...
maven { url 'https://jitpack.io' }
}
}
dependencies {
   implementation 'com.github.liuyueyi.quick-chinese-transfer:quick-transfer-core:0.2.6'
}

环境准备完毕之后,可以直接进行使用了,使用姿势非常非常非常的简单

public void testTrans() {
   String text = "这斜月三星洞…… 长寿面,孙悟空,猪八戒,唐僧,沙和尚,白龙马,李靖,托塔天王, 戏说西游,许多人都这样说,收拾一下,拾金不昧;纔=才";
   // 简体转繁体
   String out = ChineseUtils.s2t(text);
   System.out.println("s2t -->" + out);
   // 简体转香港繁体
   String hkOut = ChineseUtils.s2hk(text);
   System.out.println("s2hk -->" + hkOut);
   // 简体转台湾繁体
   String twOut = ChineseUtils.s2tw(text);
   System.out.println("s2tw --> " + twOut);
   // 繁体转简体
   String origin = ChineseUtils.t2s(out);
   System.out.println("t2s -->" + origin);
   // 香港繁体转简体
   System.out.println("hk2s -->" + ChineseUtils.hk2s(hkOut));
   // 台湾繁体转简体
   System.out.println("tw2s -->" + ChineseUtils.tw2s(twOut));
}

入口类 ChineseUtils 支持简繁互转,这里区分了香港繁体 + 台湾繁体,两者的主要区别在于某些字、词的叫法不一样

通常来讲,使用最简单的简繁互即可

上面的case输出结果如下:

s2t -->這斜月三星洞&hellip;&hellip; 長壽麪,孫悟空,豬八戒,唐僧,沙和尚,白龍馬,李靖,托塔天王, 戲說西遊,許多人都這樣說,收拾一下,拾金不昧;纔=才
s2hk -->這斜月三星洞&hellip;&hellip; 長壽麪,孫悟空,豬八戒,唐僧,沙和尚,白龍馬,李靖,托塔天王, 戲説西遊,許多人都這樣説,收拾一下,拾金不昧;才=才
s2tw --> 這斜月三星洞&hellip;&hellip; 長壽麵,孫悟空,豬八戒,唐僧,沙和尚,白龍馬,李靖,托塔天王, 戲說西遊,許多人都這樣說,收拾一下,拾金不昧;才=才
t2s -->这斜月三星洞&hellip;&hellip; 长寿面,孙悟空,猪八戒,唐僧,沙和尚,白龙马,李靖,托塔天王, 戏说西游,许多人都这样说,收拾一下,拾金不昧;才=才
hk2s -->这斜月三星洞&hellip;&hellip; 长寿面,孙悟空,猪八戒,唐僧,沙和尚,白龙马,李靖,托塔天王, 戏说西游,许多人都这样说,收拾一下,拾金不昧;才=才
tw2s -->这斜月三星洞&hellip;&hellip; 长寿面,孙悟空,猪八戒,唐僧,沙和尚,白龙马,李靖,托塔天王, 戏说西游,许多人都这样说,收拾一下,拾金不昧;才=才

2. 进阶使用

简繁转换,核心在于词典的管理,改类库在首次实现转换的时候,会加载词典,并解析为内部的数据结构Dict;因此第一次调用时,会出现冷启动的耗时高问题

2.1 预热

基于此,可以再合适的地方先预热加载词典;官方提供了同步预热/异步预热两种方式,如

// 预热加载所有的词典
ChineseUtils.preLoad(true, TransType.values());
// 预加载简体转繁体词典
ChineseUtils.preLoad(true, TransType.SIMPLE_TO_TRADITIONAL);
// 预加载简繁互转词典
ChineseUtils.preLoad(true, TransType.SIMPLE_TO_TRADITIONAL, TransType.TRADITIONAL_TO_SIMPLE);

preLoad方法的第一个参数,就是用来控制同步还是异步的情况

后面的参数则为希望加载的词典

2.2 卸载

同样有了预热就有卸载,对于客户端的小伙伴来说可能更关注这一点的内存占用;对于不需要的词典,可以指定卸载

// 卸载所有词典
ChineseUtils.unLoad(TransType.values());
// 卸载简繁互转词典
ChineseUtils.unLoad(TransType.SIMPLE_TO_TRADITIONAL, TransType.TRADITIONAL_TO_SIMPLE);

2.3 通用方法

在第一节的使用实例中,提供了各种特有的方法来实现转换;同样也提供一个统一的方法,根据传参的词典类型来进行转换;适用于统一api接口的设计,根据传参来返回对应的结果场景

ChineseUtils.transfer("一灰灰blog", TransType.SIMPLE_TO_TRADITIONAL);

3. 小结

最后简单介绍下这个项目,没错这个项目目前是我再维护,核心实现主要来自 chinese-utils,那么为啥要独立搞一个呢? 原因如下

  • 这个项目不再维护了,最后一次提交在15年

  • 词典旧且,有问题的数据较多,所以我完全替换了它的默认词典,改用 HanLP 词典文件

  • 新特性增加(如港台繁体的区分支持,如预热加载)

  • 性能优化等(词典解析规则、匹配算法的改进等)

来源:https://juejin.cn/post/7130585503736266760

标签:java,开源,简繁转换,类库
0
投稿

猜你喜欢

  • C#反射之基础应用实例总结

    2023-08-29 04:50:56
  • Java中Map接口使用以及有关集合的面试知识点汇总

    2021-08-20 00:28:51
  • C#游戏开发之实现俄罗斯方块游戏

    2022-11-24 11:12:31
  • springboot2.3 整合mybatis-plus 高级功能(图文详解)

    2022-10-19 20:04:05
  • SpringBoot 2.x整合Log4j2日志的详细步骤

    2022-08-05 09:50:19
  • 如何使用Spring AOP预处理Controller的参数

    2022-09-11 10:01:56
  • SpringBoot中Dozer的使用小结

    2023-11-25 01:24:38
  • Java实现过滤掉map集合中key或value为空的值示例

    2021-05-25 10:26:17
  • java搭建ftp/sftp进行数据传递的全过程

    2023-11-29 15:08:10
  • Android自定义View绘图实现拖影动画

    2023-04-16 00:06:38
  • Zookeeper和Eureka哪个更好?

    2023-11-10 02:57:35
  • C#重写DataGridView

    2021-06-09 11:56:26
  • Android ActionBar使用教程

    2023-10-24 19:09:08
  • 关于C#结构体 你需要知道的

    2022-01-04 13:11:49
  • Android组合控件自定义标题栏

    2021-11-04 01:12:36
  • Android StickListView实现悬停效果

    2022-06-06 15:54:35
  • 轻松实现Android仿淘宝地区选择功能

    2022-02-25 03:01:13
  • Android解决viewpager嵌套滑动冲突并保留侧滑菜单功能

    2023-09-05 11:36:33
  • Java 常见的几种内存溢出异常的原因及解决

    2023-02-21 16:44:50
  • 解决Android WebView拦截url,视频播放加载失败的问题

    2023-10-24 02:22:25
  • asp之家 软件编程 m.aspxhome.com