python简繁体的转换怎样实现?一文带你看懂
Admin 2021-08-18 群英技术资讯 1378 次浏览
这篇文章给大家分享的是有python简繁体的转换的内容,因为简体和繁体都是中文的表现形式,我们在一些场景可能会使用到,而且小编觉得挺有意思的,因此分享给大家做个参考,感兴趣的朋友来一起跟随小编看看吧。
如今,世界上存在两种中文,一种是中文简体,一种是中文繁体。如果要完全掌握中文语言的自然语言处理,那么简繁都不可避免。所以,掌握了简体与繁体的转换,往往能够事半功倍。
而HanLP也提供了简繁转换的类:CharTable,用它来执行字符正规化。比如简体转换繁体,全角转换半角,大写转换小写,都可以使用该类来实现。
下面,我们来直接使用CharTable进行一段诗词的繁体到简单的转换。具体代码如下所示:
if __name__ == "__main__":
CharTable=JClass('com.hankcs.hanlp.dictionary.other.CharTable')
print(CharTable.convert('空山新雨後,天�馔�砬铩C髟滤砷g照,清泉石上流。 竹喧�w浣女,��酉�O舟。�S意春芳歇,王�O自可留。'))
运行之后,效果如下:

不过,繁体发展并不是仅仅只有一种。汉语历史悠久,发展至今在字符级别存在着“一简对多个繁体”和“一繁对多简”的现象。为此,HanLP实现了“简体”、“繁体”、“台湾繁体”、“香港繁体”间的互相转换功能,力图将简繁转换做到极致。
HanLP中文分类如下:
尽然有这种多繁体,那么转换起来也肯定有很多种。下面,我们来分别实现这些字体之间的互相转换。完整代码如下所示:
if __name__ == "__main__":
text_tw="空山新雨後,天�馔�砬铩C髟麦��g照,清泉石上流。 竹喧�w浣女,��酉�O舟。�S意春芳歇,王�O自可留。"
text_sc = "空山新雨后,天气晚来秋。明月松间照,清泉石上流。 竹喧归浣女,莲动下渔舟。随意春芳歇,王孙自可留。"
text_hk="空山新雨後,天�馔�砬铩C髟麦��g照,清泉石上流。 竹喧�w浣女,��酉�O舟。�S意春芳歇,王�O自可留。"
text_st="空山新雨後,天�馔�砬铩C髟麦��g照,清泉石上流。 竹喧�w浣女,��酉�O舟。�S意春芳歇,王�O自可留。"
#简体转台湾繁体
print(HanLP.s2tw(text_sc))
#台湾繁体转简体
print(HanLP.tw2s(text_tw))
#简体转香港繁体
print(HanLP.s2hk(text_sc))
#香港繁体转简体
print(HanLP.hk2s(text_hk))
#香港繁体转台湾繁体
print(HanLP.hk2tw(text_hk))
# 台湾繁体转香港繁体
print(HanLP.tw2hk(text_tw))
#香港台湾繁体转标准繁体转换
print(HanLP.tw2t(text_tw))
print(HanLP.hk2t(text_hk))
# 标准繁体转换转香港台湾繁体
print(HanLP.t2tw(text_st))
print(HanLP.t2hk(text_st))
运行之后,效果如下:

以上就是关于python实现简繁体的转换的介绍,希望文本对大家学习python的使用有帮助,想要了解更多python的应用技巧和方法,大家可以继续关注其他文章。
文本转载自脚本之家
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
类(class),作为代码的父亲,可以说它包裹了很多有趣的函数和方法以及变量,下面我们试着简单创建一个吧。
这篇文章主要介绍Python绘图库Matplotlib的用法,下文有绘制线型图、子图、散点图等等示例,有这方面学习需求的朋友可以参考学习,希望大家阅读完这篇文章能有所收获,下面就跟随小编来学习一下吧。
这篇文章主要介绍python中gin库的作用和使用,gin库还是比较实用的,因此分享给大家做个参考,希望大家阅读完这篇文章能有所收获,接下来小编带着大家一起了解看看。
一直在思索实现一个透明的窗体,然后可以基于这个窗体可以开发出各种好玩的应用(如桌面运动的小人、运动的小球、截图、录制GIF等等),今天无意间居然让我把其中一个最核心的技术难关突破了,我非常高兴,也借这个机会跟大家分享一下。
这篇文章主要介绍了pycharm debug 断点调试心得分享,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
成为群英会员,开启智能安全云计算之旅
立即注册关注或联系群英网络
7x24小时售前:400-678-4567
7x24小时售后:0668-2555666
24小时QQ客服
群英微信公众号
CNNIC域名投诉举报处理平台
服务电话:010-58813000
服务邮箱:service@cnnic.cn
投诉与建议:0668-2555555
Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 ICP核准(ICP备案)粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008