Python去除字符串中的字符的代码是什么
Admin 2022-08-10 群英技术资讯 836 次浏览
本篇内容介绍了“Python去除字符串中的字符的代码是什么”的有关知识,在实际项目的操作过程或是学习过程中,不少人都会遇到这样的问题,接下来就让小编带大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!实际案例:
(1)过滤掉用户输入前后多余的空白字符:' nick2008@gmail.com '
(2)过滤某windows下编辑文本中的'\r':'hello world\r\n'
(3)去掉文本中的unicode组合符号(调音):u'ní hǎo, chī fàn'(或 èěéēàǎā)
解决方案;
方法1:字符串strip(),lstrip(),rstrip()方法去掉字符串两端字符。
方法2:删除单个固定位置的字符,可以使用切片+拼接的方式。
方法3:字符串的replace()替换方法或正则表达式re.sub()删除任意位置字符。(通用)
方法4:字符串translate()方法,可以同时删除多种不同字符。
# 方法1:strip类的方法
# 去掉字符串两端的字符
s = ' abc 123 '
'''
str.strip方法介绍:
strip([chars]) -> string or unicode
chars不指定默认情况下去掉空白字符(空格,\n,\t,\r)
'''
# 去掉两端空白,但保留了中间的空白
print(s.strip())
# 只去掉左端的空白
print(s.lstrip())
# 只去掉右端的空白
print(s.rstrip())
s2 = '---abc+++'
# 去掉s2中的加减
print(s2.strip('-+'))
# 方法2:删除固定位置字符,切片+拼接
s3 = 'abc:123'
# 只删除固定位置的冒号
s4 = s3[0:3] + s3[4:]
print(s4)
# 方法3:
'''
因为第1种方法不能删除中间的某些字符,只能在两端进行删除,
第3种就能完成删除中间某些字符的事情。
'''
s5 = '\tabc\t123\txyz'
# 清除s5中的所有\t,可以使用字符串替换replace,
# 但是这种方式只能替换一种
print(s5.replace('\t', ''))
s6 = '\tabc\t123\txyz\ropq\r'
import re
# 去除s6中的\t和\r
print(re.sub('[\t\r]', '', s6))
# 方法4:
'''
str.translate方法介绍:
S.translate(table) -> string
table如果是None不做任何映射,如果存在就是一个字符映射到另一个字符上去的表;
'''
s7 = 'abc1230323xyz'
# 现在对s7字符串进行加密,加密规则是将其中a全部替换成x,
# b替换成y,c替换成z,反过来将其中的xyz分别替换成abc
# 构建映射表
make = str.maketrans('abcxyz', 'xyzabc')
print(make)
# 对s7字符串进行加密转换
print(s7.translate(make))
s8 = 'abc\refg\n2342\t'
# 删除s8中\r,\n,\t,构建映射表str_trans
str_trans = str.maketrans('', '', '\t\r\n')
print(s8.translate(str_trans))
# 去掉音标符号
u = u'nǐ hǎo, chī fàn'
import unicodedata, sys
# 将原始输入标准化为分解形式字符
a = unicodedata.normalize('NFD', u)
'''
使用dict.fromkeys() 方法构造一个字典,每个Unicode和音调作为键,对应的值全部为None
sys.maxunicode : 给出最大Unicode代码点的值的整数,即1114111(十六进制的0x10FFFF)。
unicodedata.combining:将分配给字符chr的规范组合类作为整数返回。如果未定义组合类,则返回0
这样我们就成功将所有组合类的值全部设置为None
'''
cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode)
if unicodedata.combining(chr(c)))
# 调用translate函数删除所有音调
print(a.translate(cmb_chrs))
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
有的时候我们写的东西不想让别人看到,会设置密码来加密。在Python中,我们写的字符字符不想被别人看到,保护自己的隐私,会选择加密。本文介绍Python字符串加密的五种方法:url编码、base64、ascii、md5 Unicode转中文。具体代码如下:
这篇文章主要介绍了python 列表生成式的相关资料,帮助大家更好的理解和学习python开发,感兴趣的朋友可以了解下
这篇文章主要为大家介绍了PyHacker实现网站后台扫描器编写指南,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
这篇文章我们来了解python序列的相关内容,下文将给大家介绍python序列的入门知识,包括序列的概念,序列的类型,序列的方法及特性等等,对新手学习和理解python序列有帮助,大家可以了解看看吗,接下来就跟随小编一起学习一下吧!
我们知道线程池在python爬虫应用中,能提高爬虫的效率,但是很多朋友不了解python线程池还有很多其他优点,下面我们一起来看看python线程池使用的好处,下文还介绍了python线程池实例,有需要的朋友可以了解一下。
成为群英会员,开启智能安全云计算之旅
立即注册关注或联系群英网络
7x24小时售前:400-678-4567
7x24小时售后:0668-2555666
24小时QQ客服
群英微信公众号
CNNIC域名投诉举报处理平台
服务电话:010-58813000
服务邮箱:service@cnnic.cn
投诉与建议:0668-2555555
Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008