Python的re.search()作用是什么,基本用法是怎样的
Admin 2022-07-29 群英技术资讯 1218 次浏览
re.search会匹配整个字符串,并返回第一个成功的匹配。如果匹配失败,则返回None
从源码里面可以看到re.search()方法里面有3个参数
pattern: 匹配的规则,
string : 要匹配的内容,
flags 标志位 这个是可选的,就是可以不写,可以写, 比如要忽略字符的大小写就可以使用标志位
flags 的主要内容如下
flags : 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:
2.1 search 简单的匹配
import re content = "abcabcabc" rex = re.search("c", content) print(rex)
打印结果如下
从内容我们可以看到span(2, 3) 这个应该是对应的下标,所以我们想获取匹配的下标可以使用span
match 是匹配的内容, 内容为c
2.2 获取匹配的下标
import re content = "abcabcabc" rex = re.search("c", content) print(rex.group())
打印结果如下
2.3 获取匹配的内容 ,使用group(匹配的整个表达式的字符串)
import re content = "abcabcabc" rex = re.search("c", content) print(rex.group())
打印结果如下
注意group 和span 不能同时使用, 否则会报错
2.4 使用标志位忽略匹配的大小写
import re content = "abcabcabc" rex = re.search("C", content, re.I) print(rex.group())
打印结果如下
这里使用大写字母C 忽略大小写之后也能匹配到c
2.5 使用search 匹配字符串里面的数组
import re content = "abc123abc" rex = re.search("\d+", content) print(rex.group())
打印结果
2.6 search 结合compile 使用
import re content = "abc123abc" rex_content = re.compile("\d+") rex = rex_content.search(content) print(rex.group())
打印结果
2.7 group 的使用
import re content = "abc123def" rex_compile = re.compile("([a-z]*)([0-9]*)([a-z]*)") rex = rex_compile.search(content) print(rex.group()) print(rex.group(0)) # group()和group(0) 一样匹配的是整体 print(rex.group(1)) # 匹配第一个小括号的内容 print(rex.group(2)) # 匹配第二个小括号的内容 print(rex.group(3)) # 匹配第三个小括号的内容
打印结果
group() 小括号里面不止有数字,可以是自定的内容如下
content = "zhangsanfeng108le" rex_compile = re.compile("(?P<name>[a-z]*)(?P<age>[0-9]*)") rex_content = rex_compile.search(content) print(rex_content.group()) print(rex_content.group("name")) # 这里效果等同于group(1) print(rex_content.group("age")) # 这里效果等同于group(2)
打印结果如下
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要介绍了Python查询oracle数据库速度慢的解决方案,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
这篇文章主要介绍了Python数据结构列表,本文重点内容主要是对列表数据结构的使用,在Python中,序列是一组按顺序排列的值。Python 有 3 种内置的序列类型:字符串、 元组和列表,下面一起进入文章了解更详细内容吧,需要的小伙伴可以参考一下</P><P>
内存映射通常可以提高I/O的性能,因为使用内存映射时,不需要对每个访问都建立一个单独的系统调用,也不需要在缓冲区之间复制数据,内核和用户都能很方便的直接访问内存。
在开发自用爬虫过程中,有的网页是utf-8,有的是gb2312,有的是gbk,如果不加处理,采集到的都是乱码,解决的方法是将html处理成统一的utf-8
我们有时候需要把一些机密文件发给多个客户,为了避免客户泄露文件,会在机密文件中添加水印。本文将利用Python实现批量为PDF添加水印,需要的可以参考一下
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008