目录
- Python3 正则表达式
- 1.match函数
- 2.search函数
- 3. sub函数
- 4.compile函数
- 5.findall
- 6.finditer
- 7.split
- 总结
Python3 正则表达式
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。本文主要阐述re包中的主要函数。

在阐述re包中的函数之前,我们首先看议案正则表达式的模式,即使用特殊的语法来表示一个正则表达式。
1.match函数
- re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。
- 函数用法:re.match(pattern, string, flags=0)
- pattern: 所要匹配的正则表达式string: 要匹配的字符串flags: 标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。
- re.I 忽略大小写
- re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
- re.M 多行模式re.S 即为' . ‘并且包括换行符在内的任意字符(' . '不包括换行符)
- re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
- re.X 为了增加可读性,忽略空格和' # '后面的注释
匹配对象方法:
- group(num=0): 匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。
- groups(): 返回一个包含所有小组字符串的元组,从 1 到 所含的小组号。
import re
print(re.match("xixi", "xixi_haha_heihei").group())
xixi
line = 'Cats are smarter than dogs'
b = re.match(r'(.*) are (.*?) .*', line, re.M|re.I)
print(b.group()) # 返回所有
print(b.group(1)) # 返回第一组,即(.*)对应的
print(b.group(2)) # 返回第二组,即(.*?)对应的
Cats are smarter than dogs
Cats
smarter
2.search函数
re.search 扫描整个字符串并返回第一个成功的匹配。
函数用法:re.search(pattern, string, flags=0)
print(re.match('heihei', 'xixi_haha_heihei'))
print(re.search('heihei', 'xixi_haha_heihei').group())
None
heihei
line = 'Cats are smarter than dogs'
b = re.search(r'(.*) are (.*?) .*', line, re.M|re.I)
print(b.group()) # 返回所有
print(b.group(1)) # 返回第一组,即(.*)对应的
print(b.group(2)) # 返回第二组,即(.*?)对应的
Cats are smarter than dogs
Cats
smarter
search和match的区别
match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而search匹配整个字符串,直到找到一个匹配。
3. sub函数
re提供了re.sub来替换字符串中的匹配项。
函数用法:re.sub(pattern, repl, string, count=0, flags=0)
- pattern : 正则中的模式字符串。
- repl : 替换的字符串,也可为一个函数。
- string : 要被查找替换的原始字符串。
- count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
- flags : 编译时用的匹配模式,数字形式。
phone = '133-3333-3333 # this is a phone number'
num = re.sub(r'#.*$', '', phone)
print('phone num', num)
# 移除注释,找到以#开头的。
num = re.sub(r'\D', '', phone)
print('phone num', num)
# 移除非数字内容
phone num 133-3333-3333
phone num 13333333333
repl是函数的情况
def double(matched):
value = int(matched.group('value'))
return str(value * 2)
s = 'A233Sfd34'
print(re.sub('(?P<value>\d+)', double, s))
A466Sfd68
4.compile函数
compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用。
函数使用:re.compile(pattern, flags)
pattern = re.compile(r'/d+')
m = pattern.match('ones123412')
print(m)
None
5.findall
在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。
注意:match和search是匹配一次,但是findall是匹配所有。
函数使用:findall(string, pos, endpos)
- string 待匹配的字符串。
- pos 可选参数,指定字符串的起始位置,默认为 0。
- endpos 可选参数,指定字符串的结束位置,默认为字符串的长度。
pattern = re.compile(r'\d+')
result1 = pattern.findall('xixixix 123 heihiehei 456')
result2 = pattern.findall('xixixix 123 heihiehei 456', 0, 15)
print(result1)
print(result2)
['123', '456']
['123']
6.finditer
和 findall 类似,在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。
ittt = re.finditer(r'\d+', '12dsfasdf123asdf534')
for ttt in ittt:
print(ttt.group())
12
123
534
7.split
split 方法按照能够匹配的子串将字符串分割后返回列表。
函数使用:
re.split(pattern, string, maxsplit=0, flags=0)
- pattern: 匹配的正则表达式
- string: 要匹配的字符串。
- maxsplit: 分隔次数,maxsplit=1 分隔一次,默认为 0,不限制次数。
- flags: 标志位,用于控制正则表达式的匹配方式,
print(re.split('\W+', 'xxixix, xixixi, hehiehei'))
print(re.split('(\W+)', ' xxixix, xixixi, hehiehei'))
['xxixix', 'xixixi', 'hehiehei']
['', ' ', 'xxixix', ', ', 'xixixi', ', ', 'hehiehei']
总结
本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注的更多内容!
相关推荐:
SEO字:如何通过精准关键词提升网站流量与排名,赣州于都网站推广
线上AI写作免费一键生成,轻松提升写作效率,解放创作思维
seo相关知识是什么,seo相关技术 ,ai写作讯飞星火认知大模型
怎样用AI写文章?快速高效创作新技能!
SEO快速提升SEO排名的有效策略:让你的网页飞跃搜索引擎,ai调色食物
用AI征文工具,轻松创作出精彩文章!
SEO包月服务:助力企业提升网站排名与流量的长期利器,网站建设流程 报读文库
优化整站,让网站飞速增长,打造行业竞争力,广东网站建设与维护
文章续写AI:提升写作效率,创意无限
为什么选择收录网站是企业在线营销的必备策略,全网营销与推广
seo需要什么人才,seo需要做什么工作 ,探索ai照片
SEO出超:如何通过精准优化实现网站流量大爆发,营销推广方式联系f火15星
seo软件工具,seo软件是什么 ,AI妆容
SEO优化关键技巧:提升网站排名的实战攻略,科大讯飞ai论文写作软件
SEO代做:让你的企业轻松登顶搜索引擎,快速提升曝光率,seo 提高注册量
AI网页版智能问答,开启智慧沟通新时代,ai梦境档案用不了手柄
AI文章概括缩写:让内容高效获取的智能工具,ai 处理文件
为什么“蜘蛛弛查询”能成为提升网站排名的秘密武器?,惠州网站推广v1戈seo24
SEO韩国:为您开启国际市场的增长之门,seo文章标题有哪些
SEO客服:如何提升客户体验与业务转化的双赢策略,鄂州网站建设公司教程
SEO通过-如何通过SEO优化让你的业务在搜索引擎中脱颖而出,保定网站建设推广专家
怎么用AI生成文章?全新写作方式的揭秘与应用指南
中国AI软实力崛起:技术创新与产业应用的完美融合,seo0066
AI热门软件,未来科技的钥匙
怎么用AI润色文章,让你的文稿瞬间高大上
SEO希望:如何通过SEO优化实现网站突破,迈向成功之路,品牌网站推广软件
亚马逊站内seo是什么优化,亚马逊seo关键词优化软件 ,ai画卡通章鱼
SEO优化如何提升网站排名,驾驭搜索引擎流量,三亚网站推广方法
seo需要懂什么源码,seo需要懂什么源码技术 ,ai 纤维
什么是seo发外链,seo外链类型有哪些 ,小小苏ai
AI智能工具的无限可能:未来已来,你准备好了吗?
用AI写的文章算原创吗?真相揭示,带你深度思考!
AI免费写文章生成器高效写作新革命
SEO薪资这些,你也能月入过万!,天水网站建设公司
未来写作新模式文章撰写AI如何助力内容创作
ChatGPT恢复正常使用时间,提升你的工作与生活效率,联想电脑AI0510
seo诊断什么意思,seo诊断a5 ,约瑟夫ai
互联网留痕:数字时代的隐形轨迹与自我管理,灯塔网站推广包年多少钱
seo要学什么语言,做seo需要什么语言 ,ai martino
SEO公司核心业务是什么?揭秘提升网站排名的奥秘,写作助手ai一键生成作文在线
SEO添加:提升网站流量与排名的必备策略,seo团队成员中国人
ChatGPTO1Pro模型:开启AI新纪元,免费应用带来无尽可能,苹果上的ai写作在哪里
什么是“神马关键词”?如何用它提升你的网络营销效果?,新闻发布网站怎么做推广
AI网页生成:轻松构建智能网站,提升品牌竞争力,杭州专业ai智能教育
用AI批量下载工具,高效管理你的文件和资源
SEO工装裤-打造时尚与实用兼备的工作利器,ai画中国爸爸辅导孩子写作业
SEO优化知识全解析:提升网站排名的秘密武器,ai出错合集
SEO桔子:提升网站排名的必备法宝,seo外包销售
seo,seoul city ,ai精洗
SEO架构:提升网站流量的核心策略,东营南江全平台营销推广