问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

【Python知识点共建】正则表达式

发布网友 发布时间:2024-09-30 21:27

我来回答

1个回答

热心网友 时间:2024-11-18 22:50

Python 正则表达式是什么

学习 Python 正则表达式离不开 re 模块,所以本篇博客会配合 re 模块进行编写。

re 库是 Python 中处理正则表达式的标准库,本篇博客介绍 re 库的同时,会简单介绍一下正则表达式语法, 如果想深入学习正则表达式,还需要好好下一番功夫。

怎么用正则表达式语法

正则表达式语法由字符和操作符构成,初期阶段掌握下述这些内容即可。

操作符说明例子.任何单个字符,极少不能匹配[]字符集,对单个字符给出取值范围[abc] 表示匹配 a、b、c,[a-z] 表示 a 到 z 单个字符[\^]非字符集,对单个字符给出排除范围[\^abc] 表示匹配 非 a、非 b、非 c 的单个字符*前一个字符 0 次或无限次扩展abc* 表示 ab、abc、abcc、abccc 等+前一个字符 1 次或无限次扩展abc+ 表示 abc、abcc、abccc 等?前一个字符 0 次或 1 次abc? 表示 ab、abc|左右表达式任意一个abc|def 表示 abc 或者 def{m}扩展前 1 个字符 m 次ab{2}c,表示 abbc{m,n}扩展前 1 个字符 m 到 n 次ab{1,2}c,表示 abc、abbc\^匹配字符串开头\^abc 表示 abc 在字符串开头\$匹配字符串结尾abc$ 表示 abc 在字符串结尾()分组标记,内部仅能使用 | 操作符(abc) 表示 abc,(a\d数字,等价于 [0-9]\w字符,等价于 [A-Za-z0-9]

以上表示仅仅为正则表达最基础部分内容,如果希望深入研究正则表达式,建议寻找更加全面的资料进行学习,本文只做药引。

re 库基本用法

re 库主要函数如下:

基础函数:compile;

功能函数:search、match、findall、split、finditer、sub。

在正式学习之前,先了解一下原生字符串。

在 Python 中,表示原生字符串,需要在字符串前面加上 r。 例如 my_str = 'i'am xiangpica' 在程序中会直接报错, 如果希望字符串中 ' 可以正常运行,需要加上转移字符 \,修改为 my_str = 'i\'am xiangpica'。 但这样结合上文正则表达式中的操作符,就会出现问题,因为 \ 在正则表达式中是有真实含义的, 如果你使用 re 库去匹配字符串中的 \,那需要使用 4 个反斜杠,为了避免这种情况出现,引入了原生字符串概念。

#?不使用原生字符串的正则表达式??"\\\\"#?使用原生字符串的正则表达式?r"\\"

在后文会有实际的应用。

接下来在学习一个案例,例如下述代码:

my_str='C:\number'print(my_str)C:umber

本段代码的输出效果如下,\n 被解析成了换行,如果想要屏蔽这种现象,使用 r 即可:

my_str=r'C:\number'print(my_str)

输出 C:\number。

re.search 函数

该函数用于,在字符串中搜索正则表达式匹配到的第一个位置的值,返回 match 对象。 函数原型如下:

re.search(pattern,string,flags=0)

需求:在字符串 梦想橡皮擦 good good 中匹配 橡皮擦。

import?remy_str='梦想橡皮擦?good?good'pattern?=?r'橡皮擦'ret?=?re.search(pattern,my_str)print(ret)

返回结果:<re.Match object; span=(2, 5), match='橡皮擦'>。

search 函数的第三个参数 flags 表示正则表达式使用时的控制标记。

re.I,re.IGNORECASE:忽略正则表达式的大小写;

re.M,re.MULTILINE:正则表达式中的 \^ 操作符能够将给定字符串的每行当做匹配的开始;

re.S,re.DOTALL:正则表达式中的 . 操作符能够匹配所有字符。

最后将匹配到的字符串进行输出,使用下述代码即可实现。

import?remy_str?=?'梦想橡皮擦?good?good'pattern?=?r'橡皮擦'ret?=?re.search(pattern,?my_str)if?ret:????print(ret.group(0))re.match 函数

该函数用于在目标字符串开始位置去匹配正则表达式,返回 match 对象,未匹配成功返回 None,函数原型如下:

re.match(pattern,string,flags=0)

一定要注意是目标字符串开始位置。

import?remy_str?=?'梦想橡皮擦?good?good'pattern?=?r'梦'?#?匹配到数据pattern?=?r'good'?#?匹配不到数据ret?=?re.match(pattern,?my_str)if?ret:????print(ret.group(0))

re.match 和 re.search 方法都是一次最多返回一个匹配对象,如果希望返回多个值, 可以通过在 pattern 里加括号构造匹配组返回多个字符串。

re.findall 函数

该函数用于搜索字符串,以列表格式返回全部匹配到的字符串,函数原型如下:

re.findall(pattern,string,flags=0)

测试代码如下:

my_str='C:\number'print(my_str)0re.split 函数

该函数将一个字符串按照正则表达式匹配结果进行分割,返回一个列表。 函数原型如下:

my_str='C:\number'print(my_str)1

re.split 函数进行分割的时候,如果正则表达式匹配到的字符恰好在字符串开头或者结尾, 返回分割后的字符串列表首尾都多了空格,需要手动去除,例如下述代码:

my_str='C:\number'print(my_str)2

运行结果:

my_str='C:\number'print(my_str)3

切换为中间的内容,则能正确的分割字符串。

my_str='C:\number'print(my_str)4

如果在 pattern 中捕获到括号,那括号中匹配到的结果也会在返回的列表中。

my_str='C:\number'print(my_str)5

运行结果,你可以对比带括号和不带括号的区别进行学习:

my_str='C:\number'print(my_str)6

maxsplit 参数表示最多进行分割次数, 剩下的字符全部返回到列表的最后一个元素, 例如设置匹配 1 次,得到的结果是 ['1梦想橡皮擦1', '1good1']。

re.finditer 函数

搜索字符串,并返回一个匹配结果的迭代器,每个迭代元素都是 match 对象。 函数原型如下:

my_str='C:\number'print(my_str)7

测试代码如下:

my_str='C:\number'print(my_str)8re.sub 函数

在一个字符串中替换被正则表达式匹配到的字符串,返回替换后的字符串, 函数原型如下:

my_str='C:\number'print(my_str)9

其中 repl 参数是替换匹配字符串的字符串,count 参数是匹配的最大替换次数。

C:umber0

运行之后,得到替换之后的字符串:

C:umber1re 库其它函数

其它比较常见的函数有:re.fullmatch(),re.subn(),re.escape(), 更多内容可以查阅 官方文档,获取一手资料。

扩展知识

使用 re 库匹配字符串之后,会返回 match 对象,该对象具备以下属性和方法。

你可以顺着这条线继续学习下去。

原文:https://juejin.cn/post/7102628540994027556

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
ups快递客服电话24小时 贷款记录在征信保留几年? 安徽徽商城有限公司公司简介 安徽省徽商集团新能源股份有限公司基本情况 安徽省徽商集团有限公司经营理念 2019哈尔滨煤气费怎么有税? 快手删除的作品如何恢复 体育理念体育理念 有关体育的格言和理念 什么是体育理念 婴幼儿口腔怎样保健 Python实用技术一:正则表达式 如何保健口腔? 哺乳期生气奶有毒吗 哺乳期妈妈生气奶有毒吗 造价工程师考出来有什么用 造价工程师证什么用 ...中林冲,鲁智深,武松,宋江的故事每人个三个,谢谢他 ...畸变DLC新物品与新恐龙代码一览介绍_方舟生存进化畸变DLC新物品与新... 风湿骨痛丸生产厂家 蒙药财富网公司介绍 甲、乙两种不含结晶水的固体物质的溶解度曲线如图所示。根据图示判断... 如图是甲、乙两种固体物质(不含结晶水)的溶解度曲线,下列叙述错误的是... 如图是甲、乙两种固体物质(不含结晶水)的溶解度曲线,下列叙述中错误的是... 如图是甲乙两种固体(均不含结晶水)的溶解度曲线,下列说法中正确的是... 如图表示甲、乙两种固体(均不含结晶水)物质饱和溶液的溶质质量分数随温... 下图是甲、乙两种固体(均不含结晶水)的溶解度曲线。下列说法中正确的是... ...一模)溶解度可表示物质溶解性的大小.如图是甲、乙、丙三种固体物质... 司机饮酒驾驶证会不会被吊销? ...形的底长5米,如果底延长1米, 面积就增加1.5平方米。原来三角形面积是... 深入了解Python正则表达式 怎样可以把苹果手机里的爱奇艺视频内容传到电脑上具体步骤是什么 Python正则表达式实例详解! app内购买项目啥意思? 培训费属什么经营范围 数学题目 . 下图是由边长分别4cm和6cm的两个正方形合成的图形,求阴影部分面积. 青花椒如何冷冻保存不发霉 怎么冷冻保存青花椒 如何煎鱼才不粘锅(如何煎鱼才不粘锅破皮) 为什么我在直播间打字他们看不到呢? 怎样回复一直在默默祝福我的人? 求求各位高手,cs1.6怎样慢跑!走起来没声音的!按什么键? 有一首歌里面说"默默的祝福 轻轻的问候 互道今生多保重"是什么歌,歌 ... 已知不等边三角形abc的三边长分别为整数abc,且满足a的平方加b的平方减... ...个长方形,这个长方形的面积是( )平方厘米.A.16B.24C. 荣耀60与荣耀70哪个好 荣耀70与荣耀60差距有哪些,后悔没看,买错了! 房屋交易土地使用权是否应随房屋过户? 梦见别人跟我给钱的预兆 工程施工合同应向哪个部门备案?