问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

正则表达式 是否会重复匹配

发布网友 发布时间:2022-04-23 05:24

我来回答

3个回答

懂视网 时间:2022-04-23 09:45

这次给大家带来正则的重复匹配使用详解,正则重复匹配使用的注意事项有哪些,下面就是实战案例,一起来看一下。

本文实例讲述了正则表达式教程之重复匹配。分享给大家供大家参考,具体如下:

注:在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。

一、有多少个匹配

前面几篇讲的都是匹配一个字符,但是一个字符或字符集合要匹配多次,应该怎么做呢?比如要匹配一个电子邮件地址,用之前说到的方法,可能有人会写出像w@w.w这样的正则表达式,但这个只能匹配到像a@b.c这样的地址,明显是不正确的,接下来就来看看如何匹配电子邮件地址。

首先要知道电子邮件地址的组成:以字母数字或下划线开头的一组字符,后面跟@符号,再后面是域名,即用户名@域名地址。不过这也跟具体的邮箱服务提供商有关,有的在用户名中也允许.字符。

1、匹配一个或多个字符

要想匹配同一个字符(或字符集合)的多次重复,只要简单地给这个字符(或字符集合)加上一个+字符作为后缀就可以了。+匹配一个或多个字符(至少一个)。如:a匹配a本身,a+将匹配一个或多个连续出现的a;[0-9]+匹配多个连续的数字。

注意:在给一个字符集合加上+后缀的时候,必须把+放在字符集合的外面,否则就不是重复匹配了。如[0-9+]这样就表示数字或+号了,虽然语法上正确,但不是我们想要的了。

文本:Hello, mhmyqn@qq.com or mhmyqn@126.com is my email.

正则表达式:w+@(w+.)+w+

结果:Hello, 【mhmyqn@qq.com】 or 【mhmyqn@126.com】 is my email.

分析:w+可以匹配一个或多个字符,而子表达式(w+.)+可匹配像xxxx.edu.这样的字符串,而最后不会是.字符结尾,所以后面还会有一个w+。像mhmyqn@xxxx.edu.cn这样的邮件地址也会匹配到。

2、匹配零个或多个字符

匹配零个或多个字符使用元符*,它的用法和+完全一样,只要把它放在一下字符或字符集合的后面,就可以匹配该字符(或字符集合)连续出现零次或多次。如正则表达式ab*c可以匹配ac、abc、abbbbbc等。

3、匹配零个或一个字符

匹配零个或一个字符使用元字符?。像上一篇说到的匹配一个空白行使用正则表达式 ,但在Unix和Linux中不需要 ,就可以使用元字符?, ? ? 这样既可匹配windows中的空白行,也可匹配Unix和Linux中的空白行。下面来看一个匹配http或https协议的URL的例子:

文本:The URL is http://www.mikan.com, to connect securely use https://www.mikan.cominstead.

正则表达式:https?://(w+.)+w+

结果:The URL is 【http://www.mikan.com】, to connect securely use 【https://www.mikan.com】 instead.

分析:这个模式以https?开头,表示?之前的一个字符可以有,也可以没有,所以它能匹配http或https,后面部分和前一个例子一样。

二、匹配的重复次数

正则表达式里的+、*和?解决了很多问题,但是:

1)+和*匹配的字符个数没有上限。我们无法为它们将匹配的字符个数设定一个最大值。

2)+、*和?至少匹配一个或零个字符。我们无法为它们将匹配的字符个数另行设定一个最小值。

3)如果只使用*和+,我们无法把它们将匹配的字符个数设定为一个精确的数字。

正则表达式里提供了一个用来设定重复次数的语法,重复次数要用{和}字符来给出,把数值写在它们中间。

1、为重复匹配次数设定一个精确值

如果想为重复匹配次数设定一个精确的值,把那个数字写在{和}之间即可。如{4}表示它前面的那个字符(或字符集合)必须在原始文本中连续重复出现4次才算是一个匹配,如果只出现了3次,也不算是一个匹配。

如前面几篇中说到的匹配页面中颜色的例子,就可以用重复次数来匹配:#[[:xdigit:]]{6}或#[0-9a-fA-F]{6},POSIX字符在java中是#\p{XDigit}{6}。

2、为重复匹配次数设定一个区间

{}语法还可以用来为重复匹配次数设定一个区间,也就是为重复匹配次数设定一个最小值和最大值。这种区间必须以{n, m}这样的形式给出,其中n>=m>=0。如检查日期格式是否正确(不检查日期的有效性)的正则表达式(如日期2012-08-12或2012-8-12):d{4}-d{1,2}-d{1,2}。

3、匹配至少重复多少次

{}语法的最后一种用法是给出一个最小的重复次数(但不必给出最大重复次数),如{3,}表示至少重复3次。注意:{3,}中一定要有逗号,而且逗号后不能有空格。否则会出错。

来看一个例子,使用正则表达式把所有金额大于$100的金额找出来:

文本:

$25.36

$125.36

$205.0

$2500.44

$44.30

正则表达式:$d{3,}.d{2}

结果:

$25.36

【$125.36】

【$205.0】

【$2500.44】

$44.30

+、*、?可以表示成重复次数:

+等价于{1,}

*等价于{0,}

?等价于{0,1}

三、防止过度匹配

?只能匹配零个或一个字符,{n}和{n,m}也有匹配重复次数的上限,但是像*、+、{n,}都没有上限值,这样有时会导致过度匹配的现象。

来看匹配一个html标签的例子

文本:

Yesterday is <b>history</b>,tomorrow is a <B>mystery</B>, but today is a <b>gift</b>.

正则表达式:<[Bb]>.*</[Bb]>

结果:

Yesterday is 【<b>history</b>,tomorrow is a <B>mystery</B>, but today is a <b>gift</b>】.

分析:<[Bb]>匹配<b>标签(不区分大小写),</[Bb]>匹配</b>标签(不区分大小写)。但结果却不是预期的那样有三个,第一个</b>标签之后,一直到最后一个</b>之间的东西全部匹配出来了。

为什么会这样呢?因为*和+都是贪婪型的元字符,它们在匹配时的行为模式是多多益善,它们会尽可能从一段文本的开头一直匹配到这段文本的末尾,而不是从这段文本的开头匹配到碰到第一个匹配时为止。

当不需要这种贪婪行为时,可以使用这些元字符的懒惰型版本。懒惰意思是匹配尽可能少的字符,与贪婪型相反。懒惰型元字符只需要给贪婪型元字符加上一个?后缀即可。下面是贪婪型元字符的对应懒惰型版本:

* *?

+ +?

{n,} {n,}?

所以上面的例子中,正则表达式只需要改成<[Bb]>.*?</[Bb]>即可,结果如下:

<b>history</b>

<B>mystery</B>

<b>gift</b>

四、总结

正则表达式的真下威力体现在重复次数匹配方面。这里介绍了+、*、?几种元字符的用法,如果要精确的确定匹配次数,使用{}。元字符分贪婪型和懒惰型两种,在需要防止过度匹配的场合下,请使用懒惰型元字符来构造正则表达式。在下一篇中将会介绍位置匹配。

相信看了本文案例你已经掌握了方法,更多精彩请关注Gxl网其它相关文章!

推荐阅读:

正则表达式教程的位置匹配教程(附代码)

用php与js实现正则匹配数字和字母组合的密码

热心网友 时间:2022-04-23 06:53

当然不会重复匹配了。第一次是str[0] str[1],那么第二次是str[2] str[3]。

我们可以举例子:

function RegExpTest(){ 
var src="ssssssssssssssss"; 
var re = /[s]{2}/g; // 注意g将全文匹配,不加将永远只返回第一个匹配。 
var arr; 
while((arr = re.exec(src)) !=null){ //exec使arr返回匹配的第一个,while循环一次将使re在g作用寻找下一个匹配。 
document.write(arr.index + "-" + arr.lastIndex + ":" + arr + "<br/>"); 
for(key in arr){ 
document.write(key + "=>" + arr[key] + "<br/>"); 

document.write("<br/>"); 


window.onload = RegExpTest();

把以上代码放到<script>标签里面执行就可以看到如下结果:

可以看到,第一次匹配时是从0开始匹配,第二次是从2开始匹配。所以是不重复的匹配。

热心网友 时间:2022-04-23 08:11

mark一下,是个好问题。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
嘉容的意思是什么 look!the girl is walking __the road.A,crossB,across!crossing D... 美甲打磨头坏了怎么修 美甲打磨机用了不合适的打磨头会怎么样 卸美甲用什么打磨比较好? 美甲钨钢打磨头和陶瓷打磨头哪个更容易起热呢?这两种打磨头有哪些区别呢... 美甲打磨机到底怎么用 自来水管里流出蓝色的水是怎么回事? 最近有啥动漫好看的 推荐一下最近3年好看的动漫。。。 西安市什么地方可以买到花种子? 这是几朵银耳? 中国联通获取不了短信随机密码 貌描写仙人掌的诗句是谁写的 古代关于仙人掌的诗句 如何获取随机码? 李白赞美仙人掌的诗句是什么? Java如何在正则表达式中匹配重复单词 罚款的支出应该什么做帐 税收罚款支出计入什么科目 春节400字作文 有关药品销售的技巧 济宁的春节作文400字好结尾,要长 怎样给幼儿讲解风车转动的原理给幼儿园大班孩子讲科学课“小风车”最好能帮忙想份教案 为什么出外面混的不好连家人打来的电话都不想接 一个整天说爱你的男人一旦发生事情了连电话都不敢接男人还能要吗 为什么不想接触人和事,连电话都不想接? 连要打电话和他说分手,他都不敢接,窝囊! 为什么朋友打电话来我都不敢接 一个男的会因为胆小不敢在一起而连电话都不敢接吗 什么是银耳 有图片最好 玫瑰花种子哪里有卖的?玫瑰花苗哪里有批发的? 惠州有买花卉种子的地方吗 猪肚用什么东西洗操能去除臭味啊 汨罗市是属于洞庭湖平原吗? 汨罗镇的湖南省岳阳市汨罗市汨罗镇 正则表达式 匹配中文 [一,二,三,四,五]一次或多次但不能重复,如果重复就只匹配重复前的? 可糖美瞳是中国的吗 中国轨道交通大学排名? 甜食到底该不该吃? 在全国的地铁中,广州地铁规模排行榜中是多少 中国的城市地铁覆盖率有排名吗,截止到2012 轨道交通工程排名是 全球哪些公司可以做轨道交通牵引系统以及他们在行业的排名情况 op里的藏文软件叫什么 历届合川中学中考分数和录取人数 C# 正则匹配问题 单个字符重复匹配 汽车美容和汽车维修选哪个比较好? 汽车维修与保养与汽车美容是不是一样,具体有什么不同? 汽车美容和汽车维修的区别