首页 >类库下载 >java类库 > 正文

Java正则表达中Greedy Reluctant Possessive 的区别

原创2016-10-15 13:36:4301041
从Java的官方文档http://docs.Oracle.com/javase/7/docs/api/java/util/regex/Pattern.html中我们可以看到,正则表达式表示数量词的符号有三套,分别是Greedy(贪婪的)、Reluctant(勉强的)和Possessive(独占的)。其含意如下:

1.png

Greedy、Reluctant、Possessive的区别

实例说话

看上面的表格我们发现这三种数量词的含意都相同(如X?、X??、X?+都表示一次或一次也没有),但他们之间还是有一些细微的区别的。我们先来看一个例子:

1.Greedy

public static void testGreedy() {  
    Pattern p = Pattern.compile(".*foo");  
    String strText = "xfooxxxxxxfoo";  
    Matcher m = p.matcher(strText);  
    while (m.find()) {  
        System.out.println("matched form " + m.start() + " to " + m.end());  
    }  
}

结果:

matched form 0 to 13

2.Reluctant

public static void testReluctant() {  
    Pattern p = Pattern.compile(".*?foo");  
    String strText = "xfooxxxxxxfoo";  
    Matcher m = p.matcher(strText);  
    while (m.find()) {  
        System.out.println("matched form " + m.start() + " to " + m.end());  
    }  
}

结果:

matched form 0 to 4

matched form 4 to 13

3.Possessive

public static void testPossessive() {  
    Pattern p = Pattern.compile(".*+foo");  
    String strText = "xfooxxxxxxfoo";  
    Matcher m = p.matcher(strText);  
    while (m.find()) {  
        System.out.println("matched form " + m.start() + " to " + m.end());  
    }  
}

结果:

//未匹配成功

原理讲解

Greedy数量词被称为“贪婪的”是因为匹配器被强制要求第一次尝试匹配时读入整个输入串,如果第一次尝试匹配失败,则从后往前逐个字符地回退并尝试再次匹配,直到匹配成功或没有字符可回退。

模式串:.*foo

查找串:xfooxxxxxxfoo

结果:matched form 0 to 13

其比较过程如下

1.png

Reluctant采用与Greedy相反的方法,它从输入串的首(字符)位置开始,在一次尝试匹配查找中只勉强地读一个字符,直到尝试完整个字符串。

模式串:.*foo

查找串:xfooxxxxxxfoo

结果:matched form 0 to 4

matched form 4 to 13

其比较过程如下

1.png

Possessive数量词总是读入整个输入串,尝试一次(仅且一次)匹配成功,不像Greedy,Possessive从不回退,即便这样做也可能使整体匹配成功。

模式串:.*foo

查找串:xfooxxxxxxfoo

结果:

//未匹配成功

其比较过程如下

1.png

参考文章:http://docs.oracle.com/javase/tutorial/essential/regex/quant.html

再来看看几个例子:

模式串:.+[0-9]

查找串:abcd5aabb6

结果:matched form 0 to 10

模式串:.+?[0-9]

查找串:abcd5aabb6

结果:matched form 0 to 4

模式串:.{1,9}+[0-9]

查找串:abcd5aabb6

结果:matched form 0 to 10

模式串:.{1,10}+[0-9]

查找串:abcd5aabb6

结果:匹配失败

php中文网最新课程二维码

声明:本文原创发布php中文网,转载请注明出处,感谢您的尊重!如有疑问,请联系admin@php.cn处理

相关文章

相关视频


网友评论

文明上网理性发言,请遵守 新闻评论服务协议

我要评论
  • 专题推荐

    推荐视频教程
  • javascript初级视频教程javascript初级视频教程
  • jquery 基础视频教程jquery 基础视频教程
  • 视频教程分类