本文實例講述了正規表示式教程之子表達式用法。分享給大家供大家參考,具體如下:
注:在所有例子中正則表達式匹配結果包含在源文本中的【和】之間,有的例子會使用java來實現,如果是java本身正則表達式的用法,會在對應的地方說明。所有java例子都在JDK1.6.0_13下測試通過。
一、問題引入
首先來看一個例子,有的短語如Windows 2000雖然是多個單字組成,但其實是一個整體,HTML頁面中可以使用非換行空格( 即non-breaking space)讓它在瀏覽器中顯示在一行上,現在來符合多個這樣的空格:
文字:Your operation systemis Windows 2000.
正規表示式:nbsp;{2,}
結果:Your operation systemis Windows
分析:這裡使用模式想匹配2個或2個以上的非換行空格,但是從結果可以看出,沒有匹配到任何東西,因為nbsp;{2,}這個模式只能匹配到像nbsp;; ;;;;;這樣以nbsp開頭,2個或2個以上連續分號的文字。
因為前面說過的重複匹配都是緊挨著重複匹配元字符之前的那個字符的多次重複,但是,如果我們想對一個字符串進行多次匹配,又該怎麼做呢?
二、子表達式
從上面我們引出子表達式。子表達式是一個大的表達式的一部分,把一個表達式劃分為多個子表達式的目的是為了把那些子表達式當作一個獨立的元素來使用。子表達式必須用(和)括起來。所以,前面的例子中正規表示式應該寫成(nbsp;){2,}。
來看一個匹配有效年份的正則:
文本:1988-11-13
正則表達式:(19|20)d{2}
結果:【1988】-11-13
分析:這個例子中,為了排除沒有意義的年份,把年份的前兩位數字限定為19或20,|是正規表示式裡的或操作符。這裡必須把19|20放到一個子表達式裡,即(19|20),否則只能配對到以20開頭的年份,
三、子表達式的嵌套
子表達式允許嵌套,而且允許多層嵌套,嵌套層次在理論上沒有限制。
在表達式((A)(B(C))) 中,有下列子表達式:
1 ((A)(B(C))))
2 (A)
3 (C))
4 (C)
共4個,第0個總是代表整個表達式。在後面的回溯參考中會介紹到透過n(n是子表式的編號)來引用子表達式。
子表達式巢狀的範例可參考後面符合IPV4位址的正規表示式。
希望本文所述對大家正規表示式學習有所幫助。
更多正規表示式教學之子表達式用法分析相關文章請關注PHP中文網!