很多时候多会被正则表达式搞的晕头转向,最近抽出时间对正则表达式进行了系统的学习,整理如下:
两种方法,一种是直接写,由包含在斜杠之间的模式组成;另一种是调用RegExp对象的构造函数。
两种方法的创建代码如下:
// 直接创建const regex1 = /ab+c/; const regex2 = /^[a-zA-Z]+[0-9]*\W?_$/gi;// 调用构造函数const regex3 = new RegExp('ab+c'); const regex4 = new RegExp(/^[a-zA-Z]+[0-9]*\W?_$/, "gi"); const regex5 = new RegExp('^[a-zA-Z]+[0-9]*\W?_$', 'gi');
可以看出,调用RegExp构造函数创建正则表达式时,第一个参数可以是字符串,也可以是直接创建的正则表达式。
需要注意的是:RegExp实例继承的toLocaleString()和toString)()方法都会返回正则表达式的字面量,与创建正则表达式的方式无关
例如:
const ncname = '[a-zA-Z_][\\w\\-\\.]*'; const qnameCapture = '((?:' + ncname + '\\:)?' + ncname + ')'; const startTagOpen = new RegExp('^<' + qnameCapture); startTagOpen.toString(); // '/^<((?:[a-zA-Z_][\w\-\.]*\:)?[a-zA-Z_][\w\-\.]*)/'
1.在非特殊字符前加反斜杠表示下一个字符是特殊的;
2.将其后的特殊字符转译为字面量;
注意:在使用RegExp构造函数时要将\转译,因为\在字符串里也是转译字符
1.匹配输入的开始;
2.在[]中的第一位时表示反向字符集;
例子:
/^A/.exec('an A') // null/^A/.exec('An E') // ["A", index: 0, input: "An E"]
匹配输入的结束
/t$/.exec('eater') // null/t$/.exec('eat') // ["t", index: 2, input: "eat"]
*:匹配前一个表达式0次或多次。等价于 {0,};
+:匹配前面一个表达式1次或者多次。等价于 {1,};
.:匹配除换行符之外的任何单个字符;
1.匹配前面一个表达式0次或者1次。等价于 {0,1};
2.如果紧跟在任何量词 * + ? {} 的后面,将会使量词变为非贪婪的(匹配尽量少的字符),和缺省使用的贪婪模式正好相反;
3.运用于先行断言
例子:
/\d+/.exec('123abc') // ["123", index: 0, input: "123abc"]/\d+?/.exec('123abc') // ["1", index: 0, input: "123abc"]
匹配 'x' 并且记住匹配项,括号表示捕获括号;
例子:
/(foo) (bar) \1 \2/.test('bar foo bar foo'); // false/(bar) (foo) \1 \2/.test('bar foo bar foo'); // true/(bar) (foo) \1 \2/.test('bar foo'); // false/(bar) (foo) \1 \2/.test('bar foo foo bar'); // false/(bar) (foo) \2 \1/.test('bar foo foo bar'); // true'bar foo bar foo'.replace( /(bar) (foo)/, '$2 $1' ); // "foo bar bar foo"
模式 /(foo) (bar) \1 \2/ 中的 '(foo)' 和 '(bar)' 匹配并记住字符串 "foo bar foo bar" 中前两个单词。模式中的 \1 和 \2 匹配字符串的后两个单词。
注意:\1、\2、\n 是用在正则表达式的匹配环节,在正则表达式的替换环节,则要使用像 $1、$2、$n 这样的语法。例如,'bar foo'.replace( /(...) (...)/, '$2 $1' )。
匹配 'x' 但是不记住匹配项,这种叫作非捕获括号;
例子:
'foo'.match(/foo{1,2}/) // ["foo", index: 0, input: "foo"]'foo'.match(/(?:foo){1,2}/) // ["foo", index: 0, input: "foo"]'foofoo'.match(/(?:foo){1,2}/) // ["foofoo", index: 0, input: "foofoo"]'foofoo'.match(/foo{1,2}/) // ["foo", index: 0, input: "foofoo"]
使用场景:示例表达式 /(?:foo){1,2}/。如果表达式是 /foo{1,2}/,{1,2}将只对 ‘foo’ 的最后一个字符 ’o‘ 生效。如果使用非捕获括号,则{1,2}会匹配整个 ‘foo’ 单词。
x(?=y):匹配'x'仅仅当'x'后面跟着'y';
x(?!y):匹配'x'仅仅当'x'后面不跟着'y';
x|y: 匹配x或y
这两种匹配的结果都不包含y
例子:
'JackSprat'.match(/Jack(?=Sprat)/) // ["Jack", index: 0, input: "JackSprat"]'JackWprat'.match(/Jack(?=Sprat)/) // null'JackWprat'.match(/Jack(?=Sprat|Wprat)/) // ["Jack", index: 0, input: "JackWprat"]/\d+(?!\.)/.exec("3.141") // ["141", index: 2, input: "3.141"]
{n}:匹配了前面一个字符刚好发生了n次;
{n,m}:匹配前面的字符至少n次,最多m次。如果 n 或者 m 的值是0, 这个值被忽略;
例子:
/a{2}/.exec('candy') // null/a{2}/.exec('caandy') // ["aa", index: 1, input: "caandy"]/a{2}/.exec('caaandy') // ["aa", index: 1, input: "caaandy"]/a{1,3}/.exec('candy') // ["a", index: 1, input: "candy"]/a{1,3}/.exec('caandy') // ["aa", index: 1, input: "caandy"]/a{1,3}/.exec('caaandy') // ["aaa", index: 1, input: "caaandy"]/a{1,3}/.exec('caaaandy') // ["aaa", index: 1, input: "caaaandy"]
[xyz]:一个字符集合。匹配方括号的中任意字符;
[^xyz]:一个反向字符集。匹配任何没有包含在方括号中的字符;
这两种匹配都可以使用破折号(-)来指定一个字符范围,特殊符号在字符集中没有了特殊意义。
例:
function escapeRegExp(string){return string.replace(/([.*+?^=!:${}()|[\]\/\\])/g, "\\$&"); //$&表示整个被匹配的字符串}
例子中的.*+?^=!:${}()都表示字面量,并没有特殊意义。
\b:匹配一个词的边界。一个匹配的词的边界并不包含在匹配的内容中。换句话说,一个匹配的词的边界的内容的长度是0;
\B: 匹配一个非单词边界;
例子:
/\bm/.exec('moon') // ["m", index: 0, input: "moon"]/\bm/.exec('san moon') // ["m", index: 4, input: "san moon"]/oo\b/.exec('moon') // null/\B../.exec('noonday') // ["oo", index: 1, input: "noonday"]/y\B../.exec('possibly yesterday') // /y\B../.exec('possibly yesterday')
d: [0-9]에 해당하는 숫자와 일치합니다.
D: [^0-9]에 해당하는 숫자가 아닌 문자와 일치합니다.
f: 양식 피드와 일치합니다(U+000C).
n: 개행 문자(U+000A)와 일치합니다. r: 캐리지 리턴 문자(U+000D)와 일치합니다. s: 공백, 탭, 용지 공급 및 개행 문자를 포함한 공백 문자와 일치합니다. [fnrtvu00a0u1680u180eu2000-u200au2028u2029u202fu205fu3000ufeff]; S: 공백이 아닌 문자와 일치하며[^
fnrtvu00a0u1680u180eu2000-u200au20 28u20과 동일합니다. 29u202fu205fu3000ufeff];
[^
fnrtvu00a0u1680u180eu2000-u200au2028u2029u202fu205fu3000ufeff];
w:匹配一个单字字符(字母、数字或者下划线),等价于[A-Za-z0-9_];
W:匹配一个非单字字符,等价于[^A-Za-z0-9_];
w: 단일 문자와 일치합니다( 문자, 숫자 또는 밑줄), [A-Za-z0-9_]
[^ A-Za-z0- 9_];
정규 표현식 플래그
g: 전역 검색;
i: 대소문자 구분 안 함;
정규 표현식 사용
RegExp에는 exec() 및 테스트가 있습니다. () 방법;
exec 일치 결과는 일치 결과, 캡처 결과, 색인 및 입력입니다.
테스트의 일치 결과는 true 또는 false로 결정되며 이는 exec보다 효율적입니다.
문자열에는 match(), replacement(), search(), Split() 메서드가 있습니다.
일치 일치 결과는 RegExp의 exec와 동일하고, 정규 표현식에 따라 교체가 대체되고, 검색이 모든 위치를 찾고, 분할이 다음에 따라 나뉩니다. 정규식 문자열로.
그 중 바꾸기 기능이 있는 경우 매개변수 설명은 다음과 같습니다.
* 일치 항목
* 메모리 항목(괄호 안 항목)
* ...
* 입력 입력 항목
🎜 🎜위 내용은 js에서 정규식 생성 및 사용 요약의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!