跳到主要内容

RegExp正则匹配

  • 正则表达式是描述字符模式的对象
  • 正则表达式用于对字符串模式匹配及检索替换,是对字符串执行模式匹配的强大工具

语法

  • pattern(模式) 描述了表达式的模式
  • modifiers (修饰符) 用于指定全局匹配,区分大小写的匹配和多行匹配
let patt = new RegExp(pattern,modifiers);

或者更简单的方式:

let patt = /pattern/modifiers;
当使用构造函数创造正则对象时, 需要常规的字符转义规则(在前面加反斜杠 ) ,比如, 以下是等价的:
let reg = new RegExp("\\w+")
let reg = /\w+/

修饰符

  • 修饰符用于执行区分大小写和全局匹配
修饰符描述
i执行对大小写不敏感的匹配
g执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)
m执行多行匹配
let str = "Is this all there is?"
let reg1 = /is/
let reg2 = /is/g // 加g,表示全局匹配
logd(str.match(reg1)) // 返回 is
logd(str.match(reg2)) // 返回 is,is

方括号

  • 方括号用于查找某个范围内的字符
表达式描述
[abc]查找方括号之间的任何字符
[^abc]查找任何不在方括号之间的字符
[0-9]查找任何从 0 至 9 的数字
[a-z]查找任何从小写 a 到小写 z 的字符
[A-Z]查找任何从大写 A 到大写 Z 的字符
[A-z]查找任何从大写 A 到小写 z 的字符
[adgk]查找给定集合内的任何字符
[^adgk]查找给定集合外的任何字符
(red|blue|green)查找任何指定的选项

元字符

  • 元字符(Metacharacter)是拥有特殊含义的字符
元字符描述
.查找单个字符, 除了换行和行结束符
\w查找数字、字母及下划线
\W查找非单词字符
\d查找数字
\D查找非数字字符
\s查找空白字符
\S查找非空白字符
\b匹配单词边界
\B匹配非单词边界
\0查找 NULL 字符
\n查找换行符
\f查找换页符
\r查找回车符
\t查找制表符
\v查找垂直制表符
\xxx查找以八进制数 xxx 规定的字符
\xdd查找以十六进制数 dd 规定的字符
\uxxxx查找以十六进制数 xxxx 规定的 Unicode 字符

量词

量词描述
n+匹配任何包含至少一个 n 的字符串
例如, /a+/ 匹配 "candy" 中的 "a", "caaaaaaandy" 中所有的 "a"
n*匹配任何包含零个或多个 n 的字符串
例如, /bo*/ 匹配 "A ghost booooed" 中的 "boooo", "A bird warbled" 中的 "b", 但是不匹配 "A goat grunted"
n?匹配任何包含零个或一个 n 的字符串
例如, /e?le?/ 匹配 "angel" 中的 "el", "angle" 中的 "le"
n{X}匹配包含 X 个 n 的序列的字符串
例如, /a{2}/ 不匹配 "candy," 中的 "a", 但是匹配 "caandy," 中的两个 "a", 且匹配 "caaandy." 中的前两个 "a"
n{X,}X 是一个正整数前面的模式 n 连续出现至少 X 次时匹配
例如, /a{2,}/ 不匹配 "candy" 中的 "a", 但是匹配 "caandy" 和 "caaaaaaandy." 中所有的 "a"
n{X,Y}X 和 Y 为正整数前面的模式 n 连续出现至少 X 次, 至多 Y 次时匹配
例如, /a{1,3}/ 不匹配 "cndy", 匹配 "candy," 中的 "a", "caandy," 中的两个 "a", 匹配 "caaaaaaandy" 中的前面三个 "a"注意, 当匹配 "caaaaaaandy" 时, 即使原始字符串拥有更多的 "a", 匹配项也是 "aaa"
n$匹配任何结尾为 n 的字符串
^n匹配任何开头为 n 的字符串
?=n匹配任何其后紧接指定字符串 n 的字符串
?!n匹配任何其后没有紧接指定字符串 n 的字符串

RegExp 对象方法

方法描述
exec检索字符串中指定的值返回找到的值, 并确定其位置
test检索字符串中指定的值返回 true 或 false

exec

  • exec 的参数是一个字符串, 它的功能与match()相似
  • exec 方法对一个指定的字符串执行一个正则表达式, 也就是在一个字符串中执行匹配检索
  • 如果没有找到任何匹配就返回 null
  • 找到了匹配就返回一个数组, 这个数组的第一个元素包含的是与正则表达式相匹配的字符串, 余下的元素是与圆括号内的子表达式相匹配的子串
  • 不论正则表达式是否有修饰符g, 都会返回一样的数组
  • 当调用exec()的正则表达式对象具有修饰符g时, 它将把当前正则表达式对象的 lastIndex 属性设置为紧挨着匹配子串的字符位置
  • 当同一个正则表达式第二次调用 exec 时, 它将从lastIndex属性所指示的字符串处开始检索
  • 如果exec()没有发现任何匹配结果, 它会将lastIndex重置为0
let reg = /Java/g
let str = "JavaScript is more fun than Java!"
let arr
while ((arr = reg.exec(str))) {
logd(arr[0], 'lastIndex:', reg.lastIndex)
}
// 返回 Java lastIndex: 4
// 返回 Java lastIndex: 32

test

  • test 的参数是一个字符串, 用 test 对某个字符串进行检查, 如果包含正则表达式的一个匹配结果,则返回 true 否则 false
let reg = /java/i
logd(reg.test("javascript")) // 返回 true

支持正则表达式的 String 对象的方法

方法描述
search检索与正则表达式相匹配的值
match找到一个或多个正则表达式的匹配
replace替换与正则表达式匹配的子串
split把字符串分割为字符串数组
  • 参数支持普通字符串,也支持正则匹配
  • 返回匹配位置
let str = "JavaScript is fun"
logd(str.search("script")) // 返回 -1
logd(str.search(/script/i)) // 返回 4

match

  • 在字符串内检索指定的值,或找到一个或多个正则表达式的匹配
  • 返回匹配到的结果, 返回值是个数组
  • 如果是 g 模式, 则匹配所有
let str = "The rain in SPAIN stays mainly in the plain"
let arr = str.match(/ain/)
logd(arr, arr.length) // 返回 ain 1

arr = str.match(/ain/g)
logd(arr, arr.length) // 返回 ain,ain,ain 3

replace

  • 参数1: 正则表达式或字符串
  • 参数2: 字符串
  • 返回值: 字符串
let str = "到老冷编程学院,学js编程基础";
let ret = str.replace("js", "Python");
logd(ret) // 返回 到老冷编程学院,学Python编程基础
  • replace 只能替换一次
  • 由于ES5没有 replaceAll 的api,我们自己拓展一个,放到文件开头
String.prototype.replaceAll = function (searchValue, replaceValue) {
return this.replace(new RegExp(searchValue, "gm"), replaceValue ? replaceValue : "")
}

let str = "js太好玩了,我要学js";
let ret = str.replace("js", "Python");
logd(ret) // 返回 Python太好玩了,我要学js

ret = str.replaceAll("js", "Python");
logd(ret) // 返回 Python太好玩了,我要学Python

split

  • 参数1: 正则表达式或字符串
  • 参数2: 定返回的数组的最大长度
  • 返回值: 字符串数组
let str = "老冷编程学院";
let ret = str.split("")
logd(ret) // 返回 老,冷,编,程,学,院
let str = "账号----密码----等级";
let ret = str.split("----")
logd(ret) // 返回 账号,密码,等级
logd(ret[0]) // 返回 账号