javascript正则表达式
前言
正则表达式( Regular Expressions)是用来匹配字符串中的字符组合的模式,通过这个模式我们可以进行字符串的搜索和替换等操作。ECMAScript通过RegExp类型来支持正则表达式,当然,String 对象中也有多个方法支持正则表达式操作。
语法
创建正则表达式
在javascript中创建正则表达式有两种方式:
1.通过字面量:
let expression = /pattern / attributes;
2.通过RegExp构造函数:
new RegExp(pattern,attributes);
其中:
“pattern”为正则表达式的内容,包含你要查询的字符串,语义符等等。
“attributes”为正则表达式的模式,常用值:
- g:全局模式
- i:不区分大小写模式
- m:多行模式
元字符
正则表达式语言由两种基本字符类型组成:原义字符和元字符,其中元字符就是指那些在正则表达式中具有特殊意义(功能)的专用字符。
下面是一些常用的字符及对应含义:
字符 | 含义 |
\ | 反斜杠,可以将在其后的字面量字符,转义为特殊字符。也可以将其后的特殊字符,转义为字面量。 |
^ | 匹配字符串的开始。 |
$ | 匹配字符串的结束。 |
* | 匹配前一个字符0次或者是多次,和{0,}有相同的效果。 |
+ | 匹配前面一个字符1次或者多次,和{1,}有相同的效果。 |
? | 匹配前面一个字符0次或者1次,和{0,1}有相同的效果。 |
. | 匹配除了换行符(\n)之外的任何单个字符。 |
x|y | 匹配‘x’或者‘y’。 |
[xy] | 匹配方括号的中任意字符。你可以使用破折号(-)来指定一个字符范围。 |
\f | 匹配一个换页符 (U+000C)。 |
\n | 匹配一个换行符 (U+000A)。 |
\r | 匹配一个回车符 (U+000D)。 |
\s | 匹配一个空白字符,包括空格、制表符、换页符和换行符,相当于[ \t\n\x0B\f\r]。 |
\S | 匹配一个非空白字符,相当于[^ \t\n\x0B\f\r]。 |
\d | 匹配一个数字,相当于[0-9]。 |
\D | 匹配一个非数字字符,相当于[^0-9]。 |
\w | 匹配一个单字字符(字母、数字或者下划线),相当于[A-Za-z0-9_]。 |
\W | 匹配一个非单字字符。相当于[^A-Za-z0-9_]。 |
RegExp 对象的方法
在javascript中,RegExp对象预定义了一些属性和方法。
test()方法
用于检索字符串是否匹配指定的值,如果找到则返回 true 否则返回 false。
在下面例子中,我们检索字符串str中的”World”:
let str = "Hello World"
let pattern = new RegExp("World","g")
pattern.test(str) // true
运行后可以看到弹窗返回的结果为“true”。
exec()方法
用于检索字符串是否匹配指定的值,如果找到则返回一个数组(记录首个匹配信息而非所有命中),否则返回null。
在下面例子中,同样检索字符串str中的”World”:
let str = "Hello World, Hello World." let pattern = new RegExp("World","g") pattern.exec(str) // [
0: "World", index: 6, xxx: ...] 6为命中起始index,此时会记录lastIndex
pattern.lastIndex // 11
11为下一次检索开始的位置(这里是 ,)。
String 对象中的方法
除了RegExp对象外,String 对象中也有多个方法支持正则表达式操作。
search()方法
用于检索指定字符串并返回匹配字段的起始位置。
在下面例子中,检索字符串str中的”World”,并返回第一个匹配的位置信息:
let str = "Hello World"
str.search(/World/g) // 6
运行后返回结果是“6”,即为检索子字符串“World”的首字符“W”的位置。
replace()方法
用于字符替换。
在下面例子中,替换字符串str中的”World”为“China”:
let str = "Hello World"
str.replace(/World/g, "China") // Hello China
有的时候为了安全起见,我们需要对用户输入的内容进行转义,例如去除分号,引号等等特殊符号,我们可以用正则这样做:
let username = "T&aylor;+ Swift@#)"
username.replace(/[^A-Za-z\d\s]/g, "") //Taylor Swift
这个例子中用户输入的字符串为“T&aylor;+ Swift@#)”,经过我们的正则转换后,变成了正常的字符串:“Taylor Swift”
split()方法
用于把字符串分割成子字符串数组。
在下面这个例子中,我们模拟用户一次性输入多个名字(用空格隔开),然后要通过正则把它转换成数组:
let str = "Monica Sophie Julia <em>Kathy</em>"
str.split(/\s/g)
运行后输出数组的所有元素:“Monica,Sophie,Julia,Kathy”
match()方法
用于检索匹配值,同样返回一个数组。
在下面这个例子中,我们在一个单词里面寻找字母‘a’:
let word = "international"
word.match(/a/g) // "a,a"
字母‘a’在单词‘international’中出现了两次,所以运行后输出匹配数组:“a,a”。
常用的正则表达式 (来自JavaScript中文网)
1.匹配数字和字符串
· 整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$
· 只能输入数字:”^[0-9]*$”。
· 只能输入n位的数 字:”^\d{n}$”。
· 只能输入至少n位的数字:”^\d{n,}$”。
· 只能输入m~n位的数字:。”^\d{m,n}$”
· 只 能输入零和非零开头的数字:”^(0|[1-9][0-9]*)$”。
· 只能输入有两位小数的正实数:”^[0-9]+(.[0-9] {2})?$”。
· 只能输入有1~3位小数的正实数:”^[0-9]+(.[0-9]{1,3})?$”。
· 只能输入非零的正整 数:”^\+?[1-9][0-9]*$”。
· 只能输入非零的负整数:”^\-[1-9][]0-9″*$。
· 只能输入长度为3的字 符:”^.{3}$”。
· 只能输入由26个英文字母组成的字符串:”^[A-Za-z]+$”。
· 只能输入由26个大写英文字母组成的字 符串:”^[A-Z]+$”。
· 只能输入由26个小写英文字母组成的字符串:”^[a-z]+$”。
· 只能输入由数字和26个英文字母组 成的字符串:”^[A-Za-z0-9]+$”。
· 只能输入由数字、26个英文字母或者下划线组成的字符串:”^\w+$”。
2.验证用户信息
· 验证用户 密码:”^[a-zA-Z]\w{5,17}$”正确格式为:以字母开头,长度在6~18之间,只能包含字符、数字和下划线。
· 验证是否含有 ^%&’,;=?$\”等字符:”[^%&’,;=?$\x22]+”。
· 只能输入汉字:”^[\u4e00-\u9fa5] {0,}$”
· 验证Email地址:”^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$”。
· 验 证InternetURL:”^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$”。
· 验证手机号:"^1(3|4|5|7|8)\d{9}$"
· 验证电话号 码:”^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$”正确格式为:”XXX-XXXXXXX”、”XXXX- XXXXXXXX”、”XXX-XXXXXXX”、”XXX-XXXXXXXX”、”XXXXXXX”和”XXXXXXXX”。
· 验证身份证号 (15位或18位数字):”^\d{15}|\d{18}$”。
· 验证一年的12个月:”^(0?[1-9]|1[0-2])$”正确格式 为:”01″~”09″和”1″~”12″。
· 验证一个月的31天:”^((0?[1-9])|((1|2)[0-9])|30|31)$”正确 格式为;”01″~”09″和”1″~”31″。
3.匹配中文和其他特殊字符
· 匹配中文字符的正则表达式: [\u4e00-\u9fa5]
· 匹配双字节字符(包括汉字在内):[^\x00-\xff]
· 匹配空行的正则表达式:\n[\s| ]*\r
· 匹配html标签的正则表达式:<[^>]+>
· 匹配首尾空格的正则表达式:(^\s*)|(\s*$)
参考资料:
《JavaScript高级程序设计》(第3版)
本文标题:javascript正则表达式
转载请注明出处,欢迎分享