# JS 正则表达式基础

# 前言

个人经验，正则是一个前期少量投入，回报超高的技能点。

其适用范围非常广泛，如批量文本处理、源码替换、程序中逻辑判断等等。
本文只介绍常用的基础知识、技巧，让初学者快速掌握大部分日常所需的正则知识。目标是5分钟内可逐字读完，10分钟内可把例子都动手实践一遍。

TIP

可以复制代码粘贴到控制台（F12 或 ctrl+shift+i）查看执行结果

# 特殊匹配符号

符号	介绍	示例
.	匹配任意字符	`/./.test('a')`
\w	匹配一个单字字符（字母、数字或者下划线）	`/\w/.test('a')`
\d	匹配一个数字	`/\d/.test('0')`
\s	匹配一个空白符（空格、\n、\r等等）	`/\s/.test(' ')`

以上特殊字符大写，则含义相反，如\D匹配一个非数字。

# 匹配数量控制

符号	介绍	示例
x?	匹配0或1个x	`/https?:/.test('http://xxx')`，http、https 均可
x+	匹配1个或多个x	`/\d+/.test('111')`，匹配多个数字
x*	匹配任意多个x，可以是0个	`/\svalue\s/.test('value ')`，允许value前后出现任意个空白符
x{3}	匹配3个x	`/x{3}/.test('xxx')`

这里特别介绍一下贪婪、非贪婪匹配，因为太常用了。
正则默认是贪婪匹配，即尽量匹配更多的字符；若在符号+、*，后面紧跟?，则非贪婪模式。

// 默认贪婪模式，尽量匹配最多字符
/a.*c/.exec('abcabc') // ['abcabc']
// 非贪婪模式，尽量匹配最少字符
/a.*?c/.exec('abcabc') // ['abc']

# 字符集合

假设正则没有预设\d，我们要匹配所有数字应该怎么办？

可以这样写：
/0|1|2|3|4|5|6|7|8|9/.test('0')； |表示'或' 的意思。

看起来太复杂了，简化一下：
/[0123456789]/.test('0')； []表示一个字符集合，只要匹配集合中的任意字符都能通过检测。

既然有了期望的字符集合（白名单），那也应该有非期望的集合（黑名单）：
/[^0123456789]/(等价于\D)匹配所有非数字，方括号中 以^开头表示匹配非后面的这些字符。

# 分组

圆括号(.*)包围的内容表示正则的一个分组，分组可以搭配前面介绍的数量控制符号。
如简单的域名匹配：/(\w+\.)+(com|io)/.test('hughfenghen.github.io')

# 特殊非匹配符号

符号	介绍	示例
\	转义符	`/\+/.test('+')`，`+`是表数量的特殊字符，如果想匹配`+`本身，需在前加转义符`\`
^	字符串起始位置	`/^1/.test('1000')` 匹配 1 开头的字符串
$	字符串结束位置	`/\.com$/.test('bilibili.com')`，匹配 .com 结尾的字符串

# 应用技巧

使用正则的主要场景：

判断一个字符串是否具备某种特征

// 匹配国内手机号码
/^1[357]\d{9}$/.test('13881958429')

从一个字符串中提取特定子串

// 从字符串中 提取二级域名，匹配失败则给 company 赋 空串
// 匹配二级域名的是第二个分组（第二个圆括号），对应数组的第三个元素，详情查看 exec 的文档
const [, , company] = /(\w+\.)*(\w+?)\.com/.exec('bilibili.com') ?? [, , '']
// company => bilibili

将特定字符串替换成其他字符串

// 删除字符串前后空格，等价于 trim 函数的效果
'   value   '.replace(/^\s*|\s*$/g, '')

// 这里有个前面未介绍的知识点
// /g 表示全局替换，去掉的话，替换起始部分的空格后就结束了（建议动手试试效果

当然，利用正则处理文本不局限于代码，配合编辑器往往也能节省大量时间。
如下图，使用 vscode+正则可从大量的日志中提取出error日志（删除其他类型的日志）

# 结语

本文定位为初学者快速入门，所以只介绍常用的基础知识；
正则还有很多有意思的玩法，感兴趣的同学自行探索；
若你认为有高频使用的知识点没有介绍到，可在评论区回复。