二十九、MySQL REGEXP 子句正则表达式查询

前面章节中我们已经了解到 MySQL 可以通过 LIKE ...% 子句来进行模糊匹配,但这都只是简单的模糊查询,也是速度最快的模糊查询

除此之外,MySQL 同样也支持其它正则表达式的匹配

MySQL 通过使用 REGEXP 操作符来进行正则表达式匹配

如果你了解过其它语言的正则表达式,比如 PHPPerl 等,那么你会对 MySQL 的正则表达式元字符非常熟悉,因为它们都类似

MySQL REGEXP 操作符支持以下几种元子符

元字符 描述
^ 匹配输入字符串的开始位置
如果设置了 Multiline 属性,^ 也匹配 ‘\n’ 或 ‘\r’ 之后的位置
$ 匹配输入字符串的结束位置
如果设置了 Multiline 属性,$ 也匹配 ‘\n’ 或 ‘\r’ 之前的位置
. 匹配除 “\n” 之外的任何单个字符
如果要匹配包括 ‘\n’ 在内的任何字符,请使用象 ‘[.\n]’ 的模式
[…] 字符集合。匹配所包含的任意一个字符
例如, ‘[abc]’ 可以匹配 “plain” 中的 ‘a’
[^…] 负值字符集合。匹配未包含的任意字符
例如, ‘[^abc]’ 可以匹配 “plain” 中的’p’
p1|p2|p3 匹配 p1 或 p2 或 p3
例如,’z|food’ 匹配 “z” 或 “food”。'(z|f)ood’ 则匹配 “zood” 或 “food”
* 匹配前面的子表达式零次或多次
例如,zo 能匹配 “z” 以及 “zoo”。 等价于{0,}。
+ 匹配前面的子表达式一次或多次
例如,’zo+’ 能匹配 “zo” 以及 “zoo”,但不能匹配 “z”。+ 等价于
{n} n 是一个非负整数。匹配确定的 n 次
例如,’o{2}’ 不能匹配 “Bob” 中的 ‘o’,但是能匹配 “food” 中的两个 o
{n,m} m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次

MySQL 中正则表达式用的不多,但也有那么几个时刻还是很有用处的

下面我们就拿几个伪需求来看看如何使用

说是伪需求,是因为除了全文检索,其实都可以用 LIKE 语句代替

测试数据

首先运行下面的 SQL 语句准备测试数据

DROP TABLE IF EXISTS tbl_language;
CREATE TABLE IF NOT EXISTS tbl_language(
   id INT UNSIGNED AUTO_INCREMENT,
   name VARCHAR(64) NOT NULL,
   url VARCHAR(128) NOT NULL,
   founded_at DATE,
   PRIMARY KEY ( id )
)ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
INSERT INTO tbl_language VALUES
    (1,'Python','https://pottercoding.cn','1991-2-20'),
    (2,'PHP','http://www.php.net','1994-1-1'),
    (3,'Ruby','https://www.ruby-lang.org/','1996-12-25'),
    (4,'Kotlin','http://kotlinlang.org/','2016-02-17');
INSERT INTO tbl_language (name,url) VALUES
    ('Perl','http://www.perl.org/'),
    ('Scala','http://www.scala-lang.org/');

使用SELECT * FROM tbl_language 显示数据如下

+----+--------+----------------------------+------------+
| id | name   | url                        | founded_at |
+----+--------+----------------------------+------------+
|  1 | Python | https://pottercoding.cn        | 1991-02-20 |
|  2 | PHP    | http://www.php.net         | 1994-01-01 |
|  3 | Ruby   | https://www.ruby-lang.org/ | 1996-12-25 |
|  4 | Kotlin | http://kotlinlang.org/     | 2016-02-17 |
|  5 | Perl   | http://www.perl.org/       | NULL       |
|  6 | Scala  | http://www.scala-lang.org/ | NULL       |
+----+--------+----------------------------+------------+

范例

1、 查找name字段中以Py为开头的所有name

    SELECT name FROM tbl_language WHERE name REGEXP '^Py';

运行结果如下

    +--------+
    | name   |
    +--------+
    | Python |
    +--------+

2、 查找url字段中以org/结尾的所有name

    SELECT name FROM tbl_language WHERE url REGEXP 'org/$';

运行结果如下

    +--------+
    | name   |
    +--------+
    | Ruby   |
    | Kotlin |
    | Perl   |
    | Scala  |
    +--------+

3、 查找url字段中包含lang字符串的所有name

    SELECT name FROM tbl_language WHERE url REGEXP 'lang';

运行结果如下

    +--------+
    | name   |
    +--------+
    | Ruby   |
    | Kotlin |
    | Scala  |
    +--------+

4、 来一个复杂的,查找url字段中包含-lan且以rg/结尾的所有name

    SELECT name FROM tbl_language WHERE url REGEXP '-lan.*rg/$';

运行结果如下

    +-------+
    | name  |
    +-------+
    | Ruby  |
    | Scala |
    +-------+