SQL如何使用正则表达式对数据进行过滤
作者:亿码平川 时间:2024-01-26 23:15:05
1、基本字符匹配
数据库使用正则进行过滤,写法与like语句非常相似,只需将“like"关键字改为"regexp"即可。我们先来看一个最简单的正则匹配:
select *
from mostimes
where name regexp '666'
分析:这条sql语句表达是字段中包含"666"即为匹配对象。
正则也可以像like语句那样任意匹配一个字符:
select *
from mostimes
where name regexp '.66'
分析:这里使用了正则表达式" .66 “,” . "是正则表达式语言中一个特殊的字符。它表示匹配任意一个字符,因此,566、666、766等都匹配且返回。
2、进行OR匹配
OR匹配与C语言的按位或很相似,使用" | "符号,表示符号两边任意一个串匹配了,即返回。用法如下所示:
select *
from mostimes
where name regexp '666|888'
分析:语句中使用了正则表达式"666|888"。" | "为正则表达式的OR操作符。它表示匹配其中之一,因此name字段为666和888都匹配并返回。
3、匹配几个字符之一
顾名思义,该方法是匹配多个字符中的其中一个,用法:
select *
from mostimes
where name regexp '[abc]mos'
分析:使用了正则表达式"[abc]mos"。[abc]定义一组字符,它的意思是匹配a或b或c,因此,amos、bmos和cmos都匹配且返回。
4、匹配范围
在第3个匹配方法中,我们可以对其进行简化,当我们需要匹配"[01234567]mos"时,我们还可以使用下面更简洁的方法:
select *
from mostimes
where name regexp '[0-7]mos'
分析:使用" - "可以简化这种连续字符类型的集合,此外,[a-z]也适用此方法。
5、匹配特殊字符
在前面的几种的匹配方式中,我们可以看到,正则表达式语言是由具有特定含义的特殊字符构成的,那如果我们想要匹配那些特殊字符的时候,就会出现sql注入问题,例如我们需要匹配" . “的时候,那么数据库就会将” . "当做一个任意通配符来匹配,达不到我们期望的值,这个时候我们就需要对其进行转义,例:
select *
from mostimes
where name regexp '\\.mos'
分析:可以看到,我们在‘.’符号的前面加了" \ “,加上双斜杆,数据库就会把” . "符号当做一个普通符号来匹配,其中还包括|、[]以及迄今为止使用过的其他特殊字符。
如果需要对‘\’进行转义时,那么我们就需要使用‘\\\’
6、匹配字符类
存在找出你自己经常使用的数字、所有字母字符或所有数字字母字符等的匹配。为更方便工作,可以使用预定义的字符集,称为字符类,具体可以看下表。
类 | 说明 |
---|---|
[:alnum:] | 任意字母和数字(同[a-zA-Z0-9]) |
[:alpha:] | 任意字符(同[a-zA-Z]) |
[:blank:] | 空格和制表(同[\t]) |
[:cntrl:] | ASCII控制字符(ASCII 0到31和127) |
[:digit:] | 任意数字(同[0-9]) |
[:graph:] | 与[:print:]相同,但不包括空格 |
[:lower:] | 任意小写字母(同[a-z]) |
[:print:] | 任意可打印字符 |
[:punct:] | 既不在[:alnum:]又不在[:cntrl:]中的任意字符 |
[:space:] | 包括空格在内的任意空白字符(同[\f\n\r\t\v]) |
[:upper:] | 任意大写字母(同[A-Z]) |
[:xdigit:] | 任意十六进制数字(同[a-fA-F0-9]) |
例子:
select *
from mostimes
where name REGEXP '[:alnum:]'
分析:表示匹配任意字母和数字,其他的大家可以试下。
7、匹配多个实例
在我们前面学习的几种正则表达式中,所有的匹配都是以单次出现进行匹配的。但有时候我们需要对匹配的次数进行更强的控制,这个时候我们就可以使用重复元字符来匹配。看下表:
元 字 符 | 说 明 |
---|---|
* | 0个或多个匹配 |
+ | 1个或多个匹配(等于{1,}) |
? | 0个或1个匹配(等于{0,1}) |
{n} | 指定数目的匹配 |
{n,} | 不少于指定数目的匹配 |
{n,m} | 匹配数目的范围(m不超过255) |
例子:
select *
from mostimes
where name REGEXP '[0-9]mostimes?'
分析:"[0-9]"表示匹配任意数字,"mostimes?"匹配mostime和mostimes(s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出现),所以0mostime、1mostimes等都可以匹配。
8、定位符
现在有一个需求,就是需要在串中的指定位置匹配串,但是学的前面那几种都是在文本内任意位置查找匹配,那这个时候我们就可以使用定位符来解决。看下表:
元 字 符 | 说 明 |
---|---|
^ | 文本的开始 |
$ | 文本的结尾 |
[[:<:]] | 词的开始 |
[[:>:]] | 词的结尾 |
例子:
select *
from mostimes
where name REGEXP '^[0-9]mos'
分析:" ^ "表示匹配串的开始。所以该语句表示在串开头进行匹配,1mos、2mos、3mos等可以匹配,a1mos、aa1mos等不可以匹配。
9、like语句与正则
like语句与正则的相类似,但是它们的不同点就是like匹配的是整个串,而正则匹配的是子串,但是可以使用定位符“^”与“$”相结合,达到like语句的效果。
来源:https://blog.csdn.net/weixin_42372660/article/details/120028756