SQL如何使用正则表达式对数据进行过滤

作者:亿码平川 时间:2024-01-26 23:15:05 

1、基本字符匹配

数据库使用正则进行过滤,写法与like语句非常相似,只需将“like"关键字改为"regexp"即可。我们先来看一个最简单的正则匹配:

select *
from mostimes
where name regexp '666'

分析:这条sql语句表达是字段中包含"666"即为匹配对象。

正则也可以像like语句那样任意匹配一个字符:

select *
from mostimes
where name regexp '.66'

分析:这里使用了正则表达式" .66 “,” . "是正则表达式语言中一个特殊的字符。它表示匹配任意一个字符,因此,566、666、766等都匹配且返回。

2、进行OR匹配

OR匹配与C语言的按位或很相似,使用" | "符号,表示符号两边任意一个串匹配了,即返回。用法如下所示:

select *
from mostimes
where name regexp '666|888'

分析:语句中使用了正则表达式"666|888"。" | "为正则表达式的OR操作符。它表示匹配其中之一,因此name字段为666和888都匹配并返回。

3、匹配几个字符之一

顾名思义,该方法是匹配多个字符中的其中一个,用法:

select *
from mostimes
where name regexp '[abc]mos'

分析:使用了正则表达式"[abc]mos"。[abc]定义一组字符,它的意思是匹配a或b或c,因此,amos、bmos和cmos都匹配且返回。

4、匹配范围

在第3个匹配方法中,我们可以对其进行简化,当我们需要匹配"[01234567]mos"时,我们还可以使用下面更简洁的方法:

select *
from mostimes
where name regexp '[0-7]mos'

分析:使用" - "可以简化这种连续字符类型的集合,此外,[a-z]也适用此方法。

5、匹配特殊字符

在前面的几种的匹配方式中,我们可以看到,正则表达式语言是由具有特定含义的特殊字符构成的,那如果我们想要匹配那些特殊字符的时候,就会出现sql注入问题,例如我们需要匹配" . “的时候,那么数据库就会将” . "当做一个任意通配符来匹配,达不到我们期望的值,这个时候我们就需要对其进行转义,例:

select *
from mostimes
where name regexp '\\.mos'

分析:可以看到,我们在‘.’符号的前面加了" \ “,加上双斜杆,数据库就会把” . "符号当做一个普通符号来匹配,其中还包括|、[]以及迄今为止使用过的其他特殊字符。

如果需要对‘\’进行转义时,那么我们就需要使用‘\\\’

6、匹配字符类

存在找出你自己经常使用的数字、所有字母字符或所有数字字母字符等的匹配。为更方便工作,可以使用预定义的字符集,称为字符类,具体可以看下表。

说明
[:alnum:]任意字母和数字(同[a-zA-Z0-9])
[:alpha:]任意字符(同[a-zA-Z])
[:blank:]空格和制表(同[\t])
[:cntrl:]ASCII控制字符(ASCII 0到31和127)
[:digit:]任意数字(同[0-9])
[:graph:]与[:print:]相同,但不包括空格
[:lower:]任意小写字母(同[a-z])
[:print:]任意可打印字符
[:punct:]既不在[:alnum:]又不在[:cntrl:]中的任意字符
[:space:]包括空格在内的任意空白字符(同[\f\n\r\t\v])
[:upper:]任意大写字母(同[A-Z])
[:xdigit:]任意十六进制数字(同[a-fA-F0-9])

例子:

select *
from mostimes
where name REGEXP '[:alnum:]'

分析:表示匹配任意字母和数字,其他的大家可以试下。

7、匹配多个实例

在我们前面学习的几种正则表达式中,所有的匹配都是以单次出现进行匹配的。但有时候我们需要对匹配的次数进行更强的控制,这个时候我们就可以使用重复元字符来匹配。看下表:

元 字 符说 明
*0个或多个匹配
+1个或多个匹配(等于{1,})
?0个或1个匹配(等于{0,1})
{n}指定数目的匹配
{n,}不少于指定数目的匹配
{n,m}匹配数目的范围(m不超过255)

例子:

select *
from mostimes
where name REGEXP '[0-9]mostimes?'

分析:"[0-9]"表示匹配任意数字,"mostimes?"匹配mostime和mostimes(s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出现),所以0mostime、1mostimes等都可以匹配。

8、定位符

现在有一个需求,就是需要在串中的指定位置匹配串,但是学的前面那几种都是在文本内任意位置查找匹配,那这个时候我们就可以使用定位符来解决。看下表:

元 字 符说 明
^文本的开始
$文本的结尾
[[:<:]]词的开始
[[:>:]]词的结尾

例子:

select *
from mostimes
where name REGEXP '^[0-9]mos'

分析:" ^ "表示匹配串的开始。所以该语句表示在串开头进行匹配,1mos、2mos、3mos等可以匹配,a1mos、aa1mos等不可以匹配。

9、like语句与正则

like语句与正则的相类似,但是它们的不同点就是like匹配的是整个串,而正则匹配的是子串,但是可以使用定位符&ldquo;^&rdquo;与&ldquo;$&rdquo;相结合,达到like语句的效果。

来源:https://blog.csdn.net/weixin_42372660/article/details/120028756

标签:sql,正则表达式,数据过滤
0
投稿

猜你喜欢

  • python读写数据读写csv文件(pandas用法)

    2021-06-15 15:28:03
  • Python求算数平方根和约数的方法汇总

    2021-12-08 18:03:39
  • 三分钟时间教你用Python绘制春联

    2023-11-06 00:26:08
  • MySQL适配器PyMySQL详解

    2024-01-16 23:49:11
  • ASP编程中使用数组方法实例讲解

    2008-02-15 08:25:00
  • Golang Gob编码(gob包的使用详解)

    2024-02-22 02:16:46
  • Django如何配置mysql数据库

    2024-01-18 03:27:30
  • Python基于read(size)方法读取超大文件

    2022-06-06 12:27:15
  • MySQL 8.0 之不可见列的基本操作

    2024-01-18 17:32:41
  • VScode中集成Git命令详解

    2022-09-21 00:57:55
  • python语言线程标准库threading.local解读总结

    2023-12-22 18:18:07
  • 深入浅析Python 中 is 语法带来的误解

    2021-08-23 14:18:17
  • Python 2.7中文显示与处理方法

    2021-06-14 16:07:39
  • python对象及面向对象技术详解

    2023-05-14 00:04:16
  • python实现selenium网络爬虫的方法小结

    2023-01-13 03:43:38
  • sqlserver之datepart和datediff应用查找当天上午和下午的数据

    2024-01-14 22:27:42
  • 三大UML建模工具Visio、Rational Rose、PowerDesign的区别比较

    2022-05-27 12:22:45
  • 浅谈Python2获取中文文件名的编码问题

    2021-08-11 08:18:45
  • Python操作MySQL数据库9个实用实例

    2024-01-25 19:28:40
  • 微软建议的ASP性能优化28条守则(4)

    2008-02-26 17:57:00
  • asp之家 网络编程 m.aspxhome.com