python正则表达式常见的知识点汇总

作者:Begin?to?change 时间:2023-10-02 18:56:21 

一、介绍

正则表达式是一个特殊的字符序列,计算机科学的一个概念。通常被用来检索、替换那些符合某个模式(规则)的文本。

许多程序设计语言都支持利用正则表达式进行字符串操作。在Python中需要通过正则表达式对字符串进行匹配的时候,可以使用re模块。re 模块使 Python 语言拥有全部的正则表达式功能。

二、查找方法的使用

1、match方法(只匹配字符串开头)

re.match尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。如果匹配成功,返回的是一个Match对象,要想获得其值要调用group()方法

group(0)返回的是整个匹配的所有内容(默认为0)

python正则表达式常见的知识点汇总

函数语法:

re.match(pattern,string,flags=0)

python正则表达式常见的知识点汇总

python正则表达式常见的知识点汇总

2、search方法(扫描整个字符串,找到第一个匹配)

 re.search 扫描整个字符串并返回第一个成功的匹配。

函数语法:

re.search(pattern, string, flags=0)

3、re.match与re.search的区别

 re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。

4、findall方法(扫描整个字符串,找到所有的匹配)

在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。

注意: match 和 search 是匹配一次 findall 匹配所有。

语法格式:

re.findall(pattern,string,flags=0)

示例: 

python正则表达式常见的知识点汇总

python正则表达式常见的知识点汇总

5、finditer方法(扫描整个字符串,找到所有的匹配,并返回一个可迭代对象)

和 findall 类似,在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回

ret = re.finditer(r'\d+','he23ll34')  # 得到的结果是一个可迭代对象
for x in ret: # 遍历 ret 取出里面的每一项匹配
   print(x.group(), x.span()) # 匹配对象里的group保存了匹配的结果

三、re.Match类介绍

当我们调用re.match方法、re.search方法,或者对re.finditer方法的结果进行迭代时,拿到的数据类型都是re.Match对象。

python正则表达式常见的知识点汇总

python正则表达式常见的知识点汇总

四、正则表达式模式 

1、非打印字符

python正则表达式常见的知识点汇总

 2、特殊字符

python正则表达式常见的知识点汇总

 3、定位符

python正则表达式常见的知识点汇总

4、限定符

python正则表达式常见的知识点汇总

五、替换

语法:

re.sub(pattern,repl,string,count=0)

python正则表达式常见的知识点汇总

六、贪婪模式和非贪婪模式 

Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;

非贪婪则相反,总是尝试匹配尽可能少的字符。

*,?,+,{m,n}后面加上 ?使贪婪变成非贪婪。

python正则表达式常见的知识点汇总

七、示例 

1、匹配用户名

用户名匹配:由数字、大小写字母、下划线_和中横线-组成,长度为4到14位,并且不能以数字开头。

^在括号外就是开头,在括号里就是取反

\D匹配一个非数字字符,等价于[^0-9]

[a-z0-9A-Z_\-]{3,13}表示可取范围为a-z的小写字母和数字0-9以及下划线中横线都可以,写在中括号里面的是与的关系,最后的大括号代表的是其匹配长度为[3-13](左闭右闭)(因为开头已经有一位是确定的了,所以后面的长度为[3-13])

r'^\D[a-z0-9A-Z_\-]{3,13}', 'sH_8'

2、匹配手机号

根据手机号的规则,对手机号前三位的格式进行了限制,因为有几种格式都可以,条件之间的关系为或,正则表达式中用|表示

r'^((13[0-9])|(14[5|7])|(15([0-3]|[5-9]))|(18[0,5-9]))\d{8}$'

3、匹配0~99之间的数字

开头是【1-9】中的一个数,个数为0或者1均可

后面的是【0-9】中的一个数,个数为0或者1

r'^[1-9]?[0-9]?$'

来源:https://blog.csdn.net/qq_41404557/article/details/124823119

标签:python,正则表达式,知识点
0
投稿

猜你喜欢

  • Django中模版的子目录与include标签的使用方法

    2022-07-13 03:58:40
  • asp网上购物车实例代码

    2007-10-03 13:43:00
  • 对dataframe进行列相加,行相加的实例

    2023-07-24 16:57:59
  • Python实现删除文件中含“指定内容”的行示例

    2022-01-15 02:56:28
  • numpy找出array中的最大值,最小值实例

    2021-11-20 15:42:52
  • Go语言实现二进制与十进制互转的示例代码

    2024-02-08 09:31:15
  • Node.js中环境变量process.env的一些事详解

    2024-05-13 09:28:41
  • Oracle 10g的DBA无法登录解决方案

    2009-05-24 19:38:00
  • 使用Python实现正态分布、正态分布采样

    2023-10-28 06:25:01
  • golang类型转换组件Cast的使用详解

    2024-05-08 10:22:01
  • MySQL数据入库时特殊字符处理详解

    2024-01-13 01:36:09
  • ASP+Access数据库安全设置方法小结

    2011-04-02 11:09:00
  • 如何在scrapy中捕获并处理各种异常

    2023-04-10 06:56:23
  • Django之全局使用request.user.username的实例详解

    2021-07-20 20:50:42
  • Zend Framework教程之资源(Resources)用法实例详解

    2023-11-06 02:49:50
  • 发一个数字拼图网页游戏

    2008-10-12 10:02:00
  • Python实现简单拆分PDF文件的方法

    2022-09-27 19:20:37
  • mysql 获取规定时间段内的统计数据

    2024-01-24 11:25:10
  • 菜鸟课堂:MSSQL的安全设置问题解答

    2009-10-29 13:22:00
  • python制作定时发送信息脚本的实现思路

    2023-01-17 15:24:11
  • asp之家 网络编程 m.aspxhome.com