Python正则表达式re.search()用法详解

作者:IT之一小佬 时间:2021-08-28 03:24:46 

re.search():匹配整个字符串,并返回第一个成功的匹配。如果匹配失败,则返回None 

Python正则表达式re.search()用法详解

pattern: 匹配的规则,

string : 要匹配的内容,

flags 标志位 这个是可选的,就是可以不写,可以写, 比如要忽略字符的大小写就可以使用标志位

flags : 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:

  1. re.I 忽略大小写

  2. re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境

  3. re.M 多行模式

  4. re.S 即为 . 并且包括换行符在内的任意字符(. 不包括换行符)

  5. re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库

  6. re.X 为了增加可读性,忽略空格和 # 后面的注释

示例代码:【检查字符串是否以 "Long" 开头并以 "China" 结尾

import re

s = "Long live the people's Republic of China"
ret = re.search("^Long.*China$", s)

print(ret)
print(ret.group())
print(ret[0])

运行结果:

Python正则表达式re.search()用法详解

 示例代码:【在字符串中搜索第一个空白字符

import re

s = "Long live the people's Republic of China"
ret = re.search("\s", s)

print(ret)
print(ret.start())

运行结果:

Python正则表达式re.search()用法详解

示例代码:【如果search未匹配到,返回None】

import re

s = "Long live the people's Republic of China"
ret = re.search("USA", s)

print(ret)

运行结果:

Python正则表达式re.search()用法详解

 示例代码:【忽略大小写】

import re

s = "Long live the people's Republic of China"
# ret1 = re.search('long', s)  这行代码直接报错
ret1 = re.search('l', s)
print(ret1)
print(ret1.span())
print(ret1.string)
print(ret1.group())

print("*" * 50)

ret2 = re.search('long', s, re.I)
print(ret2)
print(ret2.span())
print(ret2.string)
print(ret2.group())

运行结果:

Python正则表达式re.search()用法详解

示例代码:【group()的使用】 

import re

s = 'abc123def456ghi789'
ret_compile = re.compile("([a-z]*)([0-9]*)([a-z]*)")
print(ret_compile)

ret = ret_compile.search(s)
print(ret)
print(ret.group())
print(ret.group(0))  # group()和group(0) 一样匹配的是整体
print(ret.group(1))  # 匹配第1个小括号的内容
print(ret.group(2))  # 匹配第2个小括号的内容
print(ret.group(3))  # 匹配第3个小括号的内容

运行效果:

Python正则表达式re.search()用法详解

 示例代码:【group()分组的使用】

import re

s = 'abc123def456ghi789'
ret_compile = re.compile("(?P<num1>[a-z]*)(?P<num2>[0-9]*)(?P<num3>[a-z]*)")
print(ret_compile)

ret = ret_compile.search(s)
print(ret)
print(ret.group())
print(ret.group(0))  # group()和group(0) 一样匹配的是整体
print(ret.group(1))  # 匹配第1个小括号的内容
print(ret.group(2))  # 匹配第2个小括号的内容
print(ret.group(3))  # 匹配第3个小括号的内容

print("*" * 100)

print(ret.group())
print(ret.group("num1"))  # 这里效果等同于group(1)
print(ret.group("num2"))  # 这里效果等同于group(3)
print(ret.group("num3"))  # 这里效果等同于group(3)

运行效果:

Python正则表达式re.search()用法详解

总结:为匹配方便,能用search就不用match,match方法限定匹配时,头部必须是一致的

匹配演练:最后我们做些匹配演练,实战下

import re

html='''<div id="songs-list">
   <h2 class="title">经典老歌</h2>
   <p class="introduction">
       经典老歌列表
   </p>
   <ul id ="list" class="list-group">
       <li data-view="2">一路上有你</li>
       <li data-view="7">
           <a href="/2.mp3" singer="任贤齐">沧海一声笑</a>
       </li>
       <li data-view="4" class="active">
           <a href="/3.mp3" singer="齐秦">往事随风</a>
       </li>
       <li data-view="6"><a href="/4.mp3" singer="beyond">光辉岁月</a></li>
       <li data-view="5"><a href="/5.mp3" singer="陈惠琳">记事本</a></li>
       <li data-view="5">
           <a href="/6.mp3" singer="邓丽君"><i class="fa fa-user"></i>但愿人长久</a>
       </li>
   </ul>
</div>
'''

上面是html代码,要求匹配出 第3个li标签中的齐秦 往事随风 ,代码如下:

result = re.search('<li.*?active.*?singer="(.*?)">(.*?)</a>',html,re.S)#re.S确保.能匹配到换行符
if result:
   print(result.group(1),result.group(2))

结果:

齐秦 往事随风

我们还要求匹配出第二个li标签中的内容 任贤齐 沧海一声笑

result = re.search('<li.*?singer="(.*?)">(.*?)</a>',html,re.S)
if result:
   print(result.group(1),result.group(2))

结果:

任贤齐 沧海一声笑

如果匹配时候不需要匹配换行符,那么参数中就没必要带re.S,比如匹配第4个和第5个li标签中的歌手和歌名。但是re.search也仅仅是返回一个符合匹配的结果。如果我们要返回符合匹配的所有结果,要用到re.findall。这一节的re.search就说到这里。

总结 

来源:https://blog.csdn.net/weixin_44799217/article/details/122069415

标签:python,正则表达式,re.search()
0
投稿

猜你喜欢

  • Python数字图像处理代数之加减乘运算

    2023-03-20 07:51:26
  • 对pandas的行列名更改与数据选择详解

    2022-06-09 15:46:37
  • python变量赋值方法(可变与不可变)

    2021-02-14 08:51:55
  • 一起来看看python的装饰器代码

    2023-08-07 19:33:20
  • php查找指定目录下指定大小文件的方法

    2023-09-03 17:53:36
  • 在Python中的Django框架中进行字符串翻译

    2022-11-04 09:39:03
  • pip安装python库时报Failed building wheel for xxx错误的解决方法

    2021-12-12 04:55:53
  • 为什么视觉设计师需要懂HTML

    2009-06-25 14:16:00
  • SQL中自己创建函数 分割字符串

    2008-11-20 16:13:00
  • 3个asp简单技巧

    2009-11-26 20:55:00
  • Pandas对每个分组应用apply函数的实现

    2022-01-26 04:02:00
  • Oracle中命名块之存储过程的详解及使用方法

    2023-07-15 00:28:23
  • MySQL 重装笔记

    2011-02-23 12:22:00
  • 使用Python的Twisted框架编写非阻塞程序的代码示例

    2021-01-22 16:20:51
  • Django实现将views.py中的数据传递到前端html页面,并展示

    2022-04-04 10:44:56
  • Oracle数据库处理多媒体信息

    2010-07-16 13:01:00
  • ORACLE8的分区管理

    2023-07-13 14:42:43
  • 将字典转换为DataFrame并进行频次统计的方法

    2023-11-21 05:37:30
  • Python3内置模块pprint让打印比print更美观详解

    2022-02-04 01:55:28
  • Python版的文曲星猜数字游戏代码

    2023-08-12 16:39:19
  • asp之家 网络编程 m.aspxhome.com