Python使用正则表达式抓取网页图片的方法示例

作者:我要的shine 时间:2022-11-29 04:11:35 

本文实例讲述了Python使用正则表达式抓取网页图片的方法。分享给大家供大家参考,具体如下:


#!/usr/bin/python
import re
import urllib
#获取网页信息
def getHtml(url):
 page = urllib.urlopen(url)
 html = page.read()
 return html
def getImg(html):
#匹配网页中的图片
reg = r'src="(.*?\.jpg)" alt'
 imgre = re.compile(reg)
 imglist = re.findall(imgre,html)
 x = 0
 for imgurl in imglist:
   urllib.urlretrieve(imgurl,'%s.jpg' % x)
   x+=1
html = getHtml("http://photo.bitauto.com/?WT.mc_id=360tpdq")
print getImg(html)

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg

希望本文所述对大家Python程序设计有所帮助。

标签:Python,正则表达式,网页图片
0
投稿

猜你喜欢

  • php去掉数组的第一个值的两个函数:array_shift、array_splice

    2023-05-29 02:26:07
  • 使用Python编写基于DHT协议的BT资源爬虫

    2022-05-21 05:21:54
  • Python基础知识方法重写+文件处理+异常处理

    2022-09-20 06:43:43
  • Django把SQLite数据库转换为Mysql数据库的过程

    2024-01-26 09:42:35
  • Go slice切片使用示例详解

    2023-07-09 12:07:02
  • Python 获取命令行参数内容及参数个数的实例

    2023-11-03 18:00:11
  • python清除指定目录内所有文件中script的方法

    2022-04-05 15:59:47
  • python下载图片实现方法(超简单)

    2021-12-21 02:17:07
  • python+tkinter编写电脑桌面放大镜程序实例代码

    2023-08-02 17:10:43
  • 微信小程序上传图片到php服务器的方法

    2023-11-07 11:57:25
  • Go 实现热重启的详细介绍

    2024-04-25 15:06:15
  • Python中eval()函数的详细使用教程

    2023-11-22 15:51:39
  • sqlserver 多表关联时在where语句中慎用trim()方法

    2024-01-16 06:37:32
  • 为导入文件加上时间戳标记的两种方法

    2009-01-07 14:14:00
  • 对python中的iter()函数与next()函数详解

    2022-01-29 19:05:36
  • python压缩和解压缩模块之zlib的用法

    2023-09-19 08:32:07
  • Go 语言下基于Redis分布式锁的实现方式

    2024-04-25 13:17:24
  • 简单介绍各种浏览器中的本地存储方法

    2012-04-26 16:37:34
  • 在Python中表示一个对象的方法

    2023-12-25 20:04:22
  • Python3 sys.argv[ ]用法详解

    2021-08-03 00:16:29
  • asp之家 网络编程 m.aspxhome.com