Python使用正则表达式抓取网页图片的方法示例
作者:我要的shine 时间:2022-11-29 04:11:35
本文实例讲述了Python使用正则表达式抓取网页图片的方法。分享给大家供大家参考,具体如下:
#!/usr/bin/python
import re
import urllib
#获取网页信息
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImg(html):
#匹配网页中的图片
reg = r'src="(.*?\.jpg)" alt'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'%s.jpg' % x)
x+=1
html = getHtml("http://photo.bitauto.com/?WT.mc_id=360tpdq")
print getImg(html)
PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:
JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript
正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg
希望本文所述对大家Python程序设计有所帮助。
标签:Python,正则表达式,网页图片
0
投稿
猜你喜欢
php去掉数组的第一个值的两个函数:array_shift、array_splice
2023-05-29 02:26:07
使用Python编写基于DHT协议的BT资源爬虫
2022-05-21 05:21:54
Python基础知识方法重写+文件处理+异常处理
2022-09-20 06:43:43
Django把SQLite数据库转换为Mysql数据库的过程
2024-01-26 09:42:35
Go slice切片使用示例详解
2023-07-09 12:07:02
Python 获取命令行参数内容及参数个数的实例
2023-11-03 18:00:11
python清除指定目录内所有文件中script的方法
2022-04-05 15:59:47
python下载图片实现方法(超简单)
2021-12-21 02:17:07
python+tkinter编写电脑桌面放大镜程序实例代码
2023-08-02 17:10:43
微信小程序上传图片到php服务器的方法
2023-11-07 11:57:25
Go 实现热重启的详细介绍
2024-04-25 15:06:15
Python中eval()函数的详细使用教程
2023-11-22 15:51:39
sqlserver 多表关联时在where语句中慎用trim()方法
2024-01-16 06:37:32
为导入文件加上时间戳标记的两种方法
2009-01-07 14:14:00
对python中的iter()函数与next()函数详解
2022-01-29 19:05:36
python压缩和解压缩模块之zlib的用法
2023-09-19 08:32:07
Go 语言下基于Redis分布式锁的实现方式
2024-04-25 13:17:24
简单介绍各种浏览器中的本地存储方法
2012-04-26 16:37:34
在Python中表示一个对象的方法
2023-12-25 20:04:22
Python3 sys.argv[ ]用法详解
2021-08-03 00:16:29