详解用selenium来下载小姐姐图片并保存
作者:封妖师的徒弟 时间:2023-08-11 02:02:31
下载小姐姐图片并保存
请求的地址
伪装
定位元素
下载图片
保存好了
下面开始我们的实战,这个是我们今天访问的url:
url = 'http://pic.netbian.com/4kmeinv/'
1,先把包给导进来:
import requests
from selenium.webdriver import Chrome,ChromeOptions
import os
不知道怎么导包的看我的第一篇,附上链接:
https://www.jb51.net/article/204774.htm
2, 接下来就开始发送请求
#请求的url
url = 'http://pic.netbian.com/4kmeinv/'
#进行伪装
headers = {
"User_Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36"
}
#发起请求
response = requests.get(url=url,headers=headers)
#手动设定响应数据的编码格式
response.encoding = 'utf-8'
page_text = response.text
#这个就是再后台上面运行那个浏览器,不在表面上占用你的
option = ChromeOptions()
option.add_argument('--headless')
option.add_argument("--no-sandbox")
option.add_experimental_option('excludeSwitches',['enable-automation'])
#这里也要输入
browser = Chrome(options=option)
browser.get(url)
相信看过我上篇的都知道这些,那就废话不多说,定位元素:
3,定位:
先看下代码再说:
li = browser.find_elements_by_xpath('//*[@id="main"]/div[3]/ul/li')
老样子,分为三步,第一步选中所选的图片–>copy xpath–>ctrl+f -->粘贴进去可以看到是1of1,但明显我们要的是这个页面上所有的图片,所以呀,只需要改一下就可以啦,将tr[1],里面的包括括号删掉就可以。
这样的话就是整个页面内所有的图片啦,
4,创建文件以保存我们所要的图片:
#创建一个文件夹
if not os.path.exists('./小美女图'):
os.mkdir('./小美女图')
然后再循环一下就好啦:
for i in li:
img_src = i.find_element_by_xpath('./a/img').get_attribute('src')
img_name = i.find_element_by_xpath('./a/img').get_attribute('alt')+'.jpg'
至于为什么要这么写,可以看一下我的上一篇博客:
https://www.jb51.net/article/204771.htm
5,保存
img_data = requests.get(url=img_src,headers=headers).content
img_path = '小美女图/'+img_name
with open(img_path,'wb') as fp:
fp.write(img_data)
print(img_name,'下载成功!!!')
最后的结果哈哈哈哈:这个也不存在什么图片尺寸过大啥的,如果错了,多半是你元素没有定位好。
来源:https://blog.csdn.net/xy52wiue/article/details/113063806
标签:selenium,下载,图片


猜你喜欢
python pandas读取csv后,获取列标签的方法
2022-01-14 22:35:30
MySql 8.0.16版本安装提示已经不使用“UTF8B3”而是使用“UTF8B4”问题
2024-01-23 12:43:57
Python模拟鼠标点击实现方法(将通过实例自动化模拟在360浏览器中自动搜索python)
2021-06-11 17:17:54

基于Python中的turtle绘画星星和星空
2022-10-31 08:57:41

MySQL的数据库数据备份和恢复详解
2012-01-29 18:19:07
MySQL与MSSQl使用While语句循环生成测试数据的代码
2024-01-22 01:42:47
Python Excel数据处理之xlrd/xlwt/xlutils模块详解
2022-03-28 16:45:53

在Mac中配置Python虚拟环境过程解析
2023-11-14 06:55:43
IE8网页显示不正常 用”兼容性视图”搞定
2009-03-28 11:13:00

如何用Matlab和Python读取Netcdf文件
2023-03-19 11:19:30

初学者必读:经典的数据库记录分页代码
2009-01-08 15:27:00
Windows安装MySQL8.0.28.0.msi方式(图文详解)
2024-01-24 14:55:24

js截取字符串的方法
2008-04-20 17:06:00
Python3最长回文子串算法示例
2023-05-27 14:17:10
深入Golang的接口interface
2024-02-20 14:12:00

提升网站可用性的3个忠告
2008-01-31 13:48:00
Python第三方库face_recognition在windows上的安装过程
2023-07-27 02:51:29
一次数据库查询超时优化问题的实战记录
2024-01-25 18:03:11

MySQL DBA教程:Mysql性能优化之缓存参数优化
2024-01-21 19:11:56
Python实现图片查找轮廓、多边形拟合、最小外接矩形代码
2021-03-27 05:34:56
