详解用selenium来下载小姐姐图片并保存

作者:封妖师的徒弟 时间:2023-08-11 02:02:31 

下载小姐姐图片并保存

  • 请求的地址

  • 伪装

  • 定位元素

  • 下载图片

  • 保存好了

下面开始我们的实战,这个是我们今天访问的url:


url = 'http://pic.netbian.com/4kmeinv/'

1,先把包给导进来:


import requests
from selenium.webdriver import Chrome,ChromeOptions
import os

不知道怎么导包的看我的第一篇,附上链接:
https://www.jb51.net/article/204774.htm

2, 接下来就开始发送请求


#请求的url
url = 'http://pic.netbian.com/4kmeinv/'
#进行伪装
headers = {
"User_Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36"
}
#发起请求
response = requests.get(url=url,headers=headers)
#手动设定响应数据的编码格式
response.encoding = 'utf-8'
page_text = response.text
#这个就是再后台上面运行那个浏览器,不在表面上占用你的
option = ChromeOptions()
option.add_argument('--headless')
option.add_argument("--no-sandbox")
option.add_experimental_option('excludeSwitches',['enable-automation'])
#这里也要输入
browser = Chrome(options=option)
browser.get(url)

相信看过我上篇的都知道这些,那就废话不多说,定位元素:

3,定位:

先看下代码再说:


li = browser.find_elements_by_xpath('//*[@id="main"]/div[3]/ul/li')

老样子,分为三步,第一步选中所选的图片–>copy xpath–>ctrl+f -->粘贴进去可以看到是1of1,但明显我们要的是这个页面上所有的图片,所以呀,只需要改一下就可以啦,将tr[1],里面的包括括号删掉就可以。

详解用selenium来下载小姐姐图片并保存

这样的话就是整个页面内所有的图片啦,

详解用selenium来下载小姐姐图片并保存

4,创建文件以保存我们所要的图片:


#创建一个文件夹
if not os.path.exists('./小美女图'):
os.mkdir('./小美女图')

然后再循环一下就好啦:


for i in li:
img_src = i.find_element_by_xpath('./a/img').get_attribute('src')
img_name = i.find_element_by_xpath('./a/img').get_attribute('alt')+'.jpg'

至于为什么要这么写,可以看一下我的上一篇博客:

https://www.jb51.net/article/204771.htm

5,保存


img_data = requests.get(url=img_src,headers=headers).content
img_path = '小美女图/'+img_name
with open(img_path,'wb') as fp:
 fp.write(img_data)
 print(img_name,'下载成功!!!')

最后的结果哈哈哈哈:这个也不存在什么图片尺寸过大啥的,如果错了,多半是你元素没有定位好。

详解用selenium来下载小姐姐图片并保存

来源:https://blog.csdn.net/xy52wiue/article/details/113063806

标签:selenium,下载,图片
0
投稿

猜你喜欢

  • python pandas读取csv后,获取列标签的方法

    2022-01-14 22:35:30
  • MySql 8.0.16版本安装提示已经不使用“UTF8B3”而是使用“UTF8B4”问题

    2024-01-23 12:43:57
  • Python模拟鼠标点击实现方法(将通过实例自动化模拟在360浏览器中自动搜索python)

    2021-06-11 17:17:54
  • 基于Python中的turtle绘画星星和星空

    2022-10-31 08:57:41
  • MySQL的数据库数据备份和恢复详解

    2012-01-29 18:19:07
  • MySQL与MSSQl使用While语句循环生成测试数据的代码

    2024-01-22 01:42:47
  • Python Excel数据处理之xlrd/xlwt/xlutils模块详解

    2022-03-28 16:45:53
  • 在Mac中配置Python虚拟环境过程解析

    2023-11-14 06:55:43
  • IE8网页显示不正常 用”兼容性视图”搞定

    2009-03-28 11:13:00
  • 如何用Matlab和Python读取Netcdf文件

    2023-03-19 11:19:30
  • 初学者必读:经典的数据库记录分页代码

    2009-01-08 15:27:00
  • Windows安装MySQL8.0.28.0.msi方式(图文详解)

    2024-01-24 14:55:24
  • js截取字符串的方法

    2008-04-20 17:06:00
  • Python3最长回文子串算法示例

    2023-05-27 14:17:10
  • 深入Golang的接口interface

    2024-02-20 14:12:00
  • 提升网站可用性的3个忠告

    2008-01-31 13:48:00
  • Python第三方库face_recognition在windows上的安装过程

    2023-07-27 02:51:29
  • 一次数据库查询超时优化问题的实战记录

    2024-01-25 18:03:11
  • MySQL DBA教程:Mysql性能优化之缓存参数优化

    2024-01-21 19:11:56
  • Python实现图片查找轮廓、多边形拟合、最小外接矩形代码

    2021-03-27 05:34:56
  • asp之家 网络编程 m.aspxhome.com