python实现爬取百度图片的方法示例

作者:双歧杆菌 时间:2021-11-22 00:46:04 

本文实例讲述了python实现爬取百度图片的方法。分享给大家供大家参考,具体如下:


import json
import itertools
import urllib
import requests
import os
import re
import sys
word=input("请输入关键字:")
path="./ok"
if not os.path.exists(path):
 os.mkdir(path)
word=urllib.parse.quote(word)
url = r"http://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&fp=result&queryWord={word}&cl=2&lm=-1&ie=utf-8&oe=utf-8&st=-1&ic=0&word={word}&face=0&istype=2nc=1&pn={pn}&rn=60"
urls=(url.format(word=word,pn=x)for x in itertools.count(start=0,step=60))
index=0
str_table = {
 '_z2C$q': ':',
 '_z&e3B': '.',
 'AzdH3F': '/'
}
char_table = {
 'w': 'a',
 'k': 'b',
 'v': 'c',
 '1': 'd',
 'j': 'e',
 'u': 'f',
 '2': 'g',
 'i': 'h',
 't': 'i',
 '3': 'j',
 'h': 'k',
 's': 'l',
 '4': 'm',
 'g': 'n',
 '5': 'o',
 'r': 'p',
 'q': 'q',
 '6': 'r',
 'f': 's',
 'p': 't',
 '7': 'u',
 'e': 'v',
 'o': 'w',
 '8': '1',
 'd': '2',
 'n': '3',
 '9': '4',
 'c': '5',
 'm': '6',
 '0': '7',
 'b': '8',
 'l': '9',
 'a': '0'
}
i=1
char_table = {ord(key): ord(value) for key, value in char_table.items()}
for url in urls:
 html=requests.get(url,timeout=10).text
 a=re.compile(r'"objURL":"(.*?)"')
 downURL=re.findall(a,html)
 for t in downURL:
   for key, value in str_table.items():
       t = t.replace(key, value)
   t=t.translate(char_table)
   try:
     html_1=requests.get(t)
     if str(html_1.status_code)[0]=="4":
       print('失败1')
       continue
   except Exception as e:
     print('失败2')
     continue
   with open(path+"/"+str(i)+".jpg",'wb') as f:
     f.write(html_1.content)
   i=i+1

希望本文所述对大家Python程序设计有所帮助。

来源:https://blog.51cto.com/11623741/2093582

标签:python,爬取,百度图片
0
投稿

猜你喜欢

  • 自己收集比较强大的分页存储过程 推荐

    2011-11-03 17:10:20
  • js算法实例之字母大小写转换

    2024-04-16 08:52:05
  • python简单区块链模拟详解

    2023-11-09 12:04:57
  • PyQt5 PySide2 触摸测试功能的实现代码

    2022-06-23 22:22:25
  • MySQL 全文索引的原理与缺陷

    2024-01-16 18:54:16
  • Django 中使用流响应处理视频的方法

    2021-01-12 20:55:13
  • Pycharm创建Django项目示例实践

    2021-06-20 05:28:08
  • 构建成功web应用的十项黄金法则

    2010-09-17 19:11:00
  • 纯JavaScript实现的分页插件实例

    2024-06-09 12:08:26
  • Django 根据数据模型models创建数据表的实例

    2021-08-25 18:13:31
  • python实现简易聊天室(Linux终端)

    2022-03-30 09:44:01
  • python错误调试及单元文档测试过程解析

    2021-05-03 03:46:14
  • python如何使用replace做多字符替换

    2022-10-23 01:26:59
  • 数据库性能测试之sysbench工具的安装与用法详解

    2024-01-18 15:20:34
  • python错误处理详解

    2023-04-24 11:10:30
  • Django文件存储 自己定制存储系统解析

    2023-09-17 13:06:25
  • JavaScript 放大镜 移动镜片效果代码

    2023-08-13 08:24:08
  • Python编程中的反模式实例分析

    2021-02-01 09:54:26
  • Linux下升级安装python3.8并配置pip及yum的教程

    2022-03-08 13:17:06
  • Python区块链创建Genesis Block教程

    2022-04-17 10:44:15
  • asp之家 网络编程 m.aspxhome.com