Python实现批量下载图片的方法

作者:沉淀岁月 时间:2022-11-17 07:20:08 

本文实例讲述了Python实现批量下载图片的方法。分享给大家供大家参考。具体实现方法如下:


#!/usr/bin/env python
#-*-coding:utf-8-*-'
#Filename:download_file.py
import os,sys
import re
import urllib
import urllib2
base_url = 'xxx'
array_url = list()
pic_url = list()
inner_url = list()
def get_array_url(array_url,base_url):
 content = urllib.urlopen(base_url).read()
 array_url_a = re.findall(r'/rihan.*?.html',content)
 for url in array_url_a:
   url_a = 'xxx'+url
   #print url_a
   array_url.append(url_a)
def get_inner_url(array_url,inner_url):
 inner_url.append(array_url)
 content = urllib.urlopen(array_url[10]).read()
 content = content.replace(" ","")
 url_a = re.findall(r'<li>.*?</li>',content)
 for i in url_a:
   url = re.findall(r'ahref=\\'.*?.html\\'target',i)
   if len(url)>0:
     # print url[0]
     url_b = re.sub(r'ahref=\\'','',url[0])
     # print url_b
     url_c = re.sub(r'\\'target','',url_b)
     url_c = 'http://xxx/'+re.sub(r'/.*/','',url_c)
     inner_url.append(url_c)
 del inner_url[1]
 # print inner_url
def get_pic_url(pic_url,inner_url,array_url):
 content = urllib.urlopen(array_url).read()
 pic_url_a = re.findall(r'center.*?.jpg',content)
 print 'bbbbbbbbb',len(pic_url_a)
 pic_url_a = re.findall(r'http://.*.jpg',pic_url_a[0])
 pic_url.append(pic_url_a[0])
 j=2
 for i in inner_url:
   jj = '/'+str(j)+'.jpg'
   pic = re.sub(r'/1.jpg',jj,pic_url_a[0])
   pic_url.append(pic)
   j = j+1
 del pic_url[-1]
 for i in pic_url:
   print i
def urlcallback(a,b,c):
 """
   call back function
   a,已下载的数据块
   b,数据块的大小
   c,远程文件的大小
 """
 print "callback"
 prec=100.0*a*b/c
 if 100 < prec:
   prec=100
 print "%.2f%%"%(prec,)
def download(img_url,file_num):
   for img in img_url:
     print img
     img_name = re.sub(r'http://.*/','',img)
     path = 'C:/'+str(file_num)+'/'+img_name
     urllib.urlretrieve(img,path,urlcallback)
get_array_url(array_url,base_url)
file_num = 3
#download(pic_url,file_num)
get_inner_url(url,inner_url)
get_pic_url(pic_url,inner_url,url)
'''
for url in array_url:
 print url
 # get_inner_url(url,inner_url)
# get_pic_url(pic_url,inner_url)
 get_inner_url(url,inner_url)
 get_pic_url(pic_url,inner_url,url)
 download(pic_url,file_num)
 file_num = file_num+1
 del inner_url[:]
 del pic_url[:]
'''

希望本文所述对大家的Python程序设计有所帮助。

标签:Python,图片
0
投稿

猜你喜欢

  • Pytorch Tensor的索引与切片例子

    2022-12-08 16:28:10
  • 后工业时代的后规范思考2——如何应用

    2009-06-05 12:35:00
  • Python爬取奶茶店数据分析哪家最好喝以及性价比

    2021-02-19 08:41:45
  • Python中表达式x += y和x = x+y 的区别详解

    2022-02-24 04:11:19
  • String 的扩展方法

    2008-05-12 22:36:00
  • python猜数字小游戏实现代码

    2022-04-20 19:01:43
  • 对pytorch网络层结构的数组化详解

    2023-09-02 12:10:09
  • 如何使用 SQL Server 数据库查询累计值

    2008-12-03 15:27:00
  • PDO::errorCode讲解

    2023-06-08 03:39:17
  • 使用python实现一个简单ping pong服务器

    2022-10-25 03:38:48
  • javascript面向对象技术基础(一)

    2010-02-07 13:01:00
  • Python环境使用OpenCV检测人脸实现教程

    2022-01-24 11:31:21
  • IE8 的 noscript 标签 Bug

    2009-08-18 12:37:00
  • 设计良好网页的4项原则

    2009-04-24 12:48:00
  • Python爬虫实战之虎牙视频爬取附源码

    2021-04-02 01:23:27
  • php实现XSS安全过滤的方法

    2024-05-05 09:16:15
  • PyQt5 QListWidget选择多项并返回的实例

    2022-12-14 07:49:25
  • 深入Python解释器理解Python中的字节码

    2022-04-28 18:29:33
  • Python编程之gui程序实现简单文件浏览器代码

    2021-08-20 11:09:36
  • ASP分页和日期格式化为RFC822格式的办法

    2008-11-21 15:46:00
  • asp之家 网络编程 m.aspxhome.com