python获取糗百图片代码实例

时间:2022-09-10 01:44:01 


from sgmllib import SGMLParser
import urllib2

class sgm(SGMLParser):
    def reset(self):
        SGMLParser.reset(self)
        self.srcs=[]
        self.ISTRUE=True

    def start_div(self,artts):
        for k,v in artts:
            if v=="author":
                self.ISTRUE=False
    def end_div(self):
        self.ISTRUE=True
    def start_img(self,artts):
        for k,v in artts:
            if k=="src" and self.ISTRUE==True:
                self.srcs.append(v)

    def download(self):
        for src in self.srcs:
            f=open(src[-12:],"wb")
            print src
            img=urllib2.urlopen(src)
            f.write(img.read())
            f.close()
sgm=sgm()
for page in range(1,500):
    url="http://www.qiushibaike.com/late/page/%s?s=4622726" % page
    data=urllib2.urlopen(url).read()
    sgm.feed(data)
    sgm.download()


标签:python,糗百图片
0
投稿

猜你喜欢

  • Perl的经典用法分享

    2023-07-22 15:17:40
  • php查询mysql数据库并将结果保存到数组的方法

    2023-07-20 17:47:32
  • Pytorch 和 Tensorflow v1 兼容的环境搭建方法

    2022-04-05 12:19:06
  • Vue+Jwt+SpringBoot+Ldap完成登录认证的示例代码

    2024-05-09 09:38:16
  • Python获取时间范围内日期列表和周列表的函数

    2023-03-25 15:16:39
  • 使用python实现excel的Vlookup功能

    2023-05-01 20:15:15
  • 禁止使用 Firebug

    2009-05-20 12:04:00
  • Asp操作Xml的精炼类,含示例代码

    2011-02-28 11:11:00
  • 在django admin详情表单显示中添加自定义控件的实现

    2023-09-24 18:56:00
  • python使用分治法实现求解最大值的方法

    2021-07-14 12:06:09
  • JAVA正则表达式匹配多个空格的解决方案

    2022-07-29 14:39:31
  • python中list循环语句用法实例

    2022-09-12 15:08:05
  • Python爬虫实现的根据分类爬取豆瓣电影信息功能示例

    2022-10-14 04:27:51
  • python自动化测试无法启动谷歌浏览器问题

    2021-01-08 21:35:54
  • MySQL Redo与Undo日志详细解析

    2024-01-26 04:40:09
  • Python生成随机验证码代码实例解析

    2023-08-28 20:48:58
  • CentOS7.4 源码安装MySQL8.0的教程详解

    2024-01-20 01:44:47
  • sqlserver附加.mdf权限问题解决

    2024-01-17 15:46:20
  • ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/tmp/mysql.sock'

    2024-01-15 21:45:27
  • MySQL多表查询与7种JOINS的实现举例

    2024-01-12 23:34:32
  • asp之家 网络编程 m.aspxhome.com