python中urllib模块用法实例详解

作者:shichen2014 时间:2022-02-05 13:23:33 

本文实例讲述了python中urllib模块用法。分享给大家供大家参考。具体分析如下:

一、问题:

近期公司项目的需求是根据客户提供的api,我们定时去获取数据, 之前的方案是用php收集任务存入到redis队列,然后在linux下做一个常驻进程跑某一个php文件, 该php文件就一个无限循环,判断redis队列,有就执行,没有就break.

二、解决方法:

最近刚好学了一下python, python的urllib模块或许比php的curl更快,而且简单. 贴一下代码

#_*_ coding:utf-8 _*_
import sys
reload(sys)
sys.setdefaultencoding( "utf-8" )
import os
import json
from urllib import urlopen
doc = urlopen("http://xxxx?webid=1&tid=901&cateid=101").read()
doc = json.loads(doc)
print doc
print doc.keys()
print doc["msg"]
print doc['data']
print doc['ret']


发现第一次访问所需要的时间为[Finished in 3.0s]
而第二次访问的时间为[Finished in 0.2s]
可见python的urllib模块是加有缓存的
urllib/2用法典型的例子

    import urllib2
    import cookielib
    import urllib

    class Hi_login:
        def __init__(self):
            cookie = cookielib.CookieJar()
            self.cookie = urllib2.HTTPCookieProcessor(cookie) ##### 生成cookie ###

        def login(self,user,pwd):
            url='http://passport.baidu.com/?login'
            postdata=urllib.urlencode({
          'mem_pass':'on',
       
          'password':pwd
           'Submit':'',
          'tpl':'sp',
          'tp_reg':'sp',
          'u' :'http://hi.baidu.com',
          'username':user})
            ### proxy_support = urllib2.ProxyHandler({"http":"http://ahad-haam:3128"}) 然后加入opener方法里####
            opener = urllib2.build_opener(self.cookie) ### 使用cookie ###
            headers = { ####### dict结构,可以加入x-forward-for甚至refer等 #######
           'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
            urllib2.install_opener(opener)
            request = urllib2.Request(url,urllib.urlencode(postdata),headers = headers)
            urllib2.urlopen(request)
    if __name__=='__main__':
       pwd='123456'
       user='xiaofu'
       test=Hi_login()
       test.login(user,pwd)
假如访问需要认证的页面比如nagios监控页面等,

    import urllib2
    password_mgr = urllib2.HTTPPasswordMgrWithDefaultRealm()
    url = "http://202.1.x.y/nagios"
    password_mgr.add_password(None, url, user='abc',passwd='xxxxxx')
    handler = urllib2.HTTPBasicAuthHandler(password_mgr)
    opener = urllib2.build_opener(handler)
    urllib2.install_opener(opener)
    f=urllib2.urlopen(url)
    print f.code


返回结果200,否则就是401认证错误

希望本文所述对大家的Python程序设计有所帮助。

标签:python,urllib,模块
0
投稿

猜你喜欢

  • python XlsxWriter模块创建aexcel表格的实例讲解

    2023-08-30 02:20:47
  • python中用ggplot绘制画图实例讲解

    2023-07-04 07:25:16
  • 间歇向上无缝翻滚代码

    2008-05-05 12:30:00
  • Python3利用Dlib19.7实现摄像头人脸识别的方法

    2022-08-08 06:41:22
  • Go流程控制代码详解

    2023-09-01 10:21:12
  • 使用 createProcessingInstruction 方法不能输出 encoding 的解决方法

    2009-03-10 18:22:00
  • Go语言区别于其他语言的特性

    2023-06-26 02:52:10
  • tensorflow基于CNN实战mnist手写识别(小白必看)

    2021-01-26 22:33:42
  • python列表推导式入门学习解析

    2022-04-25 14:28:00
  • python复制文件到指定目录的实例

    2021-03-17 17:10:26
  • firefox通过XUL实现text-overflow:ellipsis的效果

    2008-07-08 19:12:00
  • 深入浅析python 协程与go协程的区别

    2022-02-16 23:57:26
  • js 混淆加密工具代码

    2007-09-22 18:10:00
  • Python3中常用的处理时间和实现定时任务的方法的介绍

    2022-05-13 09:25:25
  • JavaScript中Object基础内部方法图

    2023-08-15 02:36:11
  • Python利用plotly绘制正二十面体详解

    2021-07-25 13:14:27
  • Web标准学习:CSS样式书写风格

    2008-03-25 09:37:00
  • 详解Python with/as使用说明

    2022-10-29 08:01:26
  • Python上下文管理器Content Manager

    2021-08-22 23:47:11
  • 带农历的JavaScript日期时间js代码

    2010-08-01 10:29:00
  • asp之家 网络编程 m.aspxhome.com