一则python3的简单爬虫代码

时间:2022-11-29 04:46:31 

不得不说python的上手非常简单。在网上找了一下,大都是python2的帖子,于是随手写了个python3的。代码非常简单就不解释了,直接贴代码。


#test rdp
import urllib.request
import re<br>
#登录用的帐户信息
data={}
data['fromUrl']=''
data['fromUrlTemp']=''
data['loginId']='12345'
data['password']='12345'
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#登录地址
#url='http://192.168.1.111:8080/loginCheck'
postdata = urllib.parse.urlencode(data)
postdata = postdata.encode('utf-8')
headers = { 'User-Agent' : user_agent }
#登录
res = urllib.request.urlopen(url,postdata)
#取得页面html<br>strResult=(res.read().decode('utf-8'))
#用正则表达式取出所有A标签
p = re.compile(r'<a href="(.*?)".*?>(.*?)</a>')
for m in p.finditer(strResult):
    print (m.group(1))#group(1)是href里面的内容,group(2)是a标签里的文字

关于cookie、异常等处理看了一下,没有花时间去处理,毕竟只是想通过写爬虫来学习python。

标签:python,爬虫
0
投稿

猜你喜欢

  • MySQL8.0.21.0社区版安装教程(图文详解)

    2024-01-20 06:33:58
  • python中用Scrapy实现定时爬虫的实例讲解

    2023-07-26 05:47:01
  • Python编程之基于概率论的分类方法:朴素贝叶斯

    2023-10-08 10:15:52
  • 在Python中使用SQLite的简单教程

    2022-05-12 04:01:46
  • 使用Django和Python创建Json response的方法

    2022-04-28 13:08:42
  • Bootstrap响应式表格详解

    2023-07-02 05:23:58
  • 收藏整理的一些Python常用方法和技巧

    2023-01-04 10:42:38
  • python list多级排序知识点总结

    2023-11-05 03:50:15
  • python实现计算图形面积

    2021-06-01 06:18:54
  • 详解微信小程序之提高应用速度小技巧

    2024-04-22 22:17:57
  • MySQL复制的概述、安装、故障、技巧、工具(火丁分享)

    2024-01-18 02:29:49
  • Python使用django搭建web开发环境

    2021-02-21 06:37:32
  • 在PyCharm中批量查找及替换的方法

    2023-05-29 17:15:13
  • 从零开始搭建基于Python的微信小程序的教程分享

    2022-09-08 19:38:59
  • MySQL中Multiple primary key defined报错的解决办法

    2024-01-13 20:35:14
  • 一些让Python代码简洁的实用技巧总结

    2022-02-06 11:03:25
  • js实现网页标题栏闪烁提示效果实例分析

    2024-04-16 09:05:11
  • Python闭包之返回函数的函数用法示例

    2022-12-09 18:50:41
  • vue如何获取指定元素

    2024-05-09 15:15:19
  • 完美解决vue中报错 “TypeError: Cannot read properties of null (reading'forEach')“

    2023-07-02 17:06:29
  • asp之家 网络编程 m.aspxhome.com