一则python3的简单爬虫代码
时间:2022-11-29 04:46:31
不得不说python的上手非常简单。在网上找了一下,大都是python2的帖子,于是随手写了个python3的。代码非常简单就不解释了,直接贴代码。
#test rdp
import urllib.request
import re<br>
#登录用的帐户信息
data={}
data['fromUrl']=''
data['fromUrlTemp']=''
data['loginId']='12345'
data['password']='12345'
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#登录地址
#url='http://192.168.1.111:8080/loginCheck'
postdata = urllib.parse.urlencode(data)
postdata = postdata.encode('utf-8')
headers = { 'User-Agent' : user_agent }
#登录
res = urllib.request.urlopen(url,postdata)
#取得页面html<br>strResult=(res.read().decode('utf-8'))
#用正则表达式取出所有A标签
p = re.compile(r'<a href="(.*?)".*?>(.*?)</a>')
for m in p.finditer(strResult):
print (m.group(1))#group(1)是href里面的内容,group(2)是a标签里的文字
关于cookie、异常等处理看了一下,没有花时间去处理,毕竟只是想通过写爬虫来学习python。
标签:python,爬虫
0
投稿
猜你喜欢
MySQL8.0.21.0社区版安装教程(图文详解)
2024-01-20 06:33:58
python中用Scrapy实现定时爬虫的实例讲解
2023-07-26 05:47:01
Python编程之基于概率论的分类方法:朴素贝叶斯
2023-10-08 10:15:52
在Python中使用SQLite的简单教程
2022-05-12 04:01:46
使用Django和Python创建Json response的方法
2022-04-28 13:08:42
Bootstrap响应式表格详解
2023-07-02 05:23:58
收藏整理的一些Python常用方法和技巧
2023-01-04 10:42:38
python list多级排序知识点总结
2023-11-05 03:50:15
python实现计算图形面积
2021-06-01 06:18:54
详解微信小程序之提高应用速度小技巧
2024-04-22 22:17:57
MySQL复制的概述、安装、故障、技巧、工具(火丁分享)
2024-01-18 02:29:49
Python使用django搭建web开发环境
2021-02-21 06:37:32
在PyCharm中批量查找及替换的方法
2023-05-29 17:15:13
从零开始搭建基于Python的微信小程序的教程分享
2022-09-08 19:38:59
MySQL中Multiple primary key defined报错的解决办法
2024-01-13 20:35:14
一些让Python代码简洁的实用技巧总结
2022-02-06 11:03:25
js实现网页标题栏闪烁提示效果实例分析
2024-04-16 09:05:11
Python闭包之返回函数的函数用法示例
2022-12-09 18:50:41
vue如何获取指定元素
2024-05-09 15:15:19
完美解决vue中报错 “TypeError: Cannot read properties of null (reading'forEach')“
2023-07-02 17:06:29