用Python爬取某乎手机APP数据

作者:不加班的程序员丶 时间:2021-02-03 17:04:59 

一、配置抓包工具

1.安装软件

本文选择的抓包工具:Fiddler  

具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!

2.配置Fiddler

安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!

配置Connections

打开Fiddler后,点击Tools->Options

用Python爬取某乎手机APP数据

点击Connections

用Python爬取某乎手机APP数据

勾选上对应的选项

配置HTTPS

由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!

用Python爬取某乎手机APP数据

勾选上对应的选项

最后抓包工具Fiddler就配置好了

记得重启Fiddler重启Fiddler重启Fiddler!不然可能不生效

二、配置手机代理

 1.设置代理

准备工作

首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网

查看ip命令


window:ipconfig

用Python爬取某乎手机APP数据

开始配置

目标代理主机信息
ip:192.168.31.195

端口:8888

在wifi无线网处进去,点击配置代理

填写好相关代理信息

用Python爬取某乎手机APP数据

2.安装证书

在浏览器输入:


http://192.168.31.195:8888

用Python爬取某乎手机APP数据

点击下载证书后,下面就开始安装(看图操作

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

ok,这样手机端就配置完成,下面开始抓取数据!!!

三、抓取数据

1.打开某乎app

用Python爬取某乎手机APP数据

2.查看数据包列表

打开app之后,Fiddler就已经抓取到数据了

用Python爬取某乎手机APP数据

这里可以看到app发送和接收了哪些数据包

为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件

用Python爬取某乎手机APP数据

这样我们获取的数据包列表就都是过滤条件内的目标网址

用Python爬取某乎手机APP数据

3.查找数据包

比如点击热榜

用Python爬取某乎手机APP数据

对应的https加密数据包如下:

用Python爬取某乎手机APP数据

数据包中的数据如下:

用Python爬取某乎手机APP数据

提取出url链接

用Python爬取某乎手机APP数据


https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0

拿到url之后,接着开始编程爬取保存数据。

4.编写爬虫程序


# -*- coding: utf-8 -*-

用Python爬取某乎手机APP数据

ok这样就可以将数据获取下来!

四、总结

1.配置抓包工具Fiddler(重点)。

2.ios苹果手机配置证书和设置代理(安卓手机也类似)。

3.简单使用Fiddler(过滤数据包、查看数据包等)。

4.本文以某乎为实战,实现了python爬取手机app数据

来源:https://blog.csdn.net/lh9987/article/details/117855406

标签:Python,爬取,手机app,数据
0
投稿

猜你喜欢

  • TensorFlow 2.0之后动态分配显存方式

    2023-12-20 05:25:17
  • Python PyQt5模块实现一个浏览器的示例代码

    2022-02-22 04:23:47
  • Django 外键的使用方法详解

    2022-10-16 14:30:51
  • Python XlsxWriter模块Chart类用法实例分析

    2021-05-21 14:02:57
  • Python中字符串的基础介绍及常用操作总结

    2022-04-12 18:01:03
  • Web端扫码登录的原理和实现讲解

    2022-07-08 11:40:18
  • python实现3D地图可视化

    2023-08-27 10:24:50
  • TensorFlow人工智能学习数据类型信息及转换

    2022-11-02 09:12:55
  • python线性插值解析

    2021-07-01 21:31:17
  • Go语言的变量定义详情

    2024-04-27 15:41:03
  • python实现对excel中需要的数据的单元格填充颜色

    2023-03-04 13:02:39
  • 跟老齐学Python之有容乃大的list(1)

    2021-08-17 00:27:09
  • python try 异常处理(史上最全)

    2021-11-19 21:03:04
  • TypeScript入门-接口

    2024-06-07 15:55:26
  • HTML+JS实现经典推箱子游戏

    2024-04-29 13:39:38
  • python学习笔记之调用eval函数出现invalid syntax错误问题

    2023-11-03 01:48:30
  • 解决win7操作系统Python3.7.1安装后启动提示缺少.dll文件问题

    2021-08-09 00:56:29
  • Python实现PS图像调整黑白效果示例

    2022-08-06 09:15:13
  • 解决mysql8.0.19 winx64版本的安装问题

    2024-01-24 01:02:17
  • Mysql分库分表之后主键处理的几种方法

    2024-01-20 21:00:09
  • asp之家 网络编程 m.aspxhome.com