基于python爬取有道翻译过程图解

作者:何梦吉他 时间:2021-11-03 23:57:27 

1.准备工作

先来到有道在线翻译的界面http://fanyi.youdao.com/

F12 审查元素 ->选Network一栏,然后F5刷新 (如果看不到Method一栏,右键Name栏,选中Method)

基于python爬取有道翻译过程图解

输入文字自动翻译后发现Method一栏有GET还有POST;GET是指从服务器请求和获得数据,POST是向指定服务器提交被处理的数据、

随便打开一个POST,找到preview可以看到我们输入的“我爱你一生一世”数据,可以证明post的提交数据的

基于python爬取有道翻译过程图解

下面分析一下Headers各个字段的意义;User-agent字段很重要

基于python爬取有道翻译过程图解

基于python爬取有道翻译过程图解

下面来看一下request模块中urlopen方法,查看文档;

发现urlopen有一个data参数,如果参数没赋值(默认None)就是GET形式,如果data参数被赋值了,就以POST形式提交

基于python爬取有道翻译过程图解

在这里,data参数其实是一个字典 ;就是源代码中From Data的数据

下面一篇文章是对urlencode与unquote的详细解释:(urllib库里可惜没有urldecode函数)

https://www.jb51.net/article/183857.htm

为什么要进行编码和解码呢?------》对于一些中文或者字符,url是不识别的,需要进行编码转换!encode('utf-8')把unicode的形式变成utf-8decode('utf-8')把utf-8形式变成Unicode编码形式2.下面进行敲!

来源:https://www.cnblogs.com/hemengjita/p/12341762.html

标签:python,爬取,有道,翻译
0
投稿

猜你喜欢

  • python的格式化输出(format,%)实例详解

    2022-03-20 04:17:57
  • 使用Python中的pytesseract模块实现抓取图片中文字

    2021-05-06 18:10:28
  • CentOS7.4手动安装MySQL5.7的方法

    2024-01-28 01:12:20
  • python的django写页面上传文件及遇到的问题小结

    2022-02-28 23:21:10
  • 关于python多重赋值的小问题

    2023-08-04 06:38:16
  • python中的% 是什么意思,起到什么作用呢

    2021-12-12 00:20:58
  • SQL--JOIN之完全用法

    2008-09-12 17:30:00
  • Python项目文件中安装 setup.py的步骤

    2023-10-24 15:06:01
  • 页面重构应注意的repaint和reflow

    2011-03-31 17:11:00
  • js+html制作简单验证码

    2024-04-19 10:44:33
  • Python设计模式之状态模式原理与用法详解

    2022-04-16 06:37:36
  • ASP XML制作菜单管理程序

    2011-04-04 11:15:00
  • sql server 2008 压缩备份数据库(20g)

    2024-01-15 09:23:41
  • 利用python如何在前程无忧高效投递简历

    2022-10-26 22:33:02
  • Python标准库之Math,Random模块使用详解

    2021-02-09 22:33:13
  • python 字典 setdefault()和get()方法比较详解

    2022-12-11 01:28:41
  • Python列表元素删除和remove()方法详解

    2023-04-07 08:48:54
  • 浅谈JavaScript的自动垃圾收集机制

    2023-08-13 15:18:57
  • web项目中golang性能监控解析

    2024-02-18 17:28:23
  • 一篇文章看懂SQL中的开窗函数

    2024-01-16 07:22:05
  • asp之家 网络编程 m.aspxhome.com