python 实现有道翻译功能

作者:Revenant- 时间:2022-03-25 17:30:55 

目录
  • 初期操作

  • 分析参数

  • 分析salt、sign

  • Python代码

  • 运行效果

初期操作

打开有道翻译界面—F12—Network—在翻译框中输入'hello'—在Network下面发现名为'translate_o?smartresult......'返回翻译之后的数据

分析参数

把所有的Request Headers、params都写上尝试爬虫,可以得到结果。

然后Request Headers中Headers、Host、Origin、Referer三项留下,Cookie一项经尝试只有 OUTFOX_SEARCH_USER_ID=-1927650476@223.97.13.65;会验证而且尝试多次之后我这里是没有变化的。


Accept: application/json, text/javascript, */*; q=0.01
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.9
Connection: keep-alive
Content-Length: 252
Content-Type: application/x-www-form-urlencoded; charset=UTF-8
Cookie: OUTFOX_SEARCH_USER_ID=-1927650476@223.97.13.65; OUTFOX_SEARCH_USER_ID_NCOO=1897197670.972445; JSESSIONID=aaalvPunK-sv2fyR-UjEx; ___rl__test__cookies=1612924426799
Host: fanyi.youdao.com
Origin: http://fanyi.youdao.com
Referer: http://fanyi.youdao.com/
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36
X-Requested-With: XMLHttpRequest

再就是params参数,变化的是salt、sign、lts,尝试后发现lts可有可无,所以变化的只有salt、sign两项。


i: 你好
from: AUTO
to: AUTO
smartresult: dict
client: fanyideskweb
salt: 16129244361391
sign: 2820759b6e54f25e0aa94e185e2265e3
lts: 1612924436139
bv: 3da01a09873456cfb5dba05f2124b148
doctype: json
version: 2.1
keyfrom: fanyi.web
action: FY_BY_REALTlME

分析salt、sign

全局搜索sign,结果中有fanyi.min.js文件,双击进入,然后右键选择'Open in Source panel',搜索'sign',找到如下代码:


define("newweb/common/service", ["./utils", "./md5", "./jquery-1.7"], function(e, t) {
var n = e("./jquery-1.7");
e("./utils");
e("./md5");
var r = function(e) {
 var t = n.md5(navigator.appVersion)
  , r = "" + (new Date).getTime()
  , i = r + parseInt(10 * Math.random(), 10);
 return {
  ts: r,
  bv: t,
  salt: i,
  sign: n.md5("fanyideskweb" + e + i + "Tbh5E8=q6U3EXe+&L[4c@")
 }
};

可以看出salt是13位时间戳加了一个10以内的随机数,而sign是'固定字符串+e+i+固定字符串',其中i就是salt,而e经过断点调试(我选择在var t = n.md5(navigator.appVersion)这一行加断点,然后输入你好,会出现e='你好')可以得知e为我们要翻译的字符串。这样整个分析过程就结束了。

之后通过爬虫可以得到我们想要的数据,因为返回的是json数据,我们使用.json()来获得返回值更加方便。

Python代码


import hashlib
import random
import time
import requests

def get_data():
r = str(round(time.time() * 1000))
salt = r + str(random.randint(0, 9))

content = '你好'

data = "fanyideskweb" + content + salt + "Tbh5E8=q6U3EXe+&L[4c@"
sign = hashlib.md5()

sign.update(data.encode("utf-8"))

sign = sign.hexdigest()
# print(len(sign))
# print(sign)
return content, salt, sign

def send_request(content, salt, sign):
url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'

headers = {
 'Cookie': 'OUTFOX_SEARCH_USER_ID=-1927650476@223.97.13.65;',
 'Host': 'fanyi.youdao.com',
 'Origin': 'http://fanyi.youdao.com',
 'Referer': 'http://fanyi.youdao.com/',
 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.146 Safari/537.36',
}

data = {
 'i': str(content),
 'from': 'AUTO',
 'to': 'AUTO',
 'smartresult': 'dict',
 'client': 'fanyideskweb',
 'salt': str(salt),
 'sign': str(sign),
 # 'lts': '1612879546052',
 # 'bv': '6a1ac4a5cc37a3de2c535a36eda9e149',
 # 'doctype': 'json',
 'version': '2.1',
 'keyfrom': 'fanyi.web',
 'action': 'FY_BY_REALTlME',
}

res = requests.post(url=url, headers=headers, data=data).json()

print('翻译后:', res['translateResult'][0][0]['tgt'])
print('翻译前:', res['translateResult'][0][0]['src'])

if __name__ == '__main__':
content, salt, sign = get_data()
send_request(content, salt, sign)

运行效果

python 实现有道翻译功能

来源:https://www.cnblogs.com/qx123/p/14451212.html

标签:python,有道,翻译
0
投稿

猜你喜欢

  • 怎样用cmd命令行运行Python文件

    2023-07-15 00:25:11
  • Ubuntu下Anaconda和Pycharm配置方法详解

    2022-06-16 21:11:43
  • php下pdo的mysql事务处理用法实例

    2023-11-14 17:44:13
  • 解决seaborn在pycharm中绘图不出图的问题

    2023-11-29 02:22:52
  • sql 中 case when 语法使用方法

    2024-01-19 13:31:13
  • Go语言快速入门图文教程

    2023-07-23 10:30:16
  • Mysql数据库表中为什么有索引却没有提高查询速度

    2024-01-13 19:25:16
  • python 元组和列表的区别

    2021-08-25 19:01:27
  • python使用Qt界面以及逻辑实现方法

    2023-10-23 23:28:09
  • 在Django的URLconf中进行函数导入的方法

    2023-07-10 10:46:26
  • Python selenium根据class定位页面元素的方法

    2021-04-03 08:17:39
  • git恢复删除的分支及内容的方法

    2023-03-09 20:16:27
  • 前端页面文件拖拽上传模块js代码示例

    2023-09-20 02:15:30
  • Python for Informatics 第11章之正则表达式(四)

    2023-06-15 04:48:39
  • 举例讲解Linux系统下Python调用系统Shell的方法

    2023-08-25 00:04:46
  • 最基础的Python的socket编程入门教程

    2022-10-13 03:38:46
  • Varchar与char的区别

    2008-02-28 12:44:00
  • 有用的:nth-child秘方

    2011-07-01 12:56:11
  • Python 流媒体播放器的实现(基于VLC)

    2023-09-10 07:22:27
  • MySQL 4.0 升级到mysql 5.0的方法

    2024-01-18 10:07:12
  • asp之家 网络编程 m.aspxhome.com