解决Python发送Http请求时,中文乱码的问题

作者:yuth 时间:2021-02-02 05:11:39 

解决方法:

先encode再quote。

原理:

msg.encode('utf-8')是解决中文乱码问题。

quote():假如URL的 name 或者 value 值中有『&』、『%』或者『=』等符号,就会有问题。所以URL中的参数字符串也需要把『&=』等符号进行编码,quote()就是对参数字符串中的『&=%』等符号进行编码。

例子:


# -*- coding: UTF-8 -*-
# python2.7
from urllib import quote
import requests

def httpGet(sUrl):
header = {}
try:
 response=requests.get(sUrl, headers=header)
 sText = response.text
 return sText
except BaseException:
 print BaseException

def demo(msg):
sEncodeMsg = quote(msg.encode('utf-8'))
url = 'http://www.youdao.com/w/eng/' + sEncodeMsg
print httpGet (url)

demo(u'90%的数据')

补充知识:python 用Request payload 翻页获取不同的返回值

我就废话不多说啦,直接看代码吧!


headers={'Accept':'*/*',
'Accept-Encoding': 'gzip, deflate',
'Accept-Language': 'zh-CN,zh;q=0.9',
'Ajax-method': 'GetPageJYXTXXFB',
'Connection': 'keep-alive',
'Content-Length': '129',
'Content-Type': 'text/plain; charset=UTF-8',
'Cookie': 'ASP.NET_SessionId=vdl5ooxkjkazwszgvj5woewh',
'Host': 'ggzy.yibin.gov.cn',
'Origin': 'http://ggzy.yibin.gov.cn',
'Referer': 'http://ggzy.yibin.gov.cn/Jyweb/ZhaoBaoGongGaoList.aspx?Type=%e5%bb%ba%e8%ae%be%e5%b7%a5%e7%a8%8b&SubType=260',
'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.62 Safari/537.36',
}      #模仿浏览器
payload=[i*15,15,"FBSJ DESC","XMMC","","XXLB ={0} AND XTType={1} AND ZBFS != 2","[{\"pvalue\":\"260\"},{\"pvalue\":\"1\"}]"] #Request payload里面的信息

rsp=requests.post(url1,data=json.dumps(payload),headers = headers) #用Request payload里面的信息发送post请求
data_a=rsp.content

def parse_js(expr):
obj = eval(expr, type('Dummy', (dict,), dict(__getitem__=lambda s, n: n))())
return obj

list_a = parse_js(data_a)    # 把 json字典({KEY:'value'}) 转换为python的字典({'key':'value'})

来源:https://blog.csdn.net/yuhentian/article/details/78163444

标签:Python,Http,中文,乱码
0
投稿

猜你喜欢

  • JavaScript ES6 Class类实现原理详解

    2024-02-24 07:54:49
  • 妙用Dreamweaver MX共享Word XP文件

    2010-09-05 21:17:00
  • 微信小程序有旋转动画效果的音乐组件实例代码

    2024-05-02 16:11:35
  • tensorflow如何批量读取图片

    2023-10-25 03:50:25
  • css2.1实现多重背景和边框效果

    2010-06-23 19:02:00
  • PyCharm设置中文(汉化与解除汉化)的方法

    2021-02-04 19:11:30
  • Oracle 插入超4000字节的CLOB字段的处理方法

    2009-07-12 18:52:00
  • golang gorm更新日志执行SQL示例详解

    2024-04-23 09:46:24
  • 大数据量时提高分页的效率

    2024-01-25 09:07:37
  • ElasticSearch核心概念

    2023-11-29 00:49:05
  • SqlServer数据库提示 “tempdb” 的日志已满 问题解决方案

    2024-01-28 10:39:47
  • asp如何修改WINNT的登录密码?

    2010-06-10 17:06:00
  • MySQL 性能优化的最佳20多条经验分享

    2024-01-22 00:42:49
  • 深入解析Golang中JSON的编码与解码

    2023-07-04 12:45:32
  • SQL Server数据库简体繁体数据混用的问题

    2008-12-05 16:07:00
  • Python中itertools模块用法详解

    2023-05-28 05:00:27
  • 解决Jupyter Notebook使用parser.parse_args出现错误问题

    2023-05-09 17:41:42
  • JavaScript编制留言簿程序代码第1/3页

    2024-04-22 13:23:44
  • MySQL设置global变量和session变量的两种方法详解

    2024-01-20 23:34:16
  • python开发之Docker入门安装部署教程

    2022-12-08 18:31:28
  • asp之家 网络编程 m.aspxhome.com