解决python3爬虫无法显示中文的问题

作者:正义狂哥 时间:2022-11-27 15:18:59 

有时候使用python从网站上爬数据的时候,如果数据里包含中文,有时候显示的却是如下所示...\xe4\xba\xba\xef\xbc\x8c\xe6...类似与国际化

解决方法:


import urllib.request
import sys

weburl="..."
webhead=...
req=urllib.request.Request(url=weburl,headers=webhead)
response=urllib.request.urlopen(req)
content = response.read()
#获得系统的编码
type = sys.getfilesystemencoding()
#设置爬出内容的编码
content = content.decode(type)
file = open("c。txt",'w',10000)
file.write(str(content))
file.close()
print(content)

来源:https://blog.csdn.net/zhengyikuangge/article/details/72773087

标签:python3,爬虫,中文,乱码
0
投稿

猜你喜欢

  • Python画图时如何调用本地字体

    2023-08-02 08:51:31
  • Python 进程操作之进程间通过队列共享数据,队列Queue简单示例

    2023-06-01 12:17:58
  • python里读写excel等数据文件的6种常用方式(小结)

    2021-04-09 08:11:52
  • python 装饰器的使用示例

    2021-05-15 00:52:09
  • python类中super()和__init__()的区别

    2021-04-17 16:03:02
  • Python 定义只读属性的实现方式

    2023-04-28 01:11:22
  • Python机器学习库scikit-learn使用详解

    2021-08-03 08:21:41
  • 一个完美网站的101项指标.第四部分.设计

    2008-02-29 22:22:00
  • python如何实现反向迭代

    2023-05-17 17:37:55
  • IE6实现min-width

    2008-06-12 12:40:00
  • TensorFlow的环境配置与安装方法

    2022-10-29 12:23:19
  • 使用Python绘制三种概率曲线详解

    2022-07-27 00:21:01
  • SQL存储过程介绍

    2008-02-13 18:52:00
  • 磁盘缓存专题之一 缓存命中和缓存未命中&缓存与缓冲间的差异

    2012-10-07 11:02:46
  • python爬虫实现POST request payload形式的请求

    2023-11-07 21:08:55
  • Python自定义一个异常类的方法

    2022-04-23 12:51:11
  • Python函数中定义参数的四种方式

    2021-10-11 03:10:20
  • 详解Python中高阶函数(map,filter,reduce,sorted)的使用

    2023-10-24 15:39:09
  • 一文了解Python 流程控制

    2021-01-27 18:37:28
  • Python实现批量读取图片并存入mongodb数据库的方法示例

    2021-03-25 01:51:53
  • asp之家 网络编程 m.aspxhome.com