Python使用chardet判断字符编码

作者:小五义 时间:2021-05-14 03:03:52 

本文实例讲述了Python使用chardet判断字符编码的方法。分享给大家供大家参考。具体分析如下:

Python中chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。


python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:


>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断


import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()

希望本文所述对大家的Python程序设计有所帮助。

标签:Python,chardet
0
投稿

猜你喜欢

  • 通过淘宝数据爬虫学习python scrapy requests与response对象

    2021-11-07 05:46:39
  • 使用 Python 遍历目录树的方法

    2021-09-21 22:19:32
  • MySQL处理重复数据的方法

    2024-01-24 04:08:27
  • python获取全国城市pm2.5、臭氧等空气质量过程解析

    2023-06-04 21:46:07
  • 了解WEB页面工具语言XML(三)支持工具

    2008-09-05 17:18:00
  • 浅谈mysql的索引设计原则以及常见索引的区别

    2024-01-22 23:58:49
  • js实现根据文件url批量压缩下载成zip包

    2024-04-22 22:15:17
  • Python3 安装PyQt5及exe打包图文教程

    2021-09-24 12:43:56
  • ubuntu20.04 安装 MySQL5.7过程记录

    2024-01-23 20:18:09
  • Vue指令v-for遍历输出JavaScript数组及json对象的常见方式小结

    2024-05-28 15:47:20
  • Go语言基础设计模式之策略模式示例详解

    2024-05-25 15:11:01
  • js实现股票实时刷新数据案例

    2024-04-10 10:52:20
  • 通过Kettle自定义jar包供javascript使用

    2024-04-30 09:58:10
  • Go Generate 代替 Makefile使用方法详解

    2024-04-27 15:28:18
  • SQL Server数据体系和应用程序逻辑详解

    2009-04-14 07:23:00
  • 浅析MySQL并行复制

    2024-01-13 02:54:10
  • Python numpy中的ndarray介绍

    2022-11-06 19:17:59
  • OpenCV+Python3.5 简易手势识别的实现

    2022-06-02 18:38:26
  • 低版本Druid连接池+MySQL驱动8.0导致线程阻塞、性能受限

    2024-01-20 05:11:49
  • python变量命名的7条建议

    2021-05-15 20:16:07
  • asp之家 网络编程 m.aspxhome.com