python实现中文转换url编码的方法
作者:zeo 时间:2021-05-26 08:46:57
本文实例讲述了python实现中文转换url编码的方法。分享给大家供大家参考,具体如下:
今天要处理百度贴吧的东西。想要做一个关键词的list,每次需要时,直接添加 到list里面就可以了。但是添加到list里面是中文的情况(比如‘丽江'),url的地址编码却是'%E4%B8%BD%E6%B1%9F',因此需 要做一个转换。这里我们就用到了模块urllib。
>>> import urllib
>>> data = '丽江'
>>> print data
丽江
>>> data
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> urllib.quote(data)
'%E4%B8%BD%E6%B1%9F'
那我们想转回去呢?
>>> urllib.unquote('%E4%B8%BD%E6%B1%9F')
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> print urllib.unquote('%E4%B8%BD%E6%B1%9F')
丽江
细心的同学会发现贴吧url中出现的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其实是编码问题。百度的是gbk,其他的一般网站比如google就是utf8的。所以可以用下列语句实现。
>>> import sys,urllib
>>> s = '丽江'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))
'%C0%F6%BD%AD'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))
'%E4%B8%BD%E6%B1%9F'
>>>
希望本文所述对大家Python程序设计有所帮助。
标签:python,转换编码
0
投稿
猜你喜欢
oracle数据库冷备份的方法
2023-07-19 09:51:19
Python实战使用XPath采集数据示例解析
2022-02-25 09:00:24
python中list列表的高级函数
2021-02-24 08:21:14
详解Python数据结构与算法中的顺序表
2023-12-31 01:47:04
Python3.7 新特性之dataclass装饰器
2021-05-11 13:13:40
python difflib模块示例讲解
2022-01-21 04:35:57
RC4经典加密算法asp/VBs版本代码
2008-02-17 17:32:00
vue+AI智能机器人回复功能实现
2024-04-27 15:49:14
python 文件和路径操作函数小结
2023-02-11 18:11:36
javascript读取xml
2024-04-23 09:30:13
python logging设置level失败的解决方法
2022-03-23 13:54:40
Django使用Channels实现WebSocket的方法
2023-12-10 16:20:05
基于python实现自动化办公学习笔记(CSV、word、Excel、PPT)
2022-09-21 05:14:57
Tkinter组件实现Radiobutton的示例
2022-08-01 00:23:24
pycharm设置当前工作目录的操作(working directory)
2023-07-14 00:06:34
如何使用SQLServer数据库查询累计值
2009-03-16 14:43:00
学习mysql 如何行转列与列传行
2024-01-17 05:45:01
Pyqt实现简易计算器功能
2022-05-10 13:00:51
Python for循环通过序列索引迭代过程解析
2021-11-30 05:36:50
从创建数据库到存储过程与用户自定义函数的小感
2024-01-16 23:42:05