python实现中文转换url编码的方法

作者:zeo 时间:2021-05-26 08:46:57 

本文实例讲述了python实现中文转换url编码的方法。分享给大家供大家参考,具体如下:

今天要处理百度贴吧的东西。想要做一个关键词的list,每次需要时,直接添加 到list里面就可以了。但是添加到list里面是中文的情况(比如‘丽江'),url的地址编码却是'%E4%B8%BD%E6%B1%9F',因此需 要做一个转换。这里我们就用到了模块urllib。


>>> import urllib
>>> data = '丽江'
>>> print data
丽江
>>> data
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> urllib.quote(data)
'%E4%B8%BD%E6%B1%9F'

那我们想转回去呢?


>>> urllib.unquote('%E4%B8%BD%E6%B1%9F')
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> print urllib.unquote('%E4%B8%BD%E6%B1%9F')
丽江

细心的同学会发现贴吧url中出现的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其实是编码问题。百度的是gbk,其他的一般网站比如google就是utf8的。所以可以用下列语句实现。


>>> import sys,urllib
>>> s = '丽江'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))
'%C0%F6%BD%AD'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))
'%E4%B8%BD%E6%B1%9F'
>>>

希望本文所述对大家Python程序设计有所帮助。

标签:python,转换编码
0
投稿

猜你喜欢

  • oracle数据库冷备份的方法

    2023-07-19 09:51:19
  • Python实战使用XPath采集数据示例解析

    2022-02-25 09:00:24
  • python中list列表的高级函数

    2021-02-24 08:21:14
  • 详解Python数据结构与算法中的顺序表

    2023-12-31 01:47:04
  • Python3.7 新特性之dataclass装饰器

    2021-05-11 13:13:40
  • python difflib模块示例讲解

    2022-01-21 04:35:57
  • RC4经典加密算法asp/VBs版本代码

    2008-02-17 17:32:00
  • vue+AI智能机器人回复功能实现

    2024-04-27 15:49:14
  • python 文件和路径操作函数小结

    2023-02-11 18:11:36
  • javascript读取xml

    2024-04-23 09:30:13
  • python logging设置level失败的解决方法

    2022-03-23 13:54:40
  • Django使用Channels实现WebSocket的方法

    2023-12-10 16:20:05
  • 基于python实现自动化办公学习笔记(CSV、word、Excel、PPT)

    2022-09-21 05:14:57
  • Tkinter组件实现Radiobutton的示例

    2022-08-01 00:23:24
  • pycharm设置当前工作目录的操作(working directory)

    2023-07-14 00:06:34
  • 如何使用SQLServer数据库查询累计值

    2009-03-16 14:43:00
  • 学习mysql 如何行转列与列传行

    2024-01-17 05:45:01
  • Pyqt实现简易计算器功能

    2022-05-10 13:00:51
  • Python for循环通过序列索引迭代过程解析

    2021-11-30 05:36:50
  • 从创建数据库到存储过程与用户自定义函数的小感

    2024-01-16 23:42:05
  • asp之家 网络编程 m.aspxhome.com