python 遍历字符串(含汉字)实例详解

作者:Anderslu 时间:2022-10-06 05:08:58 

python 遍历字符串(含汉字)实例详解


s = "中国china"
for j in s:
 print j

首先一个,你这个'a'是什么编码?可能不是你所想的gbk


>>> a='中国'
>>> a

这样试试看,如果出来是6个字(word),说明是utf-8,如果是4个字,说明gbk。

另外,不管是utf-8还是gbk,都不能这样遍历,因为这里它会一个字一个字拿出来。虚拟机把a当成一个长度为len(a)的字符串了。

接下来是遍历问题。

Linux的shell大都默认是utf-8,所以一个中文字符是三个字,所以要三个三个地读,你可以试下:


>>> a[:3]

出来就是个”中”字

windows的command的默认是cp936,也就是gbk,一个中文字符是两个字,所以两个字两个字地读(a[:2])。

还有另一种遍历的方法,把字符串转换成unicode,这样中文英文都是一个字,就可以用你的for i in a的方法遍历了。这个的好处是中文英文字符都是一个字,而utf-8和gbk里,英文字母只占一个字。


s = u"中国china"
for j in s:
 print j

输出如下:




c
h
i
n
a

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

标签:python,遍历,字符串
0
投稿

猜你喜欢

  • ASP错误大全

    2009-05-26 15:45:00
  • python多项式拟合之np.polyfit 和 np.polyld详解

    2022-09-12 13:32:49
  • 去掉运行JavaScript时IE产生的警告栏

    2008-09-11 18:07:00
  • 微信小程序实战之打卡时钟的绘制

    2024-04-17 10:35:32
  • Appium+python自动化之连接模拟器并启动淘宝APP(超详解)

    2021-03-08 01:07:41
  • JavaScript对象的property属性详解

    2024-05-05 09:22:57
  • python 通过麦克风录音 生成wav文件的方法

    2023-03-21 05:27:50
  • Python Opencv中基础的知识点

    2023-06-08 21:10:48
  • Bootstrap源码解读按钮(5)

    2023-08-23 01:16:51
  • 网站的视觉路径和版式设计

    2008-04-15 14:35:00
  • go语言实现并发网络爬虫的示例代码

    2024-01-31 07:45:35
  • 分析用Python脚本关闭文件操作的机制

    2021-01-25 07:03:26
  • Python下使用Scrapy爬取网页内容的实例

    2022-05-29 13:43:24
  • JavaScript实现烟花特效(面向对象)

    2024-02-26 22:44:50
  • Golang操作sqlite3数据库的详细教程

    2024-01-14 05:32:52
  • Java基于MySQL实现学生管理系统

    2024-01-23 07:32:02
  • python中__init__()方法详情

    2023-06-05 21:22:46
  • Pycharm 如何设置HTML文件自动补全代码或标签

    2021-08-12 17:47:15
  • Go 微服务开发框架DMicro设计思路详解

    2024-05-22 17:48:31
  • python+selenium实现163邮箱自动登陆的方法

    2021-01-24 08:05:15
  • asp之家 网络编程 m.aspxhome.com