浅析Python字符串索引、切片、格式化

作者:涤生手记大数据 时间:2023-09-26 07:57:20 

除了数字,Python中最常见的数据类型就是字符串,无论那种编程语言,字符串无处不在。例如,从用户哪里读取字符串,并将字符串打印到屏幕显示出来。 字符串是一种数据结构,这让我们有机会学习索引和切片——用于从字符串中提取子串的方法。

1 字符串索引

在Python语法支持中,我们简单的阐述过字符串的使用,现在我们看看python程序在处理字符串时,如何对其进行索引,打印出其中的每个字符串。我们输入一个字符串:'你好,Lucky',Python使用方括号 [] 来对字符串进行索引,方括号内的数字 0~n 表示将要获取的字符串,如图1-1所示,sting[0~7]分别对应不同的值,最小的字符换索引为0,最大的字符串索引比字符串长度小1。

浅析Python字符串索引、切片、格式化

浅析Python字符串索引、切片、格式化

如果 string 指向一个长度为 n 的字符串, 则 string[0] 为第一个字符,string[1] 为第二个字符, string[2] 为第三个字符,依此类推。string[n-1] 为最后一个字符。

当然,在上面的示例中,string[8]索引超出了字符串的末尾,导致的错误提示,这点需要注意。Python索引为何从0开始?我们这样理解便可: 索引值用于测量与字符串第一个字符相隔的距离, 就像一把尺子(其刻度也是从零开始)。这 让有些索引计算更简单,也与函数 %(求余) 一致。% 经常用于索引计算,自然也可能返回 0。

实际应用中,往往不会只用到正向索引(本文理解从左向右),当你需要访问字符串的最后一个字符时,也可以使用正向表达式,但字符串过长时明显不便,所以Python提供了一种方面的索引方式:从右向左(负数索引)来表示。如下:字符串的最后一个字符为 string[-1],其索引过程即可按照图1-1进行修改,此处不做阐述。

浅析Python字符串索引、切片、格式化

1.1 循环索引字符

假如需要依次访问字符串的每个字符,需要计算出所给字符串的编码总和,对比两种代码方法,如下图实现及结果,第一种codesum1()函数: 使用 for 循环时,在循环的每次迭代开头,都会将循环变量 c 设置为 s 中的 下一个字符。使用索引访问 s 中字符的工作由 for 循环自动处理。

第二种codesum2()函数使用了常规访问s中字符的方法,对比codesum1()函数可以发现,虽然二者计算结果一致,但第二种函数的代码明显较为复杂,理解程度上稍微差一些。当然,这是多数人的理解,有些人可能觉得第二种实现更好一些。


def codesum1(s):
   total = 0
   for c in s:
       total = total + ord(c)
   return total

def codesum2(s):
   total = 0
   for i in range(len(s)):
       total = total + ord(s[i])
   return total

浅析Python字符串索引、切片、格式化

2 字符使用

在所有编程语言中,字符串都是由字符所组成,而所有字符都有对应的字符编码与之相对应。在Python中,我们可以使用ord()函数来学习。ord() 函数是 chr() 函数(对于8位的ASCII字符串)或 unichr() 函数(对于Unicode对象)的配对函数,它以一个字符(长度为1的字符串)作为参数,返回对应的 ASCII 数值,或者 Unicode 数值,如果所给的 Unicode 字符超出了你的 Python 定义范围,则会引发一个 TypeError 的异常。

关于Unicode做一个简单的背景介绍: Unicode 提供了一个大得多的字符编码集。出于方便考虑,Unicode 的前 256 个 字母为 ASCII 码,因此如果你只处理英文字符,几乎不用考虑 Unicode 的细节。


>>> ord('a')
97
>>> ord('b')
98
>>> ord('c')
99

给定字符编码,可使用函数 chr 来获悉对应的字符:


>>> chr(99)
'c'
>>> chr(98)
'b'
>>> chr(97)
'a'

字符编码是根据Unicode分配的,而Unicode是一个庞杂的编码标准,涵盖了全球各种语言中的符号和字符,使用十分广泛 。并非所有字符都有可视的标准符号。例如,换行字符、回车字符和制表符都是不可见的,虽然它们带来的效果可见。这些字符属于空白字符——在印刷页面上显示为空白。 如下表:

浅析Python字符串索引、切片、格式化

其它的字符以普通格式输出

举两个个简单的常用示例:

1. 在 Python 中,表示换行的标准方式是使用字符 \n:

浅析Python字符串索引、切片、格式化

2. 在字符串中包含反斜杠、单引号和双引号,通常需要使用对应的转义字符:

浅析Python字符串索引、切片、格式化

转义字符是单个字符, 为让 Python 知道下一个字符是特殊字符, 必须使用 \,但在计算字符串的长度时,并不将 \ 视为额外的字符。例如:

浅析Python字符串索引、切片、格式化

在使用转义字符时,还有一点需要特别注意的是:在表示文本行末尾方面,不同操作系统遵循的标准是不同的。Windows 使 用 \r\n 表示行尾,OS X 和 Linux 使用 \n, 而 OS X 之前的 Mac 操作系统使用 \r。

2.1 字符串运算

数字有其标准的运算方式,字符串同样也有着一定的运算。下面来看下字符串的运算符。

浅析Python字符串索引、切片、格式化

示例 :

1.x和y分别赋值字符串;


>>> x = "I am coming"
>>> y = "Python Language"

浅析Python字符串索引、切片、格式化

3 字符串切片

在 Python 中,可使用切片从字符串中提取子串。要对字符串执行切片操作,可指定两个索引:要提取的第一个字符的索引;要提取的最后一个字符的索引加 1。例如:

浅析Python字符串索引、切片、格式化

用于切片的索引与用于访问各个字符的索引相同:第一个索引总是为零,而最后一个索引总是比字符串长度小 1。一般而言,string[begin:end]返回从索 引 begin 到 end-1 的子串。注意:如果 string 是一个字符串,则要访问索引 i 对应的字符,可使用 string[i] 或 string[i:i+1]。

3.1 切片方法

如果想要省略字符串的起始索引,Python将假定为0;如果需要省略字符串的终止索引,Python 会假设你要提取到字符串末尾。

浅析Python字符串索引、切片、格式化

实用示例:取值文件名中的扩展名。


def get_ext(fname):
   dot = fname.rfind('.')
   if dot == -1: # fname 中没有
       return ''
   else:
       return fname[dot + 1:]

浅析Python字符串索引、切片、格式化

注意第一处标红需要加引号好,第二处输入的文件名没有扩展名,故没有返回值。该函数的实现过程:确定最右边的 '.' 的索引(因此使用 rfind 从右往左查 找);如果 fname 不包含 '.',则返回一个空字符串,否则返回 '.' 后面的所有字符。

在索引字符串时所讲述的正向、负向索引同样可以应用于切片中。

浅析Python字符串索引、切片、格式化

使用负数索引时,这样做通常会有所帮助:将字符串写到纸上,再标出每个字符的正索引和负索引,就像图 1-1 那样。虽然这样做确实需要多用一两分钟时间,但可以很好地避免常见的索引错误。

4 字符串格式化

Python 支持格式化字符串的输出 。这会用到一个较为复杂的表达式,但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。


>>> print("我最喜欢的食物是%s,它的热量是%d千焦" %('hot dog',3500))
我最喜欢的食物是hot dog,它的热量是3500千焦

我们将python字符串格式化符号整理如下:标红为字符串格式化中的辅助指令

浅析Python字符串索引、切片、格式化

示例:

浅析Python字符串索引、切片、格式化

浅析Python字符串索引、切片、格式化

浅析Python字符串索引、切片、格式化

对于Python字符串格式化的输出,可以通过上述几个例子体验一下字符串区别与基本使用。Python本身已经自带了许多很有用的函数模块,简化了字符串的使用,增强了其功能。后面,我们会对Python的字符串函数以及正则使用做较为详细的阐述。

来源:https://blog.csdn.net/qq_26442553/article/details/121904256

标签:Python,字符串
0
投稿

猜你喜欢

  • 提高javascript的速度系列(序)

    2008-07-15 12:38:00
  • 简单了解python调用其他脚本方法实例

    2022-12-07 08:53:36
  • 启动iis出现发生意外0x8ffe2740的解决方法

    2011-03-31 11:19:00
  • JavaScript中你不知道的Object.entries用法

    2024-04-19 11:01:40
  • Python 中的Sympy详细使用

    2021-10-03 03:22:45
  • shell命令行,一键创建 python 模板文件脚本方法

    2023-08-03 18:33:26
  • 详解Go语言中的数据库操作

    2024-01-15 19:30:23
  • 利用python和ffmpeg 批量将其他图片转换为.yuv格式的方法

    2023-07-27 11:51:43
  • 利用Python为女神制作一个专属网站

    2021-07-26 23:16:30
  • 一文搞懂Pandas数据透视的4个函数的使用

    2022-03-26 02:01:53
  • Pygame Font模块使用教程

    2021-06-17 15:23:44
  • Pandas实现批量拆分与合并Excel的示例代码

    2022-06-07 22:36:28
  • Go语言反射获取类型属性和方法示例

    2024-05-05 09:32:42
  • python 匹配url中是否存在IP地址的方法

    2023-04-13 14:29:08
  • MySQL分库分表的几种方式

    2024-01-22 05:25:36
  • python实现加密的方式总结

    2023-08-28 05:36:58
  • asp 动态生成rss(不成生xml文件)代码

    2011-04-04 11:17:00
  • FSO如何一行行地读取文件?

    2010-06-10 18:40:00
  • 在CMD中操作mysql数据库出现中文乱码解决方案

    2024-01-19 10:38:03
  • 手把手教你如何使python变为可执行文件

    2021-09-12 04:26:36
  • asp之家 网络编程 m.aspxhome.com