Python 如何截取字符函数

作者:ajklsdnal 时间:2023-02-08 11:39:04 

如何截取字符函数

在工作中我们经常会遇到某种情况需要截取字符串中某个特定标签之间的内容(爬虫可能用到的较多),适用于很多情况例如字符串形式的xml报文、json格式的字符串以及其它类型的字符串。

因为我总结了有关字符串截取的两个函数来记录一下,以供参考。

# 方法一:简单截取不重复标签中的内容
def substr(mystr, startStr, endChar):
    '''
    自定义字符串截取函数:只从字符串中第一次遇见的内容
    '''
    startStr_len = len(startStr)
    start_index = mystr.index(startStr)
    end_index = mystr.index(endChar)
    return mystr[start_index+startStr_len:end_index]
 
'''
a = 'abc111bcd abc222bcd'
result = substr(a, 'abc', 'bcd')    # result='111'
'''
 
# 方法二:重复截取标签中的内容并将结果作为列表返回
def substr_to_list(mystr, startStr, endChar):
    '''自定义字符串截取函数'''
    result = []
    position = 0
    while True:                # 因为index()函数如果没有找到想要的内容会报异常ValueError
        try:            
            startStr_len = len(startStr)
            endChar_len = len(endChar)
            start_index = mystr.index(startStr, position)
            end_index = mystr.index(endChar, position)
            position = end_index + endChar_len
            result.append(mystr[start_index+startStr_len:end_index])
        except Exception as e:
            break
    return result
'''
a = 'abc111bcd abc222bcd'
result = substr(a, 'abc', 'bcd')    # result=['111','222']
'''

效率方面就没有考虑啦,毕竟都用python了还考虑什么效率,哈哈!

截取字符串(字符串切片)

字符串

从本质上讲,字符串是由多个字符构成的,字符之间是有顺序的,这个顺序号就称为索引(index)。Python 允许通过索引来操作字符串中的单个或者多个字符,比如获取指定索引处的字符,返回指定字符的索引值等。

获取单个字符

知道字符串名字以后,在方括号[ ]中使用索引即可访问对应的字符,具体的语法格式为:

strname[index]

strname 表示字符串名字,index 表示索引值。

Python 允许从字符串的两端使用索引:

  • 当以字符串的左端(字符串的开头)为起点时,索引是从 0 开始计数的;字符串的第一个字符的索引为 0,第二个字符的索引为 1,第三个字符串的索引为 2 ……

  • 当以字符串的右端(字符串的末尾)为起点时,索引是从 -1 开始计数的;字符串的倒数第一个字符的索引为 -1,倒数第二个字符的索引为 -2,倒数第三个字符的索引为 -3 ……

请看下面的实例演示:

url = 'http://c.biancheng.net/python/'
#获取索引为10的字符
print(url[10])
#获取索引为 6 的字符
print(url[-6])

运行结果:

i
y

获取多个字符(字符串截去/字符串切片)

使用[ ]除了可以获取单个字符外,还可以指定一个范围来获取多个字符,也就是一个子串或者片段,具体格式为:

strname[start : end : step]

对各个部分的说明:

  • strname:要截取的字符串;

  • start:表示要截取的第一个字符所在的索引(截取时包含该字符)。如果不指定,默认为 0,也就是从字符串的开头截取;

  • end:表示要截取的最后一个字符所在的索引(截取时不包含该字符)。如果不指定,默认为字符串的长度;

  • step:指的是从 start 索引处的字符开始,每 step 个距离获取一个字符,直至 end 索引出的字符。step 默认值为 1,当省略该值时,最后一个冒号也可以省略。

【实例1】基本用法:

url = 'http://c.biancheng.net/java/'
#获取索引从7处到22(不包含22)的子串
print(url[7: 22]) # 输出 zy
#获取索引从7处到-6的子串
print(url[7: -6]) # 输出 zyit.org is very
#获取索引从-21到6的子串
print(url[-21: -6])
#从索引3开始,每隔4个字符取出一个字符,直到索引22为止
print(url[3: 22: 4])

运行结果:

c.biancheng.net
c.biancheng.net
c.biancheng.net
pcaen

【实例2】高级用法,start、end、step 三个参数都可以省略:

url = 'http://c.biancheng.net/java/'
#获取从索引5开始,直到末尾的子串
print(url[7: ])
#获取从索引-21开始,直到末尾的子串
print(url[-21: ])
#从开头截取字符串,直到索引22为止
print(url[: 22])
#每隔3个字符取出一个字符
print(url[:: 3])

运行结果:

c.biancheng.net/java/
c.biancheng.net/java/
http://c.biancheng.net
hp/bne.ta/

来源:https://blog.csdn.net/ajklsdnal/article/details/108057925

标签:Python,截取,字符,函数
0
投稿

猜你喜欢

  • python 中的命名空间,你真的了解吗?

    2023-12-23 20:19:58
  • mysql 5.7.20\\5.7.21 免安装版安装配置教程

    2024-01-26 14:05:33
  • 基于sqlserver的四种分页方式总结

    2024-01-13 22:34:33
  • vue 引用自定义ttf、otf、在线字体的方法

    2024-04-30 10:18:47
  • MySQL 四种连接和多表查询详解

    2024-01-14 17:34:29
  • linux系统中重置mysql的root密码

    2024-01-14 06:16:45
  • 为什么MySQL不建议使用SELECT *

    2024-01-26 21:29:44
  • MySQL数据库升级的一些"陷阱"

    2024-01-15 17:35:22
  • Django 实现Admin自动填充当前用户的示例代码

    2021-12-23 17:37:26
  • mysql 5.7.13 安装配置方法图文教程(win10 64位)

    2024-01-28 09:07:21
  • golang中json操作的完全指南

    2024-04-23 09:35:00
  • pycharm设置python文件模板信息过程图解

    2023-03-21 14:46:22
  • Python Pandas 删除列操作

    2023-12-17 22:03:53
  • jQuery在去除缓存数据的一个失误

    2009-12-14 20:40:00
  • 用WEB(ASP)方式实现SQL SERVER 数据库的备份和恢复

    2010-05-11 20:12:00
  • SpringBoot图文并茂详解如何引入mybatis与连接Mysql数据库

    2024-01-25 15:07:32
  • linux服务器下PHPCMS v9 安全配置详解

    2023-11-17 11:51:52
  • golang调试bug及性能监控方式实践总结

    2024-04-23 09:41:37
  • 也谈谈DIV+CSS的牛角尖

    2007-11-16 16:12:00
  • Python中str is not callable问题详解及解决办法

    2023-10-30 05:34:42
  • asp之家 网络编程 m.aspxhome.com