Python中的bytes类型用法及实例分享

作者:Mar丶流年 时间:2022-12-19 01:50:42 

前言;

Python bytes 类型用来表示一个字节串。“字节串“不是编程术语,是我自己“捏造”的一个词,用来和字符串相呼应。
bytes 是 Python 3.x 新增的类型,在 Python 2.x 中是不存在的。

字节串(bytes)和字符串(string)的对比:

  • 字符串由若干个字符组成,以字符为单位进行操作;字节串由若干个字节组成,以字节为单位进行操作。

  • 字节串和字符串除了操作的数据单元不同之外,它们支持的所有方法都基本相同。

  • 字节串和字符串都是不可变序列,不能随意增加和删除数据。

bytes 只负责以字节序列的形式(二进制形式)来存储数据,至于这些数据到底表示什么内容(字符串、数字、图片、音频等),完全由程序的解析方式决定。如果采用合适的字符编码方式(字符集),字节串可以恢复成字符串;反之亦然,字符串也可以转换成字节串。

说白了,bytes 只是简单地记录内存中的原始数据,至于如何使用这些数据,bytes 并不在意,你想怎么使用就怎么使用,bytes 并不约束你的行为。

bytes 类型的数据非常适合在互联网上传输,可以用于网络通信编程;bytes 也可以用来存储图片、音频、视频等二进制格式的文件。

字符串和 bytes 存在着千丝万缕的联系,我们可以通过字符串来创建 bytes 对象,或者说将字符串转换成 bytes 对象。

有以下三种方法可以达到这个目的:

  • 如果字符串的内容都是 ASCII 字符,那么直接在字符串前面添加b前缀就可以转换成 bytes

  • bytes 是一个类,调用它的构造方法,也就是 bytes(),可以将字符串按照指定的字符集转换成 bytes;如果不指定字符集,那么默认采用 UTF-8。

  • 字符串本身有一个encode() 方法,该方法专门用来将字符串按照指定的字符集转换成对应的字节串;如果不指定字符集,那么默认采用 UTF-8。

1.bytes定义

例1:通过b'string'定义bytes类型,但不支持中文(出现中文则报错)

例2:可以通过string.encoding('utf-8')将字符串转换成bytes类型(兼容中文),还原通过bytes.decode('utf-8')

# coding:utf-8

if __name__ == '__main__':

    # 例1
    b = b'abc123'
    print(b)  # b'abc123'
    print(type(b))  # <class 'bytes'>
    # c = b'我abc123' Error

    # 例2
    c = '我abc123'
    c = c.encode('utf-8')
    print(c)  # b'\xe6\x88\x91abc123'
    print(type(c))  # <class 'bytes'>
    print(c.decode('utf-8'))  # 我abc123

2.bytes方法

例1:string有的方法bytes大部分都有(但其字符串参数必须是bytes类型)

# coding:utf-8

if __name__ == '__main__':

    b = b'abc123'
    print(b.find(b'a'))  # 0
    c = 'abc123'
    print(c.find('a'))  # 0
    # b.find('a') Error 参数必须是bytes
    print(b.replace(b'a', b'f'))  # b'fbc123'
    print(c.replace('a', 'f'))  # fbc123
    # b.replace('a', 'f') Error 参数必须是bytes

3.使用不同方式创建 bytes 对象

#通过构造函数创建空 bytes
b1 = bytes()
#通过空字符串创建空 bytes
b2 = b''
#通过b前缀将字符串转换成 bytes
b3 = b'http://c.biancheng.net/python/'
print("b3: ", b3)
print(b3[3])
print(b3[7:22])
#为 bytes() 方法指定字符集
b4 = bytes('C语言中文网8岁了', encoding='UTF-8')
print("b4: ", b4)
#通过 encode() 方法将字符串转换成 bytes
b5 = "C语言中文网8岁了".encode('UTF-8')
print("b5: ", b5)

运行结果:

b3:  b'http://c.biancheng.net/python/'
112
b'c.biancheng.net'
b4:  b'C\xe8\xaf\xad\xe8\xa8\x80\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x918\xe5\xb2\x81\xe4\xba\x86'
b5:  b'C\xe8\xaf\xad\xe8\xa8\x80\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x918\xe5\xb2\x81\xe4\xba\x86'

从运行结果可以发现,对于非 ASCII 字符,print 输出的是它的字符编码值(十六进制形式),而不是字符本身。非 ASCII 字符一般占用两个字节以上的内存,而 bytes 是按照单个字节来处理数据的,所以不能一次处理多个字节。

来源:https://blog.csdn.net/qq_29744347/article/details/122926546

标签:Python,bytes,类型,用法
0
投稿

猜你喜欢

  • python Pygame的具体使用讲解

    2021-01-15 21:41:26
  • python函数的两种嵌套方法使用

    2022-01-14 08:06:58
  • GO语言操作Elasticsearch示例分享

    2023-09-03 03:38:00
  • 如何爬取通过ajax加载数据的网站

    2022-05-03 15:06:01
  • Python3利用print输出带颜色的彩色字体示例代码

    2022-09-08 07:53:29
  • 谈谈Python进行验证码识别的一些想法

    2022-09-19 12:50:53
  • js表单序列化判断空值的实例

    2024-04-22 13:01:15
  • Python 函数用法简单示例【定义、参数、返回值、函数嵌套】

    2022-01-09 22:58:31
  • python抓取网站的图片并下载到本地的方法

    2022-05-19 23:45:08
  • Vue实现自定义视频和图片上传的示例代码

    2024-05-21 10:30:21
  • 详解python 内存优化

    2022-06-04 16:31:43
  • Python实现获取弹幕的两种方式分享

    2022-10-29 23:25:03
  • 基于Django实现日志记录报错信息

    2021-06-22 06:24:23
  • 通过lms.samples熟悉lms微服务框架的使用详解

    2023-06-27 04:15:13
  • SQL Server 数据库操作实用技巧锦集

    2009-01-20 13:20:00
  • 配置高可用性的MySQL服务器负载均衡群集

    2009-01-04 12:43:00
  • 解决pytorch 数据类型报错的问题

    2022-12-22 08:55:04
  • Python字符串逆序输出的实例讲解

    2023-04-21 22:59:46
  • python分割和拼接字符串

    2023-05-12 05:57:03
  • ASP Access实现网站计数器(访问量)

    2011-04-10 10:33:00
  • asp之家 网络编程 m.aspxhome.com