python数据类型bytes 和 bytearray的使用与区别

作者：没有想象力时间：2021-08-26 05:51:48　

bytes 和 bytearray

bytes 和 bytearray 都是二进制世界的成员，用二进制的方式去理解才能看清他的本质。

理解bytes 和 bytearray

0 和 1 是计算机工作的根本，单个的0和1只能表达两种状态，无法满足我们复杂的计算，于是计算机使用了8位即一个byte作为一个储存的基本单位。

byte 由 8bit 组成，例如 0000 0001 ，也可以表示为16进制的形式：0x01， 0x为固定前缀，表示该数使用16进制表示方式，此外0o前缀为8进制，0b为二进制形式，以此区分。bytes 从字面上理解是byte 的复数，也就是多个byte组成的序列。这一点与字符串与字符的关系类似。

于是，我们可以这样理解，字符串是由一个个字符顺序储存组成的序列，其中每个元素为一个字符。bytes 是由一个个byte组成的序列，每一个元素是一个byte。

bytearray是一个由byte为元素组成的array，其中每一个元素为一个byte。在python官方文档中，作者简单的定义了这两个类型。翻译为

bytes：可以看作是一组二进制数值(0-255) 的 str 序列bytearray ：可以看作是一组二进制数值(0-255) 的 list 序列

python中值的表示

在计算机中表示数有多种表示方式，普通的表示方式就是10进制的数值表示方法，例如a=10，此外还有8进制，16进制，2进制的表示方式，分别使用前缀0o和0x和0b表示。

a = 97
a = 0b01100001
a = 0x61
a = 0o301

使用上面4种方式定义的值均为十进制数97，也就是上面四种方式是等价得，只是使用不同的进制表示同一个值。

除了使用数值可以有不同的表示方式外，还可以使用字节的方式来定义一个值，而字节该如何书写？python使用了一个特殊字符串来表示字节，这个特殊字符可以使用前缀\x，\o, \b和\ 表示，分别表示16，8，2，10进制的表示方式，特殊字符后是对应的进制表示值。示例

a = "a"
a = "\b01100001"
a = "\x61"
a = "\o301"

同样得，这样得四种方式是等价得，a变量的值均为"a"。以上是单字节的字符的表示，多字节字符或者是一个字符串同样可以如此定义。

# 使用encode查看一下中国的二进制编码为

str.encode("中国") # ==> b'\xe4\xb8\xad\xe5\x9b\xbd'，前缀 b表示该值的类型为bytes，区别于字符串的表示

# 因此，我们可以使用这个字节表示来定义“中国”

a = '\xe4b8ade59bbd' # 或者 '\xe4\xb8\xad\xe5\x9b\xbd'，两种方式均可

# 其8进制可以如此计算
num = int.from_bytes(a, "big") # 将这段字符串转化为内存等值的数值
print(oct(num)) # 打印该数值的8进制表示，结果为字符串类型。在该字符串加上\o前缀即可

# 最后打印结果
print(a) # ==> "中国"

# 再假如我们需要定义一个字符串abc，可以使用下面的方式

a = "abc"

a = "\x616263" # 由于abc的ascii码分别为 0x61 62 63
a = "\o301302303" # 由于abc的ascii码分别为 0o301 302 303
a = "\979899" # 由于abc的ascii码分别为 979899

进制转换

字节，数值，字符等类型可以使用下面的方式进行转化。还包括值得不同进制表示，字符串得不同进制表示，示例：

# 内置函数
chr(97) # ==> "a"
ord("a") # ==> 97

# 将一个10进制数，转化为其他进制的数的字符串表示得内置函数，注意，结果都是字符串，而不是对应进制的数值
bin(97) # ==> '0x61'
oct(97) # 8进制字符 '0o301'
hex(97) # 2进制字符 '0b01100001'

# 也可使用format完成
#带前缀 0x
format(97,"#x") # ==> '0x61'
format(97,"#o") # 8进制字符 '0o301'
format(97,"#b") # 2进制字符 '0b01100001'
#不带前缀
format(97,"X") # ==> '61'
format(97,"o") # ==> '301'
format(97,"b") # ==> '01100001'

# 3.6+版本使用方法
# f'{255:X}' 和 f'{255:#X}' ===> " FF " 和 "0xFF"

# 使用c 风格得表示
"％x"％10 # ==> 'a'
"％o"％10 # ==> '12'
# 带前缀
"％#x"％10 # ==> '0xa'
"％#o"％10 # ==> '0o12'

将一个字节或者字符或者字符串转化为值类型可以使用如下的方式。

ord("a") # ==> 97
int.from_bytes(b"a", "big") # 97 类型为int，指定大端模式（小地址存多字节高位）

# 以下两种形式等价
int.from_bytes(b"abc", "big") # ==> 得到三字节长度的数值
int.from_bytes(bytes("abc"), "big") #

bytes类型

将一个str 转化为 bytes 的本质是将str中的每个字符转化为该字符的二进制编码形式。例如 a 的二进制为 0x65。

# 将字符串abc 中每一个字符转化为二进制编码形式就是bytes类型
s = "abc"
bs1 = bytes("abc") # bytes()第一个参数为一个可迭代对象，将每一个元素转为二进制的表示方式

print(s) # 'abc'
print(bs1) # b'abc' python检测到这个二进制序列可以使用字符abc表示，但是为了区别于abc的字符串，所以使用 b'abc'，只是给人看的一种表示结果。实际的值应该是一个个字节。

# 我们看一下单个元素
print(s[0]) # 'a'
print(bs1[0]) # 97 而不是 b'a'，对于单个字节0x61， python使用了十进制数97表示

二进制类型bytes使用b'abc'的表示方式，只是尝试将这个序列中的元素翻译为人类可以看懂的形式，实际在变量内存中储存的为一个个二进制字节0x61 0x62 0x63，这样的三个字节可以根据数据类型的不同翻译成不同的结果。

b2 = bytes( [97,98,99] )
print(b2) # ==> b'abc'

这就对上面结论最佳证明，出现该结果的原因是，python中的列表 [97, 98, 99] 在内存中二进制储存和字符串abc储存的值是相同的，所以使用python来展示这段内存时，它使用b'abc'的方式进行展示。

bytes类型转化

字符串转bytes类型

# 将返回 bytes 类型 b" abc "，可以添加encoding参数指定字符串的编码方式
bs1 = bytes("abc","utf-8")
# 可以使用字符的16进制字符表达形式
bs2 = bytes('\x61\x62\x63',"utf-8")
# 直接对字符进行编码成二进制形式
bs2 = "abc".encode()

# 16进制字符转为bytes类型
b1 = bytes.fromhex("61 62 63") # ==> b"abc" "61,62"是两个16进制数组合，单个值不能超过 7F也就是不能超过127 ，否则无法对应ASCII表中的字符
b1.hex() # ===> '616263' ASCII码中abc字符对应的16进制数组成的字符串，上面函数的逆运算。

数值转化为bytes类型

想要使用数值来定义一个不能直接使用 bytes(97) 的方式来定义，这不会在内存中储存一个二进制的 97，而是会开辟97个字节，每个字节的值为0x00。这是需要注意的一点，如果想要储存一个97，可以使用列表来实现。

# 传入数值类型可迭代对象
b1 = bytes(range(97,100)) # ==> b'abc'
b2 = bytes([97,98,99]) # ==> b'abc'
b3 = bytes([97]) # ==> b'a'

# 直接传入10进制数值对象而不是可迭代对象，将会生成对应数值字节的空bytes
b4 = bytes(3) # b'\x00\x00\x00' 三个空字符的 bytes

# 通过数值转化将8进制，16进制数字生成bytes对象
b5 = bytes([int("61",16)]) #16进制61 == > 10 进制 ==> bytes ==> b"a" （使用字符a表示）
b6 = bytes([int("61", 8)]) # 8进制61 == > 10 进制 ==> bytes ==> b"1" （使用字符1表示）

# 也可利用bytes 对象转化为 10 进制数值
num = int.from_bytes(b"abc","big") # "abc"对应的三个字节拼接在一起作为一个二进制数，并计算为10进制数输出
print(num) # ===> 6382179

以上是将数值和字符串转化为字节类型，这是常用的类型转化方式，同样的，也可以将字节转化为字符或者值的类型。使用以下的方法即可

bytes转数值

bytes类型转化为值类型使用数值使用 int的一个类方法from_bytes即可，示例：

num = int.from_bytes(b“abc”, "big") # 将这个bytes对象转化为内存等值的数值

bytes的方法

bytes对象的方法和字符串的方法基本一致，可以进行字符串的几乎所有操作，例如字符串的replace，split，partation等操作，唯一需要区别的是。字符串的操作操作的对象是一个字符串或者单个字符，而bytes对象操作的是一个bytes二进制字节，例如进行字符串替换时：

"abc".replace("a", "x") # 将字符a 替换为 x

# 而在bytes对象

b"abc".replace(b"a", b"x") # 无论是参数中的对象还是对象本身都是bytes类型，有b“”前缀标识

其他方法类比于str的方法，并结合官方文档即可。

bytearray

bytearray类似于中的list数据类型，bytearray中的每一个元素始终为一个字节值，也就是 0x00 - 0xff 区间的一个值，如果不在该范围内的值，在指定了编码方式的情况下可以按照字节遍历

初始化一个bytearray对象。同样需要一个可迭代对象作为参数，将会按照字节遍历整个可迭代对象，有以下的方式

bytearray("abc", encoding="utf-8") # abc字符串使用utf-8的方式编码为字节，每个字节作为bytearray对象的一个元素储存即可。
bytearray(b"abc") # 也可以使用bytes 类型，而使用bytes类型就没有编码一说了
bytearray([97, 98, 99]) # 使用可迭代对象，内部元素为一个一个0-255的数值类型。

ba1 = bytearray(range(97,103)) # 可迭代当然包括range对象

ba1 # bytearay对象，==> bytearray(b"abcdef")
ba1[0] # ==> 97 (integer)
ba1[1:4] # 切片 ==> bytearray(b'bcd')

# 赋值，可变 bytearray
ba[ 4 ] = 122 # 122整型对应字符"z", ==> b"e" --> b"z"
ba # bytearray(b"abcdzf" )
ba1[1:4] = b"xyz" # 切片赋值，替换ba1[1:4]的内容, 只有bytes 或bytearray 序列可赋值

bytes和bytearray类型之间可以直接进行转化，bytes()中可以传入一个bytearray对象作为参数，并且不存在编码问题，因为两个类型都是一个二进制的序列。

python在展示bytearray对象，使用的是bytesarray(b"abc") 的方式，其实，不妨理解为 bytearray( [ b"a", b"b", b"c" ] ) 的形式。也就是每个元素为字节列表。所以byteaarray实现了和列表对象的方法，并且可以进行元素的替换，也就是与列表相同，他是一个可变类型的对象。而bytes 与字符串都是不可变的，无法对单个元素进行替换，对象一旦产生将不可变。如果需要改变，需要新建一个新的对象。

bytearray的方法

类似与列表对象，可以进行切片，append， extend，insert等操作，同样的，由于内部的元素都是一个个字节对象，对单个元素操作时只能操作单字节的对象，而执行extend这类处理可迭代对象方法，也要求可迭代对象内部的所有元素为单字节对象。单字节对象，可以是 b"a"类似的单字节对象或 0-255的数值。因为一个字节只能储存256中状态。以下是几个简单的示例

a = bytearray(b"abc")

a.append(100)
print(a) # bytearray(b"abcd")

a.append(b"e")
print(a) # bytearray(b"abcde")

a.extend(a)
print(a) # bytearray(b"abcdeabcde")

a.insert(0, b"A")
print(a) # bytearray(b"Aabcdeabcde")

bytes(a) # b"Aabcdeabcde"

来源：https://www.cnblogs.com/k5210202/p/13388776.html

标签：python,bytes,bytearray

投稿

python数据类型bytes 和 bytearray的使用与区别

bytes 和 bytearray

理解bytes 和 bytearray

python中值的表示

进制转换

bytes类型

bytes类型转化

bytes转数值

bytes的方法

bytearray

bytearray的方法

猜你喜欢

解决SpringBoot启动过后不能访问jsp页面的问题(超详细)

Python 闭包，函数分隔作用域，nonlocal声明非局部变量操作示例

python实现蒙特卡罗模拟法的实践

用FrongPage设计网页花样

asp fckeditor自定义上传文件的文件名

一个表单焦点效果函数

Python数字图像处理之霍夫线变换实现详解

Python3从零开始搭建一个语音对话机器人的实现

使用Python和Prometheus跟踪天气的使用方法

Oracle SQL中实现indexOf和lastIndexOf功能的思路及代码

动态导航设计

python列表中常见的一些排序方法

简单聊聊Golang中defer预计算参数

MySQL的root帐户密码重置方法

asp如何实现网上考试功能？

pandas pd.read_csv()函数中parse_dates()参数的用法说明

如何基于线程池提升request模块效率

php+js实现倒计时功能

网页颜色变黑白CSS代码适合所有类型网站

python入门:argparse浅析 nargs='+'作用

python数据类型bytes 和 bytearray的使用与区别

bytes 和 bytearray

理解bytes 和 bytearray

python中值的表示

进制转换

bytes类型

bytes类型转化

bytes转数值

bytes的方法

bytearray

bytearray的方法

猜你喜欢

解决SpringBoot启动过后不能访问jsp页面的问题(超详细)

Python 闭包，函数分隔作用域，nonlocal声明非局部变量操作示例

python实现蒙特卡罗模拟法的实践

用FrongPage设计网页花样

asp fckeditor自定义上传文件的文件名

一个表单焦点效果函数

Python数字图像处理之霍夫线变换实现详解

Python3从零开始搭建一个语音对话机器人的实现

使用Python和Prometheus跟踪天气的使用方法

Oracle SQL中实现indexOf和lastIndexOf功能的思路及代码

动态导航设计

python列表中常见的一些排序方法

简单聊聊Golang中defer预计算参数

MySQL的root帐户密码重置方法

asp如何实现网上考试功能？

pandas pd.read_csv()函数中parse_dates()参数的用法说明

如何基于线程池提升request模块效率

php+js实现倒计时功能

网页颜色变黑白CSS代码 适合所有类型网站

python入门:argparse浅析 nargs='+'作用

网页颜色变黑白CSS代码适合所有类型网站