python的二进制转化模块如何理解
这篇文章将为大家详细讲解有关python的二进制转化模块如何理解,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
在pyton中,通过struct
模块来对二进制进行转换,主要包括两大类函数,即用于打包的pack和用于解包的unpack。
其中,struct.pack
的输入格式为struct.pack(format, v1, v2, ...)
,其中format
为格式字符串,v1,v2..
为将要转成bytes
的字符。
例如
>>> import struct>>> struct.pack('i', 15)b'\x0f\x00\x00\x00'>>> struct.pack('iii', 15, 16, 17)b'\x0f\x00\x00\x00\x10\x00\x00\x00\x11\x00\x00\x00'>>> struct.pack('b', 255) #b格式的取值范围是-128到127struct.error: byte format requires -128 <= number <= 127>>> struct.pack('B', 200)b'\xc8'>>> struct.pack('B', 71) #128以内可用ASCII表示b'G'
i
代表int
,15对应的二进制代码为F000
,故其输出为b\x0f\x00\x00\x00
。当格式字符串为iii
时,说明要将三个数字以整数类型转化为二进制。
其中,格式化字符串中的每个字符都代表一种数据类型,其中整型相关的字符如下,左侧为带符号整型,右侧为无符号整型
C语言类型 | C语言类型 | 标准大小 | ||
---|---|---|---|---|
b | signed char | B | unsigned char | 1 |
h | short | H | unsigned short | 2 |
i | int | I | unsigned int | 4 |
l | long | L | unsigned long | 4 |
q | long long | Q | unsigned long long | 8 |
n | ssize_t | N | size_t |
其他类型
格式 | C 类型 | Python 类型 | 标准大小 |
---|---|---|---|
x | 填充字节 | 无 | |
c | char | 长度为1的字节串 | |
? | _Bool | bool | 1 |
e | float | 2 | |
f | float | float | 4 |
d | double | float | 8 |
s | char[] | 字节串 | |
p | char[] | 字节串 | |
P | void* | 整数 |
struct
中提供了获取标准大小的函数,calcsize
:
>>> struct.calcsize('B')1>>> struct.calcsize('i')4
除了声明被格式化时的数据类型,struct
还可以指定对齐方式,例如
>>> struct.pack("i",15)b'\x0f\x00\x00\x00'>>> struct.pack(">i",15) #小端序b'\x00\x00\x00\x0f'>>> struct.pack("其对应字符的含义分别为
@ | = | < | > | ! |
---|---|---|---|---|
本机 | 本机 | 小端 | 大端 | 网络(大端) |
其中默认为@
,即本机字节顺序。
在熟悉了pack
之后,与之对偶的unpack
也就没啥难度了
>>> test = struct.pack("III",125,1255,12555)>>> struct.unpack("III",test)(125, 1255, 12555)
除了pack
和unpack
,struct
模块还提供了C语言风格的一对函数pack_into
和unpack_from
,二者的声明分别为
struct.pack_into(format, buffer, offset, v1, v2, ...)struct.unpack_from(format, /, buffer, offset=0)
其中buffer
表示缓冲流,在pack_into
中,将v1,v2...
以offset
的偏置打包入buffer
中;在unpack_from
中,将buffer
中的数据从offset
处依次取出。
struct
中封装了用于二进制处理的类Struct
,按照以往经验,其pack
函数的实现方法很有可能是下面这种
def pack(format,*args): return Struct(format).pack(args)
其中Struct
的初始化方法就是输入一个格式化字符串,例如
>>> s = struct.Struct("III")>>> s.pack(1,2,3)b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00'
关于python的二进制转化模块如何理解就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。