关于python2的encode('hex')在python3上的解决

今天在实验RSA加解密的文件的时候,由于该文件是基于python2写的,所以在python3上没有很好的运行,记录一下这个知识点

python2对于字符串转换成hex编码的时候使用的是str本身具有的方法,即str.encode(‘hex’)
但是这个方法在python3中取消了,解决方案如下:
首先

1
2
str1 = bytes(str,encoding = 'utf-8')  
str1.hex()

即可

顺便扩充一下知识:

bytes定义

1.使用bytes函数创建bytes

  • bytes() 创建一个空的bytes
  • bytes(int) 创建一个int位的全位0的bytes
  • bytes(iterabl_of_ints) 可迭代数字组成的bytes(比如range)
  • bytes(string,encoding[,errors]) 等价于string.encode()
  • bytes(bytes of buffer) 创建一个bytes的copy

2.直接定义

比如:

​ b = b’abc’

​ b = b’\x61’

3.类型转换

  • string.encode()
  • int.tobytes()
  • bytes.from
  • bytes函数定义
1
2
3
4
5
6
7
8
9
10
11
>>> bytes()
b''
>>> bytes(3)
b'\x00\x00\x00'
>>> bytes(range(3))
b'\x00\x01\x02'
>>> b = bytes('中国', encoding='utf-8')
>>> b
b'\xe4\xb8\xad\xe5\x9b\xbd'
>>> bytes(b)
b'\xe4\xb8\xad\xe5\x9b\xbd'

直接创建:

1
2
3
>>> b = b'abc'
>>> b
b'abc'

类型转换:

1
2
3
4
5
6
7
8
9
10
11
>>> n = 97
>>> n.to_bytes(1,byteorder='big')
b'a'
>>> s = '中国'

>>> s.encode(encoding = 'utf-8')
b'\xe4\xb8\xad\xe5\x9b\xbd'


>>> bytes.fromhex('61')
b'a'

bytes的显示方式

Only ASCII characters are permitted in bytes literals (regardless of the declared source code encoding). Any binary values over 127 must be entered into bytes literals using the appropriate escape sequence.

只有ASCII中的字符串是可以直接在bytes类型中显示出来的,所有大于127的数值用转义字符表达。

比如,内存中的字节对象用十六进制表示为61,在python中显示的方式不是b’\x61’ 而是b’a’;而b’\xe4’显示方式就是b’\xe4’;注意:仅仅是显示方式而已

另外,并不是所有的小于127的都可以被友好的显示出来,有些对象本身不可显示,就显示其十六进制表示。比如

b’\x00’

bytes的一般方法
bytes类似于string;在方法上,除了自己特有的方法外,跟str也类似。

比如:

1
2
3
4
>>> b'abc'.find(b'\x63')
2
>>> b'abc'.replace(b'\61',b'A')
b'abc'

bytearray定义

bytearray是可变的bytes数据类型,可以通过bytearray创建和定义

一:bytearray()定义

  • bytearray() 创建一个空的bytearray

  • bytearray(int) 创建一个int位的全位0的bytearray

  • bytearray(iterabl_of_ints) 可迭代数字组成的bytearray(比如range)

  • bytearray(string,encoding[,errors]) 将一个字符串编码为bytearray

  • bytearray(bytes of buffer) 创建一个bytearray

    二: bytearray的方法定义

  • bytearray.fromhex()

    bytearray的一般方法

bytearray具备bytes的操作方法,像字符串一样操作;

另外bytearray还具备像list一样的操作方法,比如pop,append等

bytes 和 bytearray的方法

十六进制和字节类型的相互转换

1
2
3
4
5
6
7
8
9
10
11
12
13
14
bytes.fromhex()
bytearray.fromhex()
bytes.hex()
bytesarray.hex()
>>> b = bytes('hell',encoding='utf-8')
>>> ba = bytearray('hell',encoding='utf-8')
>>> b
b'hell'
>>> ba
bytearray(b'hell')
>>> b.hex()
'68656c6c'
>>> ba.hex()
'68656c6c'

但是decode的好像没有特别好的办法除了使用binascii模块…

binascii模块的使用

简介

binascii模块包含很多用来方法来转换二进制和各种ASCII编码的二进制表示法。通常不直接使用这些功能,而是使用封装模块,如uu, base64或binhex。binascii模块包含用C语言编写更快的低级功能,通常为高级模块所使用。

  • 相关模块
  1. base64 模块
  2. binhex 模块
  3. uu 模块
  4. quopri 模块

UU编码

相关函数binascii.a2b_uu(string)和binascii.b2a_uu(data),更多资料点

Binhex编码

相关函数有:binascii.rledecode_hqx(data) ,binascii.rlecode_hqx(data),binascii.b2a_hqx(data) ,binascii.crc_hqx(data, crc),更多资料点

Base64编码

binascii.a2b_base64(string):转换的base64数据块为二进制,并返回二进制数据。一次可以传递多行。和base64. b64decode对应。 binascii.b2a_base64(data):转换二进制数据为一行base64编码的ASCII字符。返回字符串包含换行符。根据base64的标准data的长度最大为57。和base64. b64encode对应。,更多资料点

QP编码

Quoted-printable,或QP encoding,没有规范的中文译名,可译为“可打印字符引用编码”、“使用可打印字符的编码”。Quoted-printable是使用可打印的 ASCII字符 (如字母、数字与”=”)表示各种编码格式下的字符,以便能在7-bit数据通路上传输8-bit数据, 或者更一般地说在非8-bit clean媒体上正确处理数据。这被定义为MIME content transfer encoding,用于e-mail。

QP使用”=”开头的转义字符. 一般限制行宽为76,因为有些软件限制了行宽.

binascii.a2b_qp(string[, header]):转换引述打印数据块为二进制,并返回二进制数据。多行可以在同一时间被传递。如果可选参数头存在和真实,下划线将被解码为空格。

实际上,QP码是是把’\x00’转换成’=00’,也就是替换’\x’为’=’。

1
2
3
4
5
6
7
8
9
10
11
>>> s ='\x00='
>>> s = '=\x00hello'
>>> import binascii
>>> encoded = binascii.b2a_qp(s)
>>> encoded
'=3D=00hello'
>>> decoded = binascii.a2b_qp(encoded)
>>> print decoded
=hello
>>> print repr(decoded)
'=\x00hello'

CRC校验和

binascii.crc32(data[, crc]):计算的data 的32位校验和CRC- 32时,crc为初始CRC 。crc32与ZIP文件的校验和一致。

1
2
3
4
5
6
7
8
>>> print binascii.crc32("hello world")
222957957
>>> crc = binascii.crc32("hello")
>>> crc = binascii.crc32(" world", crc) & 0xffffffff
>>> print 'crc32 = 0x%08x' % crc
crc32 = 0x0d4a1185
>>> crc
222957957

二进制转换

binascii.b2a_hex(data)和binascii.hexlify(data):返回二进制数据的十六进制表示。每个字节被转换成相应的 2位十六进制表示形式。因此,得到的字符串是是原数据长度的两倍。 binascii.a2b_hex(hexstr) 和 binascii.unhexlify(hexstr):从十六进制字符串hexstr返回二进制数据。是b2a_hex的逆向操作。 hexstr必须包含偶数个十六进制数字(可以是大写或小写),否则报TypeError。

>>> s = 'hello'
>>> b = b2a_hex(s)
>>> print b
68656c6c6f
>>> a2b_hex(b)
'hello'
>>> b = hexlify(s)
>>> print b
68656c6c6f
>>> unhexlify(b)
'hello'

参考博客:https://www.jianshu.com/p/701960098b7a