python字符串(3):字符集/编码(查看修改字符集,乱码);码点和字符的转换(chr和ord),字符串的编码解码函数(encode,decode)
字符集/编码
字符集是一个字符的集合,为每个字符分配一个唯一的编号(称为 码点/Code Point)
python使用的是Unicode字符集
编码是字符集码点的 存储规则,解决如何将字符的码点转换为二进制数据(字节序列)。
-
例如:Unicode 码点
U+4F60
(你)在 UTF-8 编码中存储为0xE4 0xBD 0xA0
(3 字节)。
注意:utf-8编码,一个汉字占3个字节
查看/修改字符集
单个文件
查看当前文件或项目使用的字符集(编码)
项目
乱码/控制台编码
如果程序输出的内容出现乱码,可能是控制台编码不匹配
码点和字符的转换
chr()
将一个整数(Unicode 码点)转换为对应的字符
chr()
:Character(字符)
ord()
获取一个字符的 Unicode 码点(整数表示)
ord()
:Ordinal(序数)