Python Unicode字符串和普通字符串转换
Unicode 是一种字符编码标准,旨在为世界上所有书写系统的每个字符提供一个唯一的数字标识(称为码点)。
码点:
- 每个 Unicode 字符被分配一个唯一的数字,称为码点
- 表示形式:u+ 后跟 4-6 位十六进制数(如 U+0041 表示拉丁大写字母 A)
unicode 是一种用于表示文本的编码标准,它允许处理和存储多种语言的字符。在 Python 中,如果打印出来的内容为 u’xxx’,这通常表示该内容是一个 unicode 字符串。
那么,如何将Unicode字符串转换普通字符串:
方法1、使用str()
函数
unicode_str = u'hello world'
normal_str1 = str(unicode_str) #使用str()函数转为普通字符串
print(normal_str1)
方法2、使用encode()
函数和decode()
函数进行编码和解码
unicode_str = u'hello world'
normal_str2 = unicode_str.encode('utf-8') # 使用,encode()方法转换为utf-8编码的普通字符串,然后使用decode()解码
print(normal_str2)