学堂 学堂 学堂公众号手机端

python实现中文和unicode转换

lewis 6年前 (2019-06-17) 阅读数 9 #技术
什么是Unicode?

Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

什么是字符串?

字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an”(n>=0)。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。

普通字符串(在python中字符串默认使用unicode编码)
item = "肯德基"
unicode字符串,声明字符串用unicode编码
item = u"肯德基"
将中文转换为unicode
item = "肯德基"
res = item.encode('unicode-escape').decode()
print(f"res:{res}")
输出:
res:\u80af\u5fb7\u57fa
有些网站把\转换为了%
kw = res.replace("\\", "%")
print(f"kw:{kw}")
输出:
kw:%u80af%u5fb7%u57fa
将unicode转换为中文
uitem = "\u80af\u5fb7\u57fa"
print(f"uitem:{uitem}")
输出:
uitem:肯德基

版权声明

本文仅代表作者观点,不代表博信信息网立场。

热门