python中unicode字符串的问题

最近用python抓网页,遇到一个大问题。网页上抓来的是以普通字符串形式存在的unicode编码,例如 '\u56c3\u67e4',而不是u'\u56c3\u67e4',我现在想要显示中文,该怎么办?

这个要看你在哪里显示,并且要知道你原来的是什么编码。一般用decode解码成unicode,然后用encode编码成你的显示支持的。s.decode('utf-8').encode('gb2312') 就是把s从utf-8解码成unicode的,然后再编码成gb2312的。
温馨提示:内容为网友见解,仅供参考
第1个回答  2012-06-19
'\u56c3\u67e4' 转 u'\u56c3\u67e4':
方法1:
text = eval("u"+"'\u56c3\u67e4'")
方法2:
s = '\u56c3\u67e4'
text = "".join(unichr(int(c, 16)) for c in s.split('\u')[1:])本回答被提问者采纳
相似回答