[u'ABC']
将是一元字符串的unicode字符串。美丽的汤总是产生Unicode。因此,你需要将列表转换为单个unicode字符串,然后将其转换为ASCII。
我不知道你是如何得到一元素清单的;content成员将是字符串和标签的列表,这显然不是你所拥有的。假设你确实总是得到一个包含单个元素的列表,并且你的测试实际上仅是 ASCII,则可以使用以下命令:
soup[0].encode("ascii")
但是,请仔细检查你的数据是否真的是ASCII。这很少见。更有可能是latin-1或utf-8。
soup[0].encode("latin-1")
soup[0].encode("utf-8")
或者,你可以询问Beautiful Soup原始编码是什么,然后以该编码重新获取:
soup[0].encode(soup.originalEncoding)