使用Beautiful Soup 3解析HTML時,常會出現HTML實體並需要解碼。這可以使用 html.unescape() 或 HTMLParser.unescape() 函數來完成。
使用 html.unescape():
import html html.unescape('£682m')
來自 Python 2.6-2.7 月3中的html.parser,unescape():
from html.parser import HTMLParser parser = HTMLParser() print(h.unescape('£682m'))
或者,使用六個相容性庫:
from six.moves.html_parser import HTMLParser parser = HTMLParser() print(h.unescape('£682m'))
以上是如何解碼 Python 字串中的 HTML 實體?的詳細內容。更多資訊請關注PHP中文網其他相關文章!