masyarakat Belajar Perpustakaan Alatan Masa lapang

Melayu

Rumah > pembangunan bahagian belakang > Tutorial Python > python处理html转义字符

python处理html转义字符

高洛峰

Lepaskan： 2017-03-01 13:27:57

asal

2051 orang telah melayarinya

本文实例讲述了python处理html转义字符的方法。分享给大家供大家参考，具体如下：

最近在用Python处理网页数据时，经常遇到一些html转义字符（也叫html字符实体），例如<> 等。字符实体一般是为了表示网页中的预留字符，比如>用>表示，防止被浏览器认为是标签，具体参考w3school的HTML 字符实体。虽然很有用，但是它们会极度影响对于网页数据的解析。为了处理这些转义字符，有如下解决方案：

1、使用HTMLParser处理

import HTMLParser
html_cont = " asdfg>123<"
html_parser = HTMLParser.HTMLParser()
new_cont = html_parser.unescape(html_cont)
print new_cont #new_cont = " asdfg>123<"

Salin selepas log masuk

转换回去（只是空格转不回去了）：

import cgi
new_cont = cgi.escape(new_cont)
print new_cont #new_cont = " asdfg>123<"

Salin selepas log masuk

2、直接挨个替换

html_cont = " asdfg>123<"
new_cont = new_cont.replace(&#39; &#39;, &#39; &#39;)
print new_cont #new_cont = " asdfg>123<"
new_cont = new_cont.replace(&#39;>&#39;, &#39;>&#39;)
print new_cont #new_cont = " asdfg>123<"
new_cont = new_cont.replace(&#39;<&#39;, &#39;<&#39;)
print new_cont #new_cont = " asdfg>123<"

Salin selepas log masuk

不知道还有没有更好的办法。

另外stackoverflow上给出了在xml中处理转义字符的解答：python - What's the best way to handle -like entities in XML documents with lxml? - Stack Overflow。

更多python处理html转义字符相关文章请关注PHP中文网！

Label berkaitan：

html python watak melarikan diri

sumber：php.cn

Artikel sebelumnya：python抓取并保存html页面时乱码问题的 Artikel seterusnya：python简单读取大文件

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

html设置加粗、倾斜、下划线、删除线等字体效果示例介绍

1970-01-01 08:00:00
实现一个 Java 版的 Redis

1970-01-01 08:00:00
最简单的微信小程序Demo

1970-01-01 08:00:00
python中pandas.DataFrame（创建、索引、增添与删除）的简单操作方法介绍

1970-01-01 08:00:00
微信小程序：如何实现tabs选项卡效果示例

1970-01-01 08:00:00
Python构造自定义方法来美化字典结构输出

1970-01-01 08:00:00
HTML5:使用Canvas实时处理Video

1970-01-01 08:00:00
Asp.net使用SignalR实现发送图片

1970-01-01 08:00:00
微信小程序开发教程-App()和Page()函数概述

1970-01-01 08:00:00
详解python redis使用方法

1970-01-01 08:00:00

Isu terkini

Python/MySQL tidak dapat mengekalkan data integer dengan betul Tiada kod diperlukan di sini. Saya mahu menyimpan nombor yang sangat panjang kerana saya s...

daripada 2024-04-04 19:09:44

0

1

367

Menggunakan selenium ingin mengklik dan menentukan URL dalam kelas Saya perlukan petua lain hari ini. Saya cuba membina kod Python/Selenium dan ideanya ialah...

daripada 2024-04-04 14:14:44

0

1

3492

Selenium + Python - periksa imej melalui execute_script Saya perlu mengesahkan bahawa imej dipaparkan pada halaman menggunakan selenium dalam pyth...

daripada 2024-04-03 09:32:15

0

1

375

Bagaimana untuk mengekalkan baris X pertama dan memadamkan baris jadual Saya mempunyai jadual besar dengan berjuta-juta rekod dalam MySQLincident_archive, saya ma...

daripada 2024-04-01 18:32:54

0

1

347

Bagaimana untuk mengikis teks Cuaca Google tertentu menggunakan BeautifulSoup? Bagaimana untuk mencari teks kursus "New York City, USA" dalam Python menggunaka...

daripada 2024-04-01 14:06:14

0

1

308

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan