去除无效HTML标签之间的空格的正则表达式 - 例如""应该是""

Question

我有一些HTML，这些HTML都被标签内的空格弄乱了，并且希望使其再次有效-例如：1>0istrueandapples>>>bananas应转换为有效的HTML，并且在渲染时，预计会生成：1>0is

P粉323050780 · Answer

没有合理的方法来保存像您发布的内容一样损坏的文档，但假设您将文本中的 > 和类似字符替换为其相关实体，例如： > ;，您可以将要接受的文档放入适当的库中，例如 DomDocument 将处理剩下的事情。

$input = <<<_E_
< div class='test' >1 > 0 is < b >true and apples >>> bananas< / div >
_E_;

$input = preg_replace([ '#<\s+#', '#loadHTML($input, LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);

var_dump($d->saveHTML());

输出：

string(80) "1 > 0 is true and apples >>> bananas"

P粉064448449 · Answer

这个正则表达式也有效：

它将 HTML 标记中的有效部分分为四个部分，并用其替换其余部分（空格）。

Regex101 演示

/(]*\S)\s*(>)/g

( - 捕获起始尖括号（第 1 节）
\s* - 匹配任何空格
(\/?) - 捕获可选的反斜杠（第 2 部分）
\s* - 匹配反斜杠后的任何空格
([^]*\S) - 捕获标签内的内容，不带尾随空格（第 3 节）
\s* - 匹配内容后面和右尖括号之前的空格
(>) - 捕获右尖括号（第 4 节）

const reg = /(<)\s*(\/?)\s*([^<>]*\S)\s*(>)/g
const str = "< div class='test' >1 > 0 is < b >true< / b > and apples >>> bananas< / div  >"
const newStr = str.replace(reg, "$1$2$3$4");
console.log(newStr);

Php8, 나도 갈게

30분 안에 웹사이트 레이아웃 배우기

Shangguan Oracle 초보자부터 능숙한 비디오 튜토리얼까지

UNI-APP 코드의 첫 번째 줄

처음부터 앱 실행까지 Flutter

Lian 형제 새 Linux 비디오 튜토리얼

AXURE 9 비디오 튜토리얼(제품 관리자 대화형 제품 디자인 UI에 적합)

Zero 기본 숙련도 PS 비디오 튜토리얼

시작하는 데 도움이 되는 16일 UI 비디오 튜토리얼

PS 기술 및 슬라이싱 기술 비디오 튜토리얼

Alibaba Cloud 환경 구축 및 프로젝트 출시 비디오 튜토리얼

컴퓨터 네트워크 개요 - 프로그래머가 마스터해야 하는 기본 지식

프로그래머를 위한 필수 튜토리얼 - HTTP 프로토콜 설명

웹소켓 비디오 튜토리얼