" hendaklah "",Saya mempunyai beberapa HTML yang berantakan dengan ruang dalam teg dan mahu menjadikannya sah semula - contohnya: Saya mempunyai beberapa HTML yang dikacaukan oleh ruang dalam teg dan mahu menjadikannya sah semula - contohnya: hendaklah ditukar kepada HTML yang sah, dan apabila dipaparkan, dijangka menghasilkan: Sebarang teks yang didahului/diikuti dengan ruang dalam Saya sedar ini mungkin memerlukan beberapa ungkapan biasa, yang tidak mengapa Saya ada beberapa perkara: Sebagai contoh, saya boleh mengambil pendekatan drastik, tetapi itu juga akan memecahkan kod dalam bahagian teks label, bukan nama label itu sendiri< div class='test' >1 >b >benar b> pisang< / div >
Ini akan membetulkan sebahagian
Tiada cara yang munasabah untuk menyimpan dokumen yang rosak seperti yang anda siarkan, tetapi dengan mengandaikan anda meletakkan
>
和类似字符替换为其相关实体,例如:> ;
dalam teks, anda boleh meletakkan dokumen yang anda ingin terima ke dalam perpustakaan yang sesuai sepertiDomDocumentyang akan menjaga berehat.Keluaran:
Regex ini juga berfungsi:
Ia membahagikan bahagian yang sah dalam teg HTML kepada empat bahagian dan menggantikan bahagian yang tinggal (ruang) dengannya.
Demo Regex101
/(]*S)s*(>)/g
( - Tangkap kurungan sudut bukaan (bahagian 1)
s*
- sepadan dengan mana-mana ruang(/?)
- Menangkap garis miring ke belakang pilihan (Bahagian 2)s*
- sepadan dengan mana-mana ruang selepas garis miring ke belakang([^]*S)
- Tangkap kandungan dalam tag tanpa ruang di belakang (bahagian 3)s*
- Padankan ruang selepas kandungan dan sebelum kurungan sudut kanan(>)
- Menangkap kurungan sudut kanan (bahagian 4)