Wie kann ich Javas \w, \b und andere Regex-Verknüpfungen für vollständige Unicode-Kompatibilität umschreiben?-javaLernprogramm-php.cn

How Can I Rewrite Java's w, b, and Other Regex Shortcuts for Full Unicode Compatibility?

Umschreiben von w und b in Java-Regexes für Unicode-Kompatibilität

Javas w- und b-Verknüpfungen für reguläre Ausdrücke haben eingeschränkte Unicode-Unterstützung. Um dieses Problem zu beheben, können Sie diese Verknüpfungen mithilfe der folgenden Unicode-fähigen Definitionen umschreiben:

\w (words) => [\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics}&amp;&amp;\p{So}]]
\W (non-words) => [^\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics}&amp;&amp;\p{So}]]

\b (word boundary) => (?:(?<=[\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics}&amp;&amp;\p{So}]])(?![\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics}&amp;&amp;\p{So}]])|(?<![\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics}&amp;&amp;\p{So}]])(?=[\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics}&amp;&amp;\p{So}]]))
\B (non-word boundary) => (?:(?<=[\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics}&amp;&amp;\p{So}]])(?=[\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics}&amp;&amp;\p{So}]])|(?<![\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics}&amp;&amp;\p{So}]])(?![\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics}&amp;&amp;\p{So}]]))

Nach dem Login kopieren

Andere Unicode-fähige Regexp Verknüpfungen:

u0009-u000Du0020u0085u00A0u1680u180Eu2000-u200Au2028u2029u202Fu205Fu3000 ↩
u000A-u000Du0085u2028u2029 ↩
u0009u0020u00A0u1680u180Eu2000u2001-u200Au202Fu205Fu3000 ↩

Das obige ist der detaillierte Inhalt vonWie kann ich Javas \w, \b und andere Regex-Verknüpfungen für vollständige Unicode-Kompatibilität umschreiben?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle：php.cn

Vorheriger Artikel：Was bedeuten die drei Punkte (...) in einer Java-Methodensignatur wie „withRecipientJids(JID...)“? Nächster Artikel：Warum gibt dieses Java-Programm „YYXZ“ anstelle von „XZYY“ aus?

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Neueste Artikel des Autors

Aktuelle Ausgaben

function_exists() kann die benutzerdefinierte Funktion nicht ermitteln Funktionstest () {Verwendung der Verwendung durch -Durch -Durch -Durch -Durch -Durch -Durc...

Aus 2024-04-29 11:01:01

2205

So zeigen Sie die mobile Version von Google Chrome an Hallo Lehrer, wie kann ich Google Chrome in eine mobile Version umwandeln?

Aus 2024-04-23 00:22:19

2354

Das untergeordnete Fenster bedient das übergeordnete Fenster, aber die Ausgabe antwortet nicht. Die ersten beiden Sätze sind ausführbar, der letzte Satz jedoch nicht.

Aus 2024-04-19 15:37:47

1972

Im übergeordneten Fenster erfolgt keine Ausgabe document.onclick = function(){ window.opener.document.write('Ich bin die Ausgabe des unter...

Aus 2024-04-18 23:52:34

1857

Wo gibt es die Kursunterlagen zum CSS-Mindmapping? Kursunterlagen

Aus 2024-04-16 10:10:18

1922

verwandte Themen

Mehr>

Beliebte Empfehlungen

Beliebte Tutorials

Mehr>

Verwandte Tutorials

Beliebte Empfehlungen

Aktuelle Kurse

Neueste Downloads

Mehr>

Web-Effekte

Quellcode der Website

Website-Materialien

Frontend-Vorlage

Regexp Shortcut	Unicode-Aware Definition
s (whitespace)	[u0009-u000Du0020u0085u00A0u1680u180Eu2000-u200Au2028u2029u202Fu205Fu3000]
S (non-whitespace)	¹
v (vertical whitespace)	[u000A-u000Du0085u2028u2029]
V (non-vertical whitespace)	²
h (horizontal whitespace)	[u0009u0020u00A0u1680u180Eu2000-u200Au202Fu205Fu3000]
H (non-horizontal whitespace)	³
d (digits)	p{Nd}
D (non-digits)	P{Nd}
R (line break)	(?:(?>u000Du000A)	[u000Au000Bu000Cu000Du0085u2028u2029])
X (extended grapheme cluster)	(?>PMpM*)