Java 正規表示式中w 和b 的Unicode 等效項
Java 的正規表示式實作不使用w 字元類簡寫來表示“任何字母” 、數字或連接標點符號”,就像其他實現一樣。這使得匹配Unicode 單字變得更加困難。該問題擴展到 b字分隔符,它在Java 中也表現出不一致的行為。使用以下替換:
w: [pLpMp{Nd}p{Nl}p{Pc}[p{InEnlatedAlphanumerics}&&p{So}]]
b: (?:(?Unicode 感知正規表示式
透過合併這些Unicode感知替代項,人們可以建立準確處理Unicode 資料的正規表示式模式。還是Unicode 編碼。以上是如何在 Java 中建立支援 Unicode 的正規表示式?的詳細內容。更多資訊請關注PHP中文網其他相關文章!