エスケープされた Unicode 文字 (uXXXX) を含む文字列に遭遇すると、特にエンコードされた文字によってファイルの検索が妨げられるファイル検索を実行する場合に問題が発生する可能性があります。
この問題を解決するために、Apache Commons Lang は便利なStringEscapeUtils.unescapeJava() エスケープされた Unicode シーケンスを対応する文字にデコードするためのメソッド。
次のエスケープされた Unicode 文字列を考えてみましょう:
"\u0048\u0065\u006C\u006C\u006F World"
StringEscapeUtils.unescapeJava() を使用すると、次のようにデコードできます。通常の Unicode 文字列:
"Hello World"
StringEscapeUtils.unescapeJava() の使用方法は次のとおりです:
import org.apache.commons.lang.StringEscapeUtils; // Test the method @Test public void testUnescapeJava() { String sJava = "\u0048\u0065\u006C\u006C\u006F"; System.out.println("StringEscapeUtils.unescapeJava(sJava):\n" + StringEscapeUtils.unescapeJava(sJava)); }
上記のコードの場合、出力は次のようになります。 be:
StringEscapeUtils.unescapeJava(sJava): Hello
StringEscapeUtils.unescapeJava() を利用すると、エスケープされた Unicode 文字列を元の文字形式に簡単に変換でき、適切にデコードされたテキスト データに依存する正確なファイル検索やその他の操作が可能になります。
以上がJava でエスケープされた Unicode 文字列をデコードするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。