Bagaimanakah php membezakan antara Cina Ringkas, Cina Tradisional, Jepun dan Korea
Mengikut kaedah yang diberikan dalam talian, nampaknya Cina, Jepun, dan Korea boleh dibezakan, tetapi bagaimana untuk membezakan Cina mudah dan tradisional?
$s = <<<'EOF'
"memolov 爱书 愛書 あいしょ 사랑 때문에 책이 되다",
EOF;
echo $s.PHP_EOL;
if(preg_match_all('/([\x{4e00}-\x{9fa5}]+)/u',$s,$m)){ //中文简体繁体
echo "<pre>";
print_r($m[1]);
echo "</pre>";
}
if(preg_match_all('/([\x{0800}-\x{4e00}]+)/u',$s,$m)){ //日文
echo "<pre>";
print_r($m[1]);
echo "</pre>";
}
if(preg_match_all('/([\x{AC00}-\x{D7A3}]+)/u',$s,$m)){ //韩文
echo "<pre>";
print_r($m[1]);
echo "</pre>";
}
Maka inilah masalahnya
小
Tidak ada Cina tradisional untuk ini. Jadi adakah ini dianggap mudah atau tradisional?Ringkas dan Tradisional ini. . Bukan senang nak bezakan. Bolehkah anda membina perpustakaan yang sepadan dengan Bahasa Cina Ringkas dan Tradisional?
Saya ada idea mudah:
Tukar dahulu bahasa Cina kepada Cina Mudah Jika rentetan tidak berubah sebelum dan selepas penukaran, ia adalah Cina Mudah, jika tidak, ia dikira sebagai Cina Tradisional.
https://github.com/BYVoid/OpenCC
Pustaka OpenCC, digunakan untuk penukaran, sangat mudah digunakan. Yang lain juga boleh digunakan.