[php]
/**
* 中国語単語分割処理方法
*+--------------------------------
* @param stirng $string 処理対象の文字列
* @param boolers $sort=false 値に応じて逆順
* @param Numbers $top=0 は指定された数値を返し、デフォルトではすべてを返します
*+--------------------------------
* @return void
*/
function scws($text, $top = 5, $return_array = false, $sep = ',') {
include('./pscws4/pscws4.php');//去下面给的网址ハンドルpscws4下ダウンロード下来
$cws = 新しい pscws4('utf-8');
$CWS -> set_charset('utf-8');
$CWS -> set_dict('./pscws4/etc/dict.utf8.xdb');
$CWS -> set_rule('./pscws4/etc/rules.utf8.ini');
//$cws->set_multi(3);
$CWS -> set_ignore(true);
//$cws->set_debug(true);
//$cws->set_duality(true);
$CWS -> send_text($text);
$ret = $cws -> get_tops($top, 'r,v,p');
$結果 = null;
foreach ($ret を $value として) {
if (false === $return_array) {
$result .= $sep 。 $value['単語'];
} その他 {
$result[] = $value['単語'];
}
}
return false === $return_array ? substr($result, 1) : $result;
}
print_r(scws('青花夔龙纹香炉'));
/**
* 中国語単語分割処理方法
*+--------------------------------
* @param stirng $string 処理対象の文字列
* @param boolers $sort=false 値に応じて逆順
* @param Numbers $top=0 は指定された数値を返し、デフォルトではすべてを返します
*+--------------------------------
* @return void
*/
function scws($text, $top = 5, $return_array = false, $sep = ',') {
include('./pscws4/pscws4.php');//去下面给的网址ハンドルpscws4下ダウンロード来ます
$cws = new pscws4('utf-8');
$CWS -> set_charset('utf-8');
$CWS -> set_dict('./pscws4/etc/dict.utf8.xdb');
$CWS -> set_rule('./pscws4/etc/rules.utf8.ini');
//$cws->set_multi(3);
$CWS -> set_ignore(true);
//$cws->set_debug(true);
//$cws->set_duality(true);
$CWS -> send_text($text);
$ret = $cws -> get_tops($top, 'r,v,p');
$result = null;
foreach ($ret を $value) {
if (false === $return_array) {
$result .= $sep 。 $value['単語'];
} その他 {
$result[] = $value['単語'];
}
}
return false === $return_array ? substr($result, 1) : $result;
}
print_r(scws('青花夔龙纹香炉'));