Heim > Backend-Entwicklung > PHP-Tutorial > 中文分词处理方法_PHP教程

中文分词处理方法_PHP教程

WBOY
Freigeben: 2016-07-14 10:10:54
Original
860 Leute haben es durchsucht

[php]
 
/**
 * 中文分词处理方法
 *+---------------------------------
 * @param stirng  $string 要处理的字符串
 * @param boolers $sort=false 根据value进行倒序
 * @param Numbers $top=0 返回指定数量,默认返回全部
 *+---------------------------------
 * @return void
 */ 
function scws($text, $top = 5, $return_array = false, $sep = ',') { 
    include('./pscws4/pscws4.php');//去下面给的网址把pscws4下载下来  
    $cws = new pscws4('utf-8'); 
    $cws -> set_charset('utf-8'); 
    $cws -> set_dict('./pscws4/etc/dict.utf8.xdb'); 
    $cws -> set_rule('./pscws4/etc/rules.utf8.ini'); 
    //$cws->set_multi(3);  
    $cws -> set_ignore(true); 
    //$cws->set_debug(true);  
    //$cws->set_duality(true);  
    $cws -> send_text($text); 
    $ret = $cws -> get_tops($top, 'r,v,p'); 
    $result = null; 
    foreach ($ret as $value) { 
        if (false === $return_array) { 
            $result .= $sep . $value['word']; 
        } else { 
            $result[] = $value['word']; 
        } 
    } 
    return false === $return_array ? substr($result, 1) : $result; 

print_r(scws('青花夔龙纹香炉')); 

/**
 * 中文分词处理方法
 *+---------------------------------
 * @param stirng  $string 要处理的字符串
 * @param boolers $sort=false 根据value进行倒序
 * @param Numbers $top=0 返回指定数量,默认返回全部
 *+---------------------------------
 * @return void
 */
function scws($text, $top = 5, $return_array = false, $sep = ',') {
    include('./pscws4/pscws4.php');//去下面给的网址把pscws4下载下来
    $cws = new pscws4('utf-8');
    $cws -> set_charset('utf-8');
    $cws -> set_dict('./pscws4/etc/dict.utf8.xdb');
    $cws -> set_rule('./pscws4/etc/rules.utf8.ini');
    //$cws->set_multi(3);
    $cws -> set_ignore(true);
    //$cws->set_debug(true);
    //$cws->set_duality(true);
    $cws -> send_text($text);
    $ret = $cws -> get_tops($top, 'r,v,p');
    $result = null;
    foreach ($ret as $value) {
        if (false === $return_array) {
            $result .= $sep . $value['word'];
        } else {
            $result[] = $value['word'];
        }
    }
    return false === $return_array ? substr($result, 1) : $result;
}
print_r(scws('青花夔龙纹香炉'));


 

www.bkjia.comtruehttp://www.bkjia.com/PHPjc/477442.htmlTechArticle[php] ?php /** * 中文分词处理方法 *+--------------------------------- * @param stirng $string 要处理的字符串 * @param boolers $sort=false 根据value进行倒序 * @...
Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage