实现的完整中文分词的php类

2018-01-16 17:16:373838383查看评论(19)
简介:

<?php
class Segmentation {
  var $options = array('lowercase' => TRUE,
    'segment_english' => FALSE);
  var $dict_name = 'Unknown';
  var $dict_words = array();
  function setLowercase($value) {
    if ($value) {
      $this->options['lowercase'] = TRUE;
    } else {
      $this->options['lowercase'] = FALSE;
    }
    return TRUE;
  }
  function setSegmentEnglish($value) {
    if ($value) {
      $this->options['segment_english'] = TRUE;
    } else {
      $this->options['segment_english'] = FALSE;
    }
    return TRUE;
  }

中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂得多、困难得多

实现的完整中文分词的php类

特别申明:
本站所有资源都是由网友投稿发布,或转载各大下载站,请自行检测软件的完整性!
本站所有资源仅供学习与参考,请勿用于商业用途,否则产生的一切后果将由您自己承担!
如有侵权请联系我们删除下架,联系方式:admin@php.cn

相关推荐

php实现的完整中文分词类

php实现的完整中文分词类
938114

实现的完整中文分词的php类

实现的完整中文分词的php类
3813383

互联网媒体分类类型PHP库

互联网媒体分类类型PHP库
4600140

iter-master生成器提供迭代原语的PHP库

iter-master生成器提供迭代原语的PHP库
74136

PHP图像处理库

一个图像处理库
3141163

Unit的并行测试PHP类库

Unit的并行测试PHP类库
392995
网页评论
最新评论
ﺭ并将你删除好友ﺭ沙先生
举世无双的艺术品
名剑
  • 名剑
  • 先下载看看哈哈
  • 2019-05-30 09:42:20发表+0回复
A我是嘉彬-专注互联网8年
M
  • M
  • 看看是不是可以使用
  • 2019-05-24 23:46:25发表+0回复
″ YoK1ng 丶
凉了又温。
凉了又温。
好好学习
kiraseo
kiraseo
清晰的声音
hai
  • hai
  • 下来看看下来看看下来看看
  • 2019-03-30 01:23:02发表+0回复
天明
  • 天明
  • 下载出错,404!
  • 2019-03-23 21:17:30发表+0回复
嘸訁
  • 嘸訁
  • 看看是否可以用
  • 2019-03-16 21:25:19发表+0回复