• 技术文章 >后端开发 >Python教程

    如何使用IKAnalyzer分词器自定义扩展词典

    坏嘻嘻坏嘻嘻2018-09-14 16:54:57原创2856
    本文主要介绍了如何使用IKAnalyzer分词器自定义扩展词典,希望大家可以耐心学习。

    下载IKAnalyzer完整分发包后,IK Analyzer安装包包含:
    1. 《IKAnalyzer中文分词器V2012使用手册》
    2. IKAnalyzer2012.jar(主jar包)
    3. IKAnalyzer.cfg.xml(分词器扩展配置文件)
    4. stopword.dic(停止词典)
    5. LICENSE.TXT ; NOTICE.TXT (apache版权申明)
    它的安装部署十分简单,将 IKAnalyzer2012.jar 部署于项目的 lib 目录中;
    IKAnalyzer.cfg.xml 与 stopword.dic 文件放置在 class 根目录(对于 web 项目,通常是
    WEB-INF/classes目录,同hibernate、log4j等配置文件相同)下即可。

    要扩展自定义词典,打开IKAnalyzer.cfg.xml

    20180914141741225.png

    将扩展词典的注释去掉。

    20180914141829717.png

    同时在class根目录,即src文件夹下自己新建ext.dic文件。建好之后用Notepad++软件打开ext.dic。

    20180914142129894.png

    相关推荐:

    详解Java开源的11个中文分词器使用方法和分词效果对比

    使用Discuz关键词服务器实现PHP中文分词_PHP教程

    以上就是如何使用IKAnalyzer分词器自定义扩展词典的详细内容,更多请关注php中文网其它相关文章!

    声明:本文原创发布php中文网,转载请注明出处,感谢您的尊重!如有疑问,请联系admin@php.cn处理
    专题推荐:IKAnalyzer,python
    上一篇:关于python 下划线使用场景 下一篇:Python的序列化和反序列化模块的简单介绍(实例代码)
    线上培训班

    相关文章推荐

    • solr4.4.0 集成 carrot2 支持中文和添加自己的中文分词器的方法• 用Python写一个简单的中文分词器• 详解Java开源的11个中文分词器使用方法和分词效果对比• 有关中文分词器的文章推荐10篇

    全部评论我要评论

  • 取消发布评论发送
  • 1/1

    PHP中文网