欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 运维知识 > linux >内容正文

linux

linux用分词系统,Linux(CentOS 6.4)Solr4.8.1中文分词配置(IK分词)

发布时间:2024/9/27 linux 45 豆豆
生活随笔 收集整理的这篇文章主要介绍了 linux用分词系统,Linux(CentOS 6.4)Solr4.8.1中文分词配置(IK分词) 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

1、环境准备

CentOS6.4、Tomcat6.0、Jdk1.7、Solr4.8.1、IK Analyzer 2012FF_hf1

2、配置步骤

(1)下载IK Analyzer分词包,解压缩

(2)将IKAnalyzer2012FF_u1.jar拷贝到solr服务的目录solr/WEB-INF/lib下

cp /usr/download/IK Analyzer 2012FF_hf1/IKAnalyzer2012FF_u1.jar

/usr/local/tomcat6/webapps/solr/WEB-INF/lib/

(3)将IKAnalyzer.cfg.xml、stopword.dic拷贝到的conf下面solr/example/solr/collection1/conf目录下(和schemal.xml同一目录)

(4)修改schema.xml,加入如下配置:

name="text_ik" class="solr.TextField">

如上表示加入"text_ik"类型的分词器(即:IKAnalyzer)

最后配置field通过name使用text_ik分词

3、中文分词测试

4、OK搞定!

Solr 的详细介绍:请点这里

Solr 的下载地址:请点这里

总结

以上是生活随笔为你收集整理的linux用分词系统,Linux(CentOS 6.4)Solr4.8.1中文分词配置(IK分词)的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。