下载此文档

Lucene4.7 IKAnalyzer中文分词入门教程.doc

文档分类：IT计算机 | 页数：约15页举报非法文档有奖

1/15

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/15 下载此文档

文档列表 文档介绍

word
word
2 / 15
word
+IK Analyzer中文分词入门教程
大明
日期：2014-4-1
环境：
lucene版本：
下载地址：
IK Analyzer版本：IK Analyer 2012-FF Hotfix 1
下载地址：./p/ik-analyzer/downloads/list
选择最上面的源码包。。
参考文章：
，我做了一定幅度的修改，。
下面进入正式部署阶段：
在eclipse中新建一个java项目：lucenetest
进入到解压后的lucene-，搜索*.jar
，根据需要拷贝不同的jar包到自己的工程。本例子需要如下几个jar包：
将以上几个jar包拷贝到lucenetest下的lib文件夹下，如果没有lib，如此新建。
在eclipse中，打开lib，选中这几个jar包，点右键——build parh——add to build path
进入到IK Analyzer 2012FF_hf1_source\src将如下所有的文件拷贝到lucenetest\src下
刷新eclipse工程。如果源码报错，可能是编码格式的问题。解决方法：在lucenetest上点右键，选择最后一项Properties。如如下图所示选择utf-8，点确定
word
word
2 / 15
word
至此，环境已经搭建完毕。如果嫌ik的源码烦，可以自行打成jar包。目前eclipse项目的结构图如下：
word
word
4 / 15
word
参加测试的例子。在src新建ik包，新建下面3个java文件
(1)DataFactory
package ik;
import ;
import ;
public class DataFactory {
private static DataFactory dataFactory = new DataFactory();
private DataFactory(){
}
public List<Medicine> getData(){
List<Medicine> list = new ArrayList<Medicine>();
(new Medicine(1,"银花感冒颗粒","功能主治：银花感冒颗粒，头痛,清热，解表，利咽。"));
(new Medicine(2,"感冒止咳糖浆","功能主治：感冒止咳糖浆,解表清热，止咳化痰。"));
word
word
4 / 15
word
(new Medicine(3,"感冒灵颗粒","功能主治：解热镇痛。头痛 ,清热。"));
(new Medicine(4,"感冒灵胶囊","功能主治：银花感冒颗粒，头痛,清热，解表，利咽。"));
(new Medicine(5,"仁和感冒颗粒","功能主治：疏风清热，宣肺止咳,解表清热，止咳化痰。"));
return list;
}
public static DataFactory getInstance(){
return dataFactory;
}
}
(2)LuceneIKUtil
package ik;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import .

Lucene4.7 IKAnalyzer中文分词入门教程来自淘豆网www.taodocs.com转载请标明出处.