下载此文档

Lucene4.7 IKAnalyzer中文分词入门教程.doc


文档分类:IT计算机 | 页数:约15页 举报非法文档有奖
1/15
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/15 下载此文档
文档列表 文档介绍
word
word
2 / 15
word
+IK Analyzer中文分词入门教程
大明
日期:2014-4-1
环境:
lucene版本:
下载地址:
IK Analyzer版本:IK Analyer 2012-FF Hotfix 1
下载地址:./p/ik-analyzer/downloads/list
选择最上面的源码包。。
参考文章:
,我做了一定幅度的修改,。
下面进入正式部署阶段:
在eclipse中新建一个java项目:lucenetest
进入到解压后的lucene-,搜索*.jar
,根据需要拷贝不同的jar包到自己的工程。本例子需要如下几个jar包:
将以上几个jar包拷贝到lucenetest下的lib文件夹下,如果没有lib,如此新建。
在eclipse中,打开lib,选中这几个jar包,点右键——build parh——add to build path
进入到IK Analyzer 2012FF_hf1_source\src将如下所有的文件拷贝到lucenetest\src下
刷新eclipse工程。如果源码报错,可能是编码格式的问题。解决方法:在lucenetest上点右键,选择最后一项Properties。如如下图所示选择utf-8,点确定
word
word
2 / 15
word
至此,环境已经搭建完毕。如果嫌ik的源码烦,可以自行打成jar包。目前eclipse项目的结构图如下:
word
word
4 / 15
word
参加测试的例子。在src新建ik包,新建下面3个java文件
(1)DataFactory
package ik;
import ;
import ;
public class DataFactory {
private static DataFactory dataFactory = new DataFactory();
private DataFactory(){
}
public List<Medicine> getData(){
List<Medicine> list = new ArrayList<Medicine>();
(new Medicine(1,"银花 感冒颗粒","功能主治:银花感冒颗粒 ,头痛,清热,解表,利咽。"));
(new Medicine(2,"感冒 止咳糖浆","功能主治:感冒止咳糖浆,解表清热,止咳化痰。"));
word
word
4 / 15
word
(new Medicine(3,"感冒灵颗粒","功能主治:解热镇痛。头痛 ,清热。"));
(new Medicine(4,"感冒灵胶囊","功能主治:银花感冒颗粒 ,头痛,清热,解表,利咽。"));
(new Medicine(5,"仁和 感冒颗粒","功能主治:疏风清热,宣肺止咳,解表清热,止咳化痰。"));
return list;
}
public static DataFactory getInstance(){
return dataFactory;
}
}
(2)LuceneIKUtil
package ik;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import .

Lucene4.7 IKAnalyzer中文分词入门教程 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数15
  • 收藏数0 收藏
  • 顶次数0
  • 上传人511709291
  • 文件大小150 KB
  • 时间2022-01-14