主要参考文章: http://www.cnblogs.com/dyllove98/archive/2013/06/19/3144919.html
但是我利用了搜狗的语料库来进行测试:http://www.sogou.com/labs/dl/c.html
此次使用的是其mini版 demo而已嘛:)
主要代码可以参考来源的博客,基本上copy到eclipse之中就能用。本人小小改动了一下而已。
唯一想说的就是,本人打开lucene的压缩包之后,发现了数不清的jar 包,顿时就无语不知所措了~
实际上,对于一个普通的创建索引+搜索的任务,会需要下面几个包就可以了:
(1) core / lucene-core-4.6.1.jar
这个是核心类库,少不了的
(2) analysis \ common \ lucene-analyzers-common-4.6.1.jar
普通分词的类库。 其他的比如icu之中的jar包,是不同算法实现的。暂时没有深究
(3) queryparser \ lucene-queryparser-4.6.1.jar
这个是查询的时候需要的,如果仅仅是做分词、创建索引 无需这个jar包
运行LuceneSearch.java
其中我搜索的关键词是: 集团
结果:
正在检索关键字 : 集团 检索完成,用时17毫秒 这是第0个检索到的结果,文件名为:e:\lucene\file\10.txt 这是第1个检索到的结果,文件名为:e:\lucene\file\16.txt --------------------------
作为对比,使用Apache Commons IO的FileUtils进行纯文件读并查询,结果如下:
e:\lucene\file\10.txt e:\lucene\file\16.txt 耗时:26毫秒
因此可以看到,创建了索引的搜索速度还是要提高不少的。
PS: 这个搜索结果的时间,第一次可能会比较长,达到60+毫秒,那可能是因为需要把.java变成.class
最后贴一下我的项目截图:
相关推荐
lucene.net 完全入门教程,包括 lucene.net 介绍, lucene.net工作模式, lucene.net分词方法和中文分词方法, lucene.net索引的建立详解, lucene.net搜索详解, lucene.net的下载方法, lucene.net搜索结果实现...
Lucene3.4开发入门.pdf
Lucene入门与使用,非常简单,适合入门
Lucene使用lucene入门[归类].pdf
包含最新lucene5.2.1的入门经典案例,以及程序中所需的lucene-core-5.2.1.jar、lucene-analyzers-common-5.2.1.jar等几个jar包。代码可运行。
Lucene 3.0完成入门 轻松入门,内有七个文档帮助你了解并实现简单的搜索
Eclipse工程文件,全文检索 lucene-5.2.1 入门Eclipse工程实例,福利放送,与lucene3结果比对
说明: 例子是根据lucene3.6写的,也可以说是直接copy别人的。 包括参考文章的代码,以及修改部分之后的代码
Lucene.Net是Lucene在dot net平台上的移植版本。它的功能与Lucene一样,都是用来提供一组API,让我们能快速开发自己的搜索引擎,当然,是全文搜索。
这里包含lucene的 jar包 ,API帮助文档CHM格式 ,还有一小段入门代码
1. Lucene介绍与入门使 2. 解决windows10和u 3. 在一台电脑上运行两 4. WebService的简单介 1. Lucene介绍与入门使
Lucene 简单入门程序实例
lucene入门小例子
Lucene2.4入门总结lucene2.4 人门 field 多条件搜索
比较全面的一个入门 比较全面的一个入门 比较全面的一个入门 比较全面的一lucene个入门 比较全面的一个入门
lucene3.6入门实例教程 完整代码示例,lucene入门学习很好的资料
Lucene入门demo,lucene简单的应用
我自己写的一个lucene搜索引擎的简单入门例子源代码 对照lucene,相当的易懂。api我这也有,含JE分词器。
lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例