java 代码
package com.feedsky.lucene;
import java.io.StringReader;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
impor ...
1.提取关键词及相应的频率
java 代码
RAMDirectory ramDir = new RAMDirectory();
IndexWriter ramWriter = null;
IndexReader ramRea ...
1.提供自动学习数据,对这些数据进行索引
2。从索引里提取一个2维矩阵列表,写入一个文本文件里。关键性代码如下:
java 代码
import java.io.File;
import java.util.HashMap;
import org.apache.log4j.Logger;
import org.apache.lucene.document.Document;&nb ...
java 代码
//提取内容关键字! 对关键字重要性做排序 筛选!
TermFreqVector contentFreqVector = reader.getTermFreqVector(docId, "itemContent");
&n ...
1。maxBufferedDocs
缓存在内存中的document数目,超过他以后会写入到磁盘
2. maxFieldLength
一个Field中最大Term数目,超过部分忽略,不会index到field中,所以自然也就搜索不到
3.maxMergeDocs
一般不用设置,,默认值: Integer.MAX_VALUE
4.mergeFactor
  ...
lucene支持内存索引:这样的搜索比基于文件的I/O有数量级的速度提升。
http://www.onjava.com/lpt/a/3273,而尽可能减少IndexSearcher的创建和对搜索结果的前台的缓存也是必要的。
Lucene面向全文检索的优化在于首次索引检索后,并不把所有的记录(Document)具体内容读取出来,而起只将所有结果中匹配度最高的头100条结果(TopDocs)的ID放到结果集缓存中并返回,这里可以比较一下数据库检索:如果是一个10,000条的数据库检索结果集,数据库是一定要把所有记录内容都取得以后再开始返回给应用结果集的。
所以即使检索匹配总数很多,Lucen ...
转载:
http://blog.csdn.net/xiaodaoxiaodao/archive/2006/09/10/1203959.aspx
关于lucene2.0的创建、检索和删除功能的完整实现
最近要做一个站内的全文检索功能,主要是针对clob字段的,于是去网上找了点lucene的资料,现在新版本的是2.0.0,网上的例子多是1.4.3的,有些方法已经废弃了,搞了n久终于把2.0.0的功能实现了,呵呵,下面把实现的代码贴出来,实现了索引的创建、检索和删除功能,并可以从检索结果去查询数据库~
// 创建索引
& ...
Lucene应用(我用的是Lucene2.1.0,有些观点有可能也不太正确)
1.多线程索引,共享同一个IndexWriter对象
这种方式效率很慢,主要原因是因为:
java 代码
public void addDocument(Document doc, Analyzer analyzer) throws IOException {
SegmentInfo newSegmentInfo = bui ...
Field.Text(java.lang.String, java.io.Reader)
用new Field(java.lang.String, java.io.Reader)代替
Field.Keyword(java.lang.String, java.lang.String)
用
Field.Keyword(java.lang.String, java.lang.String)
代替
Query query = QueryParser.parse(q, "contents", new StandardAnalyzer ());
用
Quer ...
- 浏览: 90778 次
- 性别:

- 来自: 杭州

- 详细资料
搜索本博客
我的相册
bbbb
共 3 张
共 3 张
最近加入圈子
最新评论
-
hibernate知识小结
谢谢!!正好delete那个地方没弄懂!以为delete之后还是持久态!!现在基 ...
-- by 410228573 -
hibernate------HQL总结
谢谢,学习了!
-- by gdjbj2008 -
Extjs2.0---继承
Ext.extend(SubClass,BaseClass,{ ...
-- by yunhaifeiwu -
修改Eclipse注释里的${Da ...
找到eclipse.ini 里面有-Duser.language=en 改为-D ...
-- by duooluu -
sqlserver2005获取连接失 ...
...
-- by gordanmao






评论排行榜