2007-07-31

lucene高亮demo

关键字: highlighter
java 代码 package com.feedsky.lucene;       import java.io.StringReader;       import org.apache.lucene.analysis.Analyzer;    import org.apache.lucene.analysis.TokenStream;    impor ...
2007-07-11

提取关键词及相应的频率,Field.Store.NO的数据获取

关键字: 关键词及相应的频率,Field.Store.NO的数据获取
1.提取关键词及相应的频率 java 代码   RAMDirectory ramDir = new RAMDirectory();           IndexWriter ramWriter = null;           IndexReader ramRea ...
2007-07-05

数据挖掘关于分类方面

关键字: 数据挖掘关于分类方面
1.提供自动学习数据,对这些数据进行索引 2。从索引里提取一个2维矩阵列表,写入一个文本文件里。关键性代码如下: java 代码   import java.io.File;   import java.util.HashMap;      import org.apache.log4j.Logger;   import org.apache.lucene.document.Document;&nb ...
2007-06-29

提取关键词,并排序

关键字: 提取关键词,并排序
java 代码   //提取内容关键字! 对关键字重要性做排序 筛选!           TermFreqVector contentFreqVector = reader.getTermFreqVector(docId, "itemContent");          &n ...
2007-06-28

lucene索引参数优化

关键字: lucene索引参数优化
1。maxBufferedDocs       缓存在内存中的document数目,超过他以后会写入到磁盘 2.   maxFieldLength     一个Field中最大Term数目,超过部分忽略,不会index到field中,所以自然也就搜索不到 3.maxMergeDocs     一般不用设置,,默认值: Integer.MAX_VALUE 4.mergeFactor         ...
2007-06-28

lucene支持内存索引

关键字: lucene支持内存索引
lucene支持内存索引:这样的搜索比基于文件的I/O有数量级的速度提升。 http://www.onjava.com/lpt/a/3273,而尽可能减少IndexSearcher的创建和对搜索结果的前台的缓存也是必要的。 Lucene面向全文检索的优化在于首次索引检索后,并不把所有的记录(Document)具体内容读取出来,而起只将所有结果中匹配度最高的头100条结果(TopDocs)的ID放到结果集缓存中并返回,这里可以比较一下数据库检索:如果是一个10,000条的数据库检索结果集,数据库是一定要把所有记录内容都取得以后再开始返回给应用结果集的。 所以即使检索匹配总数很多,Lucen ...
转载: http://blog.csdn.net/xiaodaoxiaodao/archive/2006/09/10/1203959.aspx 关于lucene2.0的创建、检索和删除功能的完整实现   最近要做一个站内的全文检索功能,主要是针对clob字段的,于是去网上找了点lucene的资料,现在新版本的是2.0.0,网上的例子多是1.4.3的,有些方法已经废弃了,搞了n久终于把2.0.0的功能实现了,呵呵,下面把实现的代码贴出来,实现了索引的创建、检索和删除功能,并可以从检索结果去查询数据库~    // 创建索引  & ...
2007-06-11

Lucene应用的一点体会

关键字: 多线程索引问题,单线程
Lucene应用(我用的是Lucene2.1.0,有些观点有可能也不太正确) 1.多线程索引,共享同一个IndexWriter对象 这种方式效率很慢,主要原因是因为: java 代码   public void addDocument(Document doc, Analyzer analyzer) throws IOException {   SegmentInfo newSegmentInfo = bui ...
2007-05-21

lucene2.0

关键字: lucene
Field.Text(java.lang.String, java.io.Reader) 用new Field(java.lang.String, java.io.Reader)代替 Field.Keyword(java.lang.String, java.lang.String) 用 Field.Keyword(java.lang.String, java.lang.String) 代替 Query query = QueryParser.parse(q, "contents", new StandardAnalyzer ()); 用 Quer ...
ttitfly
搜索本博客
我的相册
63e97aa5-d2de-33be-88c3-8f39d5279b8d-thumb
bbbb
共 3 张
存档
最新评论