开源软件网
当前位置:文章首页 >> 开源搜索引擎 >> Lucene的系统结构

Lucene的系统结构 (1)
2008-04-23 22:27:54  作者:hauver  来源:互连网  浏览次数:0  网友评论0  文字大小:【】【】【】 评分等级:5

本文主要讨论Lucene的系统结构,希望对其结构的初步分析,更深入的了解Lucene的运作机制,从而实现对Lucene的功能扩展。
 
1.Lucene的包结构
 
如上图所示,Lucene源码中共包括7个子包,每个包完成特定的功能:
 
Lucene包结构功能表
包名
功能
org.apache.lucene.analysis
语言分析器,主要用于的切词,支持中文主要是扩展此类
org.apache.lucene.document
索引存储时的文档结构管理,类似于关系型数据库的表结构
org.apache.lucene.index
索引管理,包括索引建立、删除等
org.apache.lucene.queryParser
查询分析器,实现查询关键词间的运算,如与、或、非等
org.apache.lucene.search
检索管理,根据查询条件,检索得到结果
org.apache.lucene.store
数据存储管理,主要包括一些底层的I/O操作
org.apache.lucene.util
一些公用类
 
2.Lucene的主要逻辑图
 
Lucene功能强大,但从根本上说,主要包括两块:一是文本内容经切词后索引入库;二是根据查询条件返回结果。
以下是上述两大功能的逻辑图:
 

STORAGE
(存储器)
ACCESS INDEX
(访问索引)
SERACHER
(查询器)
ANALYZER
(语言分析器)
QUERY PARSER
(查询分析器)
DOCUMENT
(文档结构)
SEARCHER
(查询)
INDEXER
(入库)


本文引用地址:http://www.open-soft.com.cn/article/2008/0423/article_104.html

[1] [2] [3]
责任编辑:hauver

发表评论】 【加入收藏】 【告诉好友】 【打印本页】 【关闭窗口】 【返回顶部
相关评论 0条评论  发表/查看更多评论 
发表评论  【返回顶部】【关闭窗口】 
评分: 1 2 3 4 5

    
  • 请遵守《互联网电子公告服务管理规定》及中华人民共和国其他各项有关法律法规。
  • 严禁发表危害国家安全、损害国家利益、破坏民族团结、破坏国家宗教政策、破坏社会稳定、侮辱、诽谤、教唆、淫秽等内容的评论 。
  • 用户需对自己在使用本站服务过程中的行为承担法律责任(直接或间接导致的)。
  • 本站管理员有权保留或删除评论内容。
 
[推荐]Lucene lecture at Pisa [2008-04-23]
[推荐]Lucene 全文检索实践 [2008-04-23]
[推荐]Lucene.Net 系列一本... [2008-04-23]
[推荐]构建基于词典的Lu... [2008-04-23]
Lucene中文分词 使用Log4... [2008-04-23]
[注意]lucene中文分词器--... [2008-04-23]
[推荐]第四节 Lucene索引构... [2008-04-23]
[推荐]第三节 Lucene索引文... [2008-04-23]
[推荐]第三节 Lucene索引文... [2008-04-23]
[推荐]第二节 Lucene系统结... [2008-04-23]