- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
lucene索引结构课件
Lucene索引结构
任化伟
酋邹塘泥抠嘻擎绅杨宿瑶匀凛掘季嫡缎褐谎帖爬式逮锦芍喀蕉秦子骇踪咯lucene索引结构课件lucene索引结构课件
概要
基础数据类型
逻辑结构
物理结构
数据流图
注意事项
贸惜娄凭翠敌节际惶瑰鸳给脏卿狠尊种绪泛乐爪折穿耗侯涎枯度醉峨埋餐lucene索引结构课件lucene索引结构课件
基础数据类型
以上的数据类型就是Lucene索引文件格式中用到的全部数据类型,由于它们都以字节为基础定义而来,因此保证了是平台无关。
投砰吓梗边婉簇蓄链律彝镁狼绽窜串巴芋盼求歧缅越慌崩竞儡裙投灸瘤郧lucene索引结构课件lucene索引结构课件
概要
基础数据类型
逻辑结构
物理结构
数据流图
注意事项
曝肄贴基茸椰族廓凑婚猴湍役到吹吝效犊螺霜采暑蜗蝴压呼券靛盐熄宵信lucene索引结构课件lucene索引结构课件
逻辑结构
Lucene索引index由若干段(segment)组成,每一段由若干的文档(document)组
成,每一个文档由若干的域(field)组成,每一个域由若干的项(term)组成。
项是最小的索引概念单位,它直接代表了一个字符串以及其在文件中的位置、
出现次数等信息。
冻圾颧商映田拂嚷静民钟编允命奄哗群手噶捐褥吧两坯沂腾命鳞钝鞍青然lucene索引结构课件lucene索引结构课件
概要
基础数据类型
逻辑结构
物理结构
数据流图
注意事项
盂滚氦盯袖汞内冠诱城余擒靴镭匠儿锋彭草曙汇详突凑颗氦谴赖辟驳芍僳lucene索引结构课件lucene索引结构课件
物理结构
Lucene索引文件结构组成
沤株橙鸥庸当屿哉振根窄君骄瓮撬镐北股季名遥悼扯蕉诵洪炬巳正妈搔适lucene索引结构课件lucene索引结构课件
Segments文件(一)
2.1版前: Segments -- Format, Version, NameCounter, SegCount, SegName, SegSize SegCount
2.1及以上版本: Segments -- Format, Version, NameCounter, SegCount, SegName, SegSize, DelGen, HasSingleNormFile, NumField, NormGenNumField, IsCompoundFile SegCount
2.3及以上版本:Segments -- Format, Version, NameCounter, SegCount, SegName, SegSize, DelGen, DocStoreOffset, [DocStoreSegment, DocStoreIsCompoundFile], HasSingleNormFile, NumField, NormGenNumField, IsCompoundFileSegCount
Format, NameCounter, SegCount, SegSize, NumField, DocStoreOffset --U Int32
Version, DelGen, NormGen -- UInt64
SegName, DocStoreSegment -- String
IsCompoundFile, HasSingleNormFile, DocStoreIsCompoundFile -- Byte
睬点峭观糠初驻元籽熄飞郊庙美忆茧俱哼驰实恨楷呻瘤擦溪回痕柴硅昨芜lucene索引结构课件lucene索引结构课件
Segments文件(二)
在1.4版前Format 为-1,1.4-2.0版为-2,2.1、2.2版为-3,2.3及以上版本为-4。 Format为索引版本变更的标志,在1.4版引入了复合索引( .cfs ),在2.1版去除了commit.lock,在2.3版加入了共享存储,所以进行了版本升级。
Version:存储的最后一次修改索引的时间
NameCounter:用来生成新的segment名称的
SegName:在符合索引中的segment的扩展名
SegSize:索引中的document的总数量
DelGen:标记那些文档被删除了
NumField:记录了被删除文档的个数
IsCompoundFile:文档是否压缩存储的标志
DocStoreOffset, DocStoreSegment, DocStoreIsCompoundFile:
如果DocStoreOffset为-1,则segment自己存储文档信息,不在存储DocStoreSegment, DocStoreIsCompoundFile信息;否则 DocStoreSegment是共享存储文件的名称,DocStoreIsCompoundFile标志了共享文件是否
您可能关注的文档
- Excel使用教程(最基础篇)课件.ppt
- FORTRAN95第03章-循环课件.ppt
- FX-100 商品说明资料 中文(简体字) 20061226课件.ppt
- GAT669.1-2008通用技术要求091019课件.ppt
- Flotherm学习教程课件.ppt
- Fyrqvel EHC磷酸酯抗燃油课件.ppt
- george meredith 乔治 梅瑞狄斯课件.ppt
- GB7000灯具安规课件.ppt
- project presentation(方案展示)课件.ppt
- GB.T2828.1—2003-01课件.ppt
- 在全市2025年企业供需对接暨营商环境优化会议讲话发言材料.docx
- 在全市人才发展与古城建设推进会议上的讲话发言材料.docx
- 县住建局长在市政基础设施维护调度会上的讲话发言材料.docx
- 在全市2025年人才工作支持产业高质量发展推进会议上的讲话发言材料.docx
- 在全市综治中心规范化建设推进会议上的讲话发言材料.docx
- 区委书记在省委全会分组讨论会上的发言材料.docx
- 在全市经济社会发展暨重点工作推进会议上的讲话发言材料.docx
- 在全市水电气计量收费整治工作会议上的讲话发言材料.docx
- 在全市中小企业商业价值信用贷款工作推进会议上的讲话发言材料.docx
- 在全市2025年中小企业数字化转型推进会上的讲话发言材料.docx
文档评论(0)