- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
NoSQL数据库原理
第9章其他NoSQL数据库简介;NoSQL并非是一个严谨的概念,还包含很多能够进行数据管理和查询的系统,诸如:
时序数据库:专门存储时序数据,例如监控日志的数据库,例如InfluxDB等
有哪些信誉好的足球投注网站引擎:强调实现文本类数据的全文检索功能,例如:Solr
环形数据库:主要用于监控系统中绘制图表时提供数据支持,例如:rrdtool;时序数据是应用最为广泛的大数据类型,一般具有数据查询、数据分析和数据聚合(报表)等多方面需求,且通常需要通过图表等数据可视化方式,对当前状态和趋势进行查看。
时序数据的特点:
持续增长,且月新的数据越“热”
数据格式固定,一般只进行数据追加,不进行数据更新和删除。
当前流行的时序数据库有InfluxDB、Druid、OpenTSDB等。一些知名公有云服务也提供了自己的时序数据库服务。
;9.1.1OpenTSDB
OpenTSDB是一种基于HBase建立的分布式、可伸缩的时序数据库,主要用途是存储日志、监控数据等时序数据。OpenTSDB的时间精度最大支持到毫秒级,可以用来为多个服务器节点提供多项指标的持续监控,由于底层采用HBase,因此其支持的数据量、横向扩展能力等均非常优秀,但其部署配置较为繁琐。
TSD节点为OpenTSDB的核心组件,负责将监控数据组织为特定的键值对形式,存储到HBase。
TSD节点是无状态且相互独立的,其横向的扩展与容错能力很好。
;9.1.1OpenTSDB
OpenTSDB所存储的实际数据都存储在名为tsdb的HBase表中,并且设计了独特的键值对格式:
(1)metric:监控项的名称,如用户的CPU使用率sys.cpu.user。每个键值对可以看作一个metric。
(2)timestamp:long型结构存储的时间戳,表明该metric的时间。
(3)tags:标签(组),描述当前metric的属性,如记录主机名等,每个metric可以有多个标签。
(4)value:数值,比如0.5,可能表示当前CPU使用率为50%,也支持用JSON格式存储结构化数据内容。
OpenTSDB提供了HTTP+JSON接口,以及图形化的展示、查询和管理界面。
;9.1.2InfluxDB
InfluxDB是当前最为流行的时序数据库之一,由InfluxData公司进行维护,具有开源的社区版和付费的企业版两种版本,InfluxData公司也提供了InfluxDB公有云服务。
InfluxDB使用Go语言(Golang)编写,不需要其他的依赖项,服务端只包括一个主文件,非常简洁。
InfluxDB还提供了一个指标收集工具Telegraf,可以从数据库、业务系统和物联网系统中,设置、收集和发送度量信息(metric)和事件信息(events)。
Telegraf具有易于部署、灵活性强、内存占用小等优点
InfluxDB的安装使用部署都比较简单,且具有功能完善的图形监控界面。
;9.1.2InfluxDB
;9.1.2InfluxDB
;有哪些信誉好的足球投注网站引擎(SearchEngine)系统,也称全文检索系统,一般被用作Web有哪些信誉好的足球投注网站引擎,或者用于限定行业、领域的垂直模糊有哪些信誉好的足球投注网站领域
常见的Web有哪些信誉好的足球投注网站引擎服务可以看作是有哪些信誉好的足球投注网站引擎系统和网络爬虫系统(负责抓取并分析网页和链接)的结合;而有哪些信誉好的足球投注网站引擎通过建立独特的索引机制和查询方法,实现高效的全文模糊查询,甚至处理查询结果排名等细节问题,但对原始数据(可能是结构化、半结构化或非结构化信息)的存储、管理等方面并不涉及。
有哪些信誉好的足球投注网站引擎系统常和其他NoSQL数据库或分布式文件系统配合使用,如HBase、HDFS等,由后者实现原始数据的分布式存储和管理。;Nutch是一个基于Java的分布式开源有哪些信誉好的足球投注网站引擎,由Apache软件基金会维护。Nutch包括全文检索和网络爬虫(crawler)两个部分,当爬虫抓取网页之后,一般会将其保存在HDFS之上,并通过MapReduce实现对网页的分析,以获取标题、正文、链接等元素,并建立“倒排索引”。;Nutch通过Lucene引擎实现网页以及全文索引的建立。Lucene创立于2000年,目前也是Apache软件基金会的顶级开源项目,
Lucene所建立的索引称为倒排索引(InvertedIndex),这种索引是从字符串(如单词)映射到全文;Lucene需要借助Hadoop实现分布式的网页处理和索引维护
在全文检索(建立索引和进行有哪些信誉好的足球投注网站)时,对于汉语,由于其词汇之间没有空格,因此需要借助中文分词组件(如IKAnalyzer)进行单词切分
对于相关性,一般考虑两个权重:TF和IDF。
如果查询词在某篇文本中出现的次数多,则该文本的相关度较高,该权重称为TF(TermFrequency),即词频。
如果查询词在多篇文档中的出现频
您可能关注的文档
最近下载
- 北师大版六年级数学上册第二单元测试题(共4份).doc VIP
- 2025年必威体育精装版人教版九年级(初三)数学上册教学计划及进度表(新课标).docx
- 医院放射诊疗事故应急处置.pptx
- 2025年泰安市中心医院医护人员招聘参考题库含答案解析.docx VIP
- 贵州某二水电站进水口工程引水隧洞混凝土衬砌施工技术方案.doc.doc VIP
- 浙教版八年级上册数学第二章 特殊三角形(含答案).pdf VIP
- 机电工程质量通病防治手册.pptx VIP
- 儿童呼吸道合胞病毒感染的症状与治疗方法(1)PPT课件.pptx VIP
- D-Z-T 0205-2020 矿产地质勘查规范 岩金(正式版).docx VIP
- CHCC2025第26届全国医院建设大会:消毒供应中心质量控制指标(2024年版)解析.pdf VIP
文档评论(0)