- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
阿里巴巴——Oceanbase Introduction 淘宝Oceanbase是从2010年5月开始研发的,其定位是解决淘宝内部在线业务的云存储问题。我们在设计系统时,总是考虑现在及今后一段时间的需求。互联网业务大致可以分为OLTP和OLAP两类,对在线存储的需求简单归纳如下。 OLTP:今后数据规模为千亿级,数据量数百TB,要求几十万QPS和几万TPS。 OLAP:支持千万级记录的数据集上进行实时计算。 功能:支持范围查询,支持跨行跨表事务。 其他:高可用性、自动故障处理、自动扩容等。 因为OLTP和OLAP业务对性能的要求,我们必须采用分布式方案。另外,淘宝的业务发展迅猛,传统的分库/分表方法带来的扩容及运维成本太高,必须构建异构的云存储系统。 OceanBase客户端 OceanBase——RootServer OceanBase——RootServer OceanBase——RootServer OceanBase——MergeServer 数据库功能 整体架构 只读事务 写事务 特色功能 整体架构 只读事务 只读事务(SELECT语句) , 经过词法分析、 语法分析, 预处理后, 转化为逻辑查询计划和物理查询计划。 单表操作 单表相关的物理运算符: 1 . TableScan: 扫描某个表格 2. Filter: 针对每行数据, 判断是否满足过滤条件。 3. Projection: 对输入的每一行, 根据定义的输出表达式, 计算输出结果行。 4. GroupBy: 把输入数据按照指定列进行聚集, 对聚集后的每组数据可以执行count、 sum、 min、 max、 avg等聚集操作。 5. Sort: 对输入数据进行整体排序, 如果内存不够, 需要使用外排序 6. Limit: 返回行号在[offset, offset + count)范围内的行。 7. Distinct: 消除某些列相同的重复行。。 物理查询计划举例-单表查询 物理查询计划举例-多表查询 写事务 写事务,包括UPDATE、INSERT、DELETE、 REPLACE,由MergeServer解析后生成物理执行计划, 物理执行计划最终将发给UpdateServer执行。 写事务可能需要读取基线数据,用于判断更新或者插入的数据行是否存在,判断某个条件是否满足,等等,这些基线数据也会由MergeServer传给UpdateServer。 OceanBase的特色功能 1.大表左连接 2.数据过期与批量删除 大表左连接 需求来源:淘宝收藏夹业务 (1)收藏夹业务:包含收藏表collect_info以及商品表collect_item ◆ collect_info:存储用户的收藏信息,如收藏时间、标签等 ◆ collect_item:存储用户收藏的商品或者店铺的信息,包括价格、人气等 (2)收藏夹业务的数据量 ◆ collect_info的数据条目达到100亿条 ◆ collect_item的数据条目接近10亿条 ◆ 每个用户平均收藏了50 ~ 100个商品或者店铺 大表左连接 (3)传统做法 采用Join操作: 根据collect_info中存储的商品编号(item_id) , 实时地从商品表读取商品的价格、人气等信息。 冗余:在collect_info表中冗余商品的价格、 人气等信息, 读取时就不需要读取collect_item表了。 (4)OceanBase的做法 在collect_info的基线数据中冗余collect_item信息,修改增量中将collect_info和collect_item两张表格分开存储。商品价格、 人气变化信息只需要记录在UpdateServer的修改增量中 大表左连接 读取操作步骤 数据过期与批量删除 一、数据过期 (1)优点:节省存储成本 很多业务只需要存储一段时间,比如三个月或者半年的数据,更早之前的数据可以被丢弃。 (2)实现 ◆ OceanBase线上每个表格都包含创建时间(gmt_create)和修改时间(gmt_modified)列 ◆使用者可以设置自动过期规则,比如只保留创建时间或修改时间不晚于某个时间点的数据行,读取操作会根据规则过滤这些失效的数据行,每日合并时这些数据行会被物理删除 二、批量删除 (1)需求来源:OLAP业务 OLAP(数据仓库)业务往往每天导入一批数据,由于业务逻辑复杂,上游系统很可能出错,导致某一天导入的数据出现问题,需要将这部分出错的数据删除掉。由于导入的数据量很大,一条一条删除其中的每行数据
您可能关注的文档
最近下载
- 2025至2030中国再担保行业发展趋势分析与未来投资战略咨询研究报告.docx
- 新版VDA6.3-2023过程审核精品教程(培训课件).pptx VIP
- 鲁教版Unit5IlikemusicthatIcandanceto知识点教案.pdf VIP
- 2024年四川省公考《申论》题县乡卷附解析.pdf VIP
- DB4401T+282—2024准《城市道路挖掘修复技术规范》.docx VIP
- 600MW火电机组节能对标指导手册_PDF电子书下载 高清 带索引书签目录_sample_中国电力投资集团公司编著_北京:中国电力出版社.pdf VIP
- 高手接话:高情商的讲话方法.pdf VIP
- 蓝色商务供应商采购供应商管理培训PPT模板.pptx VIP
- 八年级英语IlikemusicthatIcandanceto测试题.docx VIP
- 建设银行2025开封市信息科技岗笔试题及答案.docx VIP
文档评论(0)