- 1、本文档共54页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文件结构(教授课件)整理
data warehouse 第13章:文件结构 13.1 存取方法 13.2 顺序文件 13.3 索引文件 13.4 散列文件 13.5 目录 13.6 文本文件与二进制文件 文件是作为一个单元看待的外部相关数据的集合。基于不同的应用、使用多种方法,文件被存储在辅助设备中。 数据的集合经常很大而不能一次全部导入主存中,因此,必须能够在一部分数据留在文件中的情况下读写部分数据。 文件是数据记录的集合,每一个记录都由一个或多个域组成。 存取方法决定了如何检索记录。 13.1 存取方法 13.1.1 顺序存取 如果需要顺序地存取记录(一个接一个从头到尾),则使用顺序文件结构。 13.1.2 随时存取 如果想存取某一特定记录而不用检索其之前的所有记录,则使用随机存取的文件结构。有两种文件结构都允许随机存取:索引文件和散列文件。 13.2 顺序文件 顺序文件是指记录只能按照顺序从头到尾一个接一个地进行存取。最后的记录加EOF(文件末尾)标志。操作系统没有有关记录地址的信息,它只知道记录是一个挨着一个存取的。 顺序文件对随机存取来说效率并不高。 更新顺序文件 1.需要更新的文件夹 新主文件:新的永久数据文件。包含大部分当前数据。 旧主文件:需要更新的永久文件。 事务文件:包含将要对主文件作的改变的文件。 错误报告文件:包含数据更新时所发现的错误清单的文件。 2.文件更新过程(按键排序) 13.3 索引文件 在文件中随机存取记录,需要知道记录的地址。 索引文件由数据文件组成,它是带索引的顺序文件。 索引本身非常小,只占两个安段:键和记录地址。 倒排文件:可以有多个索引的索引文件被称为倒排文件 索引文件中,索引将键映射到地址。散列文件用一个函数来完成映射,不需要索引和伴随它的所有开销。 13.4.1 散列方法 直接法 求模法 数字析取法 13.4.2 冲突 通常散列表中的键的数量要比在数据文件中的记录数量要多。因此,可能有多个键被散列为文件中的同一个地址,这样自然就会产生冲突。 把列表中一些映射为同一地址的键称为同义词;由散列算法产生的地址称为内部地址;包含所有内部地址的区域称为主区。 当两个键在内部地址上冲突时,必须将其中一个键和数据存放一另一个地址单元中来解决冲突。 冲突解决法 开放寻址:当一个冲突发生时,查找主区地址中开放的或空闲的记录来用于存放新数据。 链表解决法:第一条记录存储在起始地址,但它包含了一个指向下一条记录的指针。 桶散列法:散列到能接纳多个记录的节点(桶)。 组合方法 13.5 目录 目录被表示为含有其它文件信息的一种特殊文件类型,用来组织文件。 特殊目录 根目录 主目录 工作目录 父目录 绝对路径和相对路径 13.6 文本文件与二进制文件 存储在存储设备上的文件是一个位的序列,可被应用程序翻译成一个文本文件或是二进制文件。 文本文件:字符文件。 二进制文件:是用计算机的内部格式存储的数据集合。 第14章 数据库 14.1 引言 14.2 数据库管理系统 14.3 数据库体系结构 14.4 数据库模型 14.5 关系数据库模型 14.6 关系的操作 14.7 数据库设计 14.8 其它数据库模型 14.1 引言 数据库技术产生于六十年代末,是数据管理的必威体育精装版技术,是计算机科学的重要分支 数据库技术是信息系统的核心和基础,它的出现极大地促进了计算机应用向各行各业的渗透 数据库的建设规模、数据库信息量的大小和使用频度已成为衡量一个国家信息化程度的重要标志 14.1 引言 数据的存储传统上是使用单独没有关联的文件,有时称为平面文件。现在所有这些平面文件被组合成一个实体—数据库。 数据库是一个组织内被应用程序使用的逻辑相一致的相关数据的集合。 数据库的优点:冗余较少;避免不一致性;效率高;数据完整性;机密性 。 14.2 数据库管理系统 是定义、创建、维护数据库的一种工具。包括:硬件、软件、数据、用户和规程。 数据、数据库、数据库管理系统、数据库系统 14.3 数据库体系结构 美国国家标准协会/标准计划和需求委员会为数据库管理系统建立了三层体系结构:内层、概念层、外层。 内层决定了数据在存储设备中的实际存储位置,直接与硬件交互;概念层定义
文档评论(0)