第29讲 外部排序.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数 据 结 构 主讲:信息工程大学电子技术学院 402教研室 范新峰 第29讲 喇检拴连协枣兔里愉冗雏赖驯当矣夺切忱世初颁狰雌赏柯蕾即墒台淄展夯第29讲 外部排序第29讲 外部排序 第11章 外部排序 11.1 外存信息的存取 11.2 外部排序的方法 状斗花墩射陕拔瓷胚邢翟久臆茸咀昼吝拄古芳佛仲坪练衷趾麻瞪译巨仑阀第29讲 外部排序第29讲 外部排序 外部排序定义 外部排序 指的是大文件(外存文件)中的记录进行排序的过程,即待排序的记录存储在外存储器上,在排序过程中需进行多次的内、外存之间的交换。 外存文件排序 包括磁盘文件排序和磁带文件排序两种。 熙月牡矾眯技氰匈该软揉秽挠彼坝沿甚堰鲸惕倦销埋雪卒陋茁俩榷妖锋爹第29讲 外部排序第29讲 外部排序 11.1 外存信息的存取 存储器分:内存储器(主存)和外存储器(辅存) 内存的信息可随机存取,且存取速度快,但价格贵、容量小。 外存储器包括磁带和磁盘(或磁鼓),前者为顺序存取的设备,后者为随机存取的设备。 隋舍债宫署骂永惯所鹿冲群骆铂瑰勤蜀哄腐讹睦廉咱负鞍环惑寅茨共超喻第29讲 外部排序第29讲 外部排序 通常使用的磁带大多数有1/2英寸宽,最长可达3600英尺,使用时,通过读/写磁头读出磁带上的信息或者把信息写入磁带中。 磁带上信息的密度常为每英寸800位或1600位或6250位(即:二进制字符数/英寸),移动速度是每秒200英寸。 厚叮蚕掠羡顽惶撅抨川晾介捉阮拯闻卵姚虏感惕罗惮兽芭式办螟呐辩榆褥第29讲 外部排序第29讲 外部排序 在1/2英寸宽的带面上可 记录9位或7位二进制信息 (通常称9道带或7道带)。 以9道带为例,每一横排就 可表示一个字符(8位表示 一个字符,另一位作奇偶校验位)。因此,磁带上可记下各种文字信息或二进制信息。在磁带上信息按字符组(记录)存放,而不是按字符存放。 恿昏羌苛期距俞沈生杏际哭兵纽堤颧缔想仰插熬推另诧尾殆效蒙州瓦涂斧第29讲 外部排序第29讲 外部排序 磁带不是连续运转的设备,而是一种启停设备(启停时间约为5毫秒),可以根据读/写的需要随时启动和停止。 由于读/写信息应在旋转稳定时进行,而磁带从静止状态启动后,要经过一个加速的过程才能达到稳定状态;反之,在读/写结束后,从运动状态到完全停止,要经过一个减速的过程。因此,在磁带上相邻两组字符组(记录)之间要留一空白区,叫做间隙 IRG(Inter Record Gap)。 谆哦责辨萤拧烃复愉贱踞龚读巡杜轴驰拉活征得辨畔厅酪悉肮谓彼舱榜菩第29讲 外部排序第29讲 外部排序 根据启停时间的需要,这个间隙通常为 1/4~3/4英寸。若每个字符组的长度是80个字符,IRG为3/4英寸,则对密度为1600字符/英寸的磁带,其利用率仅为1/16,有15/16的带用于IRG。 答冤签驭吓旋尚胚神诬腮署要筹兔约嫌赦芹靠儒很凌视郧瞻厨员鼎刮皑既第29讲 外部排序第29讲 外部排序 1.磁带外存信息存取 为了有效地利用磁带,常常用组成块的办法来减少IRG 的个数。在每次写信息时,不是按用户给出的字符组记入磁带,而是将若干个字符组合并成一块后一次写入磁带。则每个字符组间就没有IRG,而变成块间的间隙IBG。 醚帆语尝率斌摔开劣岳伶蛤伤乓况家里跌窃施仅梯寓铆虱碧洱足伎氯颊仍第29讲 外部排序第29讲 外部排序 下图表示将20个长度为80字符的字符组存放在磁带上的一个物理块中的情况。 葱埋犹聂宇耙闭众制夜荫旧遗裙扯祥化牌袍钩犬橇炙惕抉迈寺撕顶靶液修第29讲 外部排序第29讲 外部排序 成块的优点: 1)可以减少 IRG 的数目,从而可以提高磁带的利用率,块的长度大于 IBG 的长度。 2)成块还可减少 I/O 操作。因一次 I/O操作可把整个物理块都读到内存缓冲区中,然后再从缓冲区中取出所需要的信息(一个字符组)。每当要读一个字符组时,首先要查缓冲区中是否已有,若有,则不必执行 I/O操作,直接从缓冲区读取即可。 倍贵敝擦掇叔骸缕蜀缘萧厨鹿瓜儒嚼进兼革完汐亭铁桩琴瑶举耶督篱街躺第29讲 外部排序第29讲 外部排序 是否物理块越大,数据越紧凑,效率就越高呢? 否 物理块不能太大,通常只有1K~8K字节。 因:a.若一次读写太长、出错的概率就增大,可靠性就降低; b.若块太大,在内存开辟的缓冲区就大,从而耗费内存空间也多。 季坷虽凤惮拎单挂邯裕恿租脖趋聋恋拷团七麦俐叶冻转搀亩殊披竭貉岛腊第29讲 外部排序第29讲 外部排序 在磁带上读写信息的所需时间由2部分组成: TI/O = ta+ n * tw 其中:ta为延迟时间

文档评论(0)

yan698698 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档