数据结构-_外部排序.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据结构-_外部排序

1、外存信息的存取 1、外存信息的存取 2、外部排序的方法 3、多路平衡归并的实现 3、多路平衡归并的实现 3、多路平衡归并的实现 3、多路平衡归并的实现 3、多路平衡归并的实现 3、多路平衡归并的实现 4、置换-选择排序 4、置换-选择排序 4、置换-选择排序 5、最佳归并树 5、最佳归并树 * * 物料管理 EXST * * * Algorithms and DataStructures:EXSORT 1、外部排序: 内部排序:信息一次可全部调入内存,信息在内存中的处理时间是主要的时间耗费。 外部排序:信息量巨大,无法一次调入内存。只能驻留在带、盘。特点为内存运行时 间短,内、外存进行交换需要时间长。减少 I/O 时间成为主要矛盾。 记录(Record):数据项的集合存于内存,称之为结点。如果存之于外存,则叫做记 录。原因起源于是在历史上研究管理应用和计算机科学的两部分人 员的习惯。 域(场):记录中的每个数据项,称之为域(Field) 。 文件:记录的集合。 关键字:唯一标识记录的域,称之为关键字。 有序文件:文件根据关键字的大小。排成递增或递减的序列。 2、基本术语: 3、常用外存: 磁带:由磁带介质、读、写磁头、驱动器、接收盘和原始盘组成。 便宜、可反复使用、是一种顺序存取设备。 查找费时、速度幔。 3、常用外存: 带文件的组织的改进: 块 1 块 3 块 2 IBG(Inter Block Gap)块间间隙 B.F(块因子) = 一个物理记录包含逻辑记录的个数 带的利用率上升,如上例: 盘文件的位置:盘组号、柱面号、磁道号、块(扇区号) 盘文件的读写时间:T i/o = tseck + tla + n×twm tseck :找道时间 tla :等待时间 twm :传输时间/ 字符,n 字符数。 1、步骤: 生成合并段(run):读入文件的部分记录到内存 - 在内存中进行内部排序 - 将排好序的这些记录写入外存,形成合并段 - 再读入该文件 的下面的记录,往复进行,直至文件中的记录全部形成合并段 为止。 外部合并:将上一阶段生成的合并段调入内存,进行合并,直至最后形成一个有序的文 件。 平衡合并分类法:被合并的初始合并段均匀分布在 K 条磁带上,即分布在 T1、T2、 …… Tk 上。对这 K 条带进行合并,将生成的中间归并段分布在 TK+1、 TK+2 、…… T2K 上。然后,循环往复,直至最后形成一个 单一的合并段为止。 7、15、19 8、11、13 16、23、31 5、12 归并趟数: logkm where k 是路数;m 是初始合并段数。 如:m=6,那么 log26 = 3 而 log36 = 2 此外,还有一次生成所有合并段的时间。对 文件中的所有的记录全部读写一次。 每一趟归并时,对文件中的所有的记录都要全部读写一次。K 大,趟数减 少,读写记录的总数将减少。但 K 大,需要的内存将越多。 1、带、盘的平衡多路归并的性质: logkm 趟 e.g: K 2 时, 趟数将会减少。m 个归并串。总共 n 个记录。 合并段 1 合并段 k 合并段 m-1 合并段 m 中间合并段 中间合并段 有序文件 层数: logkm +1 归并趟数: logkm 设从 k 个元素中挑选一个最小的元素需 ( k-1) 次比较。 每次比较耗费的时间代价为: tmg,那么在进行 k 路平衡归并时,总的比较时间耗费不会超过: logkm × ( k - 1 ) × ( n - 1 ) × tmg = log2m / log2k × ( k - 1 ) × ( n - 1 ) × tmg k log2m / log2k × ( k - 1 ) 大

文档评论(0)

153****9595 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档