第4章指令级并行祥解.ppt

  1. 1、本文档共118页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章指令级并行祥解.ppt

* * 共需14个周期 源代码 源代码 所需周期 C=A+B LOAD A LOAD B C=A+B STORE C 1 1 1 1 K=I+J LOAD I LOAD J K=I+J STORE K 1 1 1 1 L=M-K LOAD M L=M-K STORE L 1 1 1 Q=C×K Q=C×K STORE Q 2 1 * * 压缩技术—表调度法 只需要6个周期。 超标量结构、超流水线结构一般采用指令窗方法,把一段指令(长度为窗口的大小,例为8)取到窗口中,判断这段指令能否并行执行。 LOAD A LOAD B LOAD I LOAD J C=A+B LOAD M STORE C K=I+J STORE K L=M-K Q=C×K STORE L STORE Q * * 2. 全局压缩法 全局压缩是指进行压缩的代码操作可在基本块之间移动。 全局压缩法可获得更好的压缩效果。 全局压缩的代码操作在基本块间移动需有一定的限制,而且为了保持程序原来的语义,某些代码操作移动后,通常还需要增加一些辅助操作。 全局压缩主要有三种方法: 路径调度(Trace scheduling) 渗透调度(Percolation scheduling) 软件流水(Software pipelining)。 * * VLIW机与超标量机的比较 类型 译码 并行检测完成时间 代码密度 目标可移植性 VLIW 简单 编译 较差 不可移植 超标量 复杂 运行 较好 可移植 * * 4.4.3 超流水线处理机 超流水线处理机 将每个流水段进一步细分,使流水线在一个时钟周期内能够分时流出多条指令。 对于一台每个时钟周期能流出n条指令的超流水线计算机来说,这n条指令不是同时流出的,而是每隔1/n个时钟周期流出一条指令。 实际上该超流水线计算机的流水线周期为1/n个时钟周期。 超流水方法是采用时间重叠的策略开发并行性。 * * 每个时钟周期分时流出两条指令的超流水线计算机的时空图 * * 在分解流水段时要根据实际情况,有些流水段分解的流水级数可多些;如 “译码(ID)”流水段,可以再细分为“译码”流水级、“取第一个操作数”流水级和“取第二个操作数”流水级等;有些流水段分解的流水级数可少些,也的流水段可以不再细分,如“写回结果”流水段一般不再细分。 * * 超流水线技术不用增加硬件,而是采用时间重叠的方法将流水线中各功能段的延迟时间缩短。 利用超流水线技术可提高系统的时钟频率。 但是流水深度加深后,当指令间出现各种相关时所引起的流水线的停顿时间也将增长。 * * MIPS R4000指令流水线结构 * * 各级的功能 IF:取指令的前半步,根据PC值去启动对指令Cache的访问。 IS:取指令的后半步,在这一级完成对指令Cache的访问。 RF:指令译码,访问寄存器组读取操作数,冲突检测,并判断指令Cache是否命中。 EX:指令执行。包括有效地址计算,ALU操作,分支目标地址计算,条件码测试。 * * DF:取数据的前半步,启动对数据Cache的访问。 DS:取数据的后半步,在这一级完成对数据Cache的访问。 TC:标识比较,判断对数据Cache的访问是否命中。 WB:load指令或运算型指令把结果写回寄存器组。 * * MIPS R4000指令流水线时空图 * * 超标量超流水机 将超标量和超流水方法结合起来时,可获得最高的性能增益。 例:将每个时钟周期可启动3条指令、并行度为3的超标量技术和每1/3个时钟周期可启动一条指令、并行度为3的超流水技术结合,可得到每一个机器周期最多可启动9条指令的超标量、超流水处理机。 * * 超标量超流水线处理机的指令执行时空图 IF ID EX WR IF ID EX WR IF ID EX WR I3 I2 I1 时钟周期 1 2 3 4 IF ID EX WR IF ID EX WR IF ID EX WR IF ID EX WR IF ID EX WR IF ID EX WR IF ID EX WR IF ID EX WR IF ID EX WR 0 * * 超标量超流水线处理机在一个时钟周期内要发射指令n次,每次发射指令m条,因此,超标量超流水线处理机每个时钟周期总共要发射指令m×n条。 * * 超标量超流水机的特点 在一个时钟周期中可以启动多条指令并行操作。 因为超标量技术需增加硬件,超流水技术需增加时钟频率。因此要求增高芯片集成度 ,对芯片的要求高。 * * 4.4.4 超级流水线的性能比较 超标量处理机、超流水线处理机和超标量超流水线处理机相对于单流水线普通标量处理机的性能曲线。 * * * * 横坐标是三种处理机的指令级并行度。用m与n的乘积mn表示。 纵坐标表示三种处理机的相对性能,也可

文档评论(0)

love + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档