第4章标量流水线技术.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 标量流水线技术 内容提要: 第4章 标量流水线技术 4.1 概述 4.2 标量流水线工作原理 4.3 指令级流水线 4.1 概述 4.1.1 控制流及其改变 4.1.2 程序执行过程中的重叠操作与先 行控制 4.1.1 控制流及其改变 4.1.2 程序执行过程中的重叠操作与先行控制 4.2 标量流水线工作原理 4.2.1 标量流水线工作原理 4.2.2 标量流水线分类 4.2.3 流水线性能分析 4.2.4 流水线中的主要障碍 4.2.5 流水线的实现与控制 4.2.6 流水线的动态调度 4.2.1 标量流水线工作原理 4.2.2 标量流水线分类 4.2.3流水线性能分析 4.2.4 流水线中的主要障碍 4.2.5流水线的实现与控制 4.2.6 流水线的动态调度 4.3 指令级流水线 4.3.1 指令级流水线 4.3.2 超级标量流水线 4.3.3 超长指令字 4.3.4 展开循环体后调度 4.3.5 软件流水法 4.3.6 超级流水机举例 4.3.1 指令级流水线 4.3.2 超级标量流水线 4.3.3 超长指令字 4.3.4 展开循环体后调度 4.3.5 软件流水法 4.3.6 超级流水机举例 1.基本概念 在理想的流水线中,每一个时钟周期可启动一条指令。执行过程分为4个阶段,理想流水线的示意如图4.32所示。 在超级标量流水线中,人们希望在一个时钟周期内启动多条指令。如图4.33所示同时启动了3条指令,因此并行度为3。 图4.32 理想流水线 图4.33 每拍启动三条指令 图4.34 每1/2拍或每1/3拍启动一条或三条指令 也可以每1/2周期或者每1/3周期启动一条指令, 如图4.34(a)所示每1/2周期启动一条指令,并行度为2。还可以每1/2周期或者1/3周期启动多条指令,如图4.34(b)所示每1/3周期启动了3条指令,其并行度为9。 图4.37 超长指令字(VLIW) 另外,也可以通过超长指令字实现每个时钟周期完成多个操作,如图4.37所示。 2.超级标量机的组成特点 在超级标量流水线计算机中要实现一拍完成多个操作,就必须有相应的功能部件予以支持。如图4.35(a)所示,只有一个ALU,每一拍只能进行一种操作,即启动一条指令。如图4.35(b)提供一个ALU和一个浮点运算器FP,可在一拍中进行两种操作,即启动两条指令。图中I-Cache表示指令高速缓冲存储器,RF表示寄存器堆。 图4.35 超级标量机多执行部件 图4.36 超级标量机典型结构 3.超级标量机的典型结构 图4.36所示是一种超级标量机的典型结构,由存储部件、ALU部件及控制部件组成。 程序执行时同时取出两条指令,分别送相应的译码器。译码后,根据状态记录部件中记录的功能部件与寄存器使用情况,确定哪些指令可以送入执行部件中同时执行;有关寄存器和执行部件的状态可能发生变化,送状态记录部件,供下一次判断使用。 即根据状态记录部件中记录的相关信息来确定多条指令可否同时被调度和执行。 自20世纪80年代末,超级标量机陆续问世,比如Intel公司的i860、IBM公司的RS6000以及Motorola公司的88110等。在一个周期内可启动2~4条指令。但是在实际运行时,一个时钟周期启动的指令条数往往小于IPC(Instruction per cycle)的值。主要特点: ① 配置有多个性能不同的处理部件,采用多条流水线并行处理。 ② 能同时对多条指令进行译码,并根据状态记录部件中记录的状态将可执行指令送入相应的执行部件。 ③ 通过硬件实现多条指令的调度,即用硬件资源重复来实现空间上的并行操作。 1.超长指令字 超长指令字VLIW(Very long instruction word)是在20世纪80年代初由美国耶鲁大学的Fisher教授首先提出来的。它的一条指令很长可达上百位,甚至上千位,主要在于减少访存次数,如图4.37所示在一个周期完成多个操作。 图4.37 超长指令字(VLIW) 特点:单一控制器,每个周期启动一条指令。在其内部,一条超长指令字被分成多个控制字段,独立控制一个功能部件。 2.超长指令字计算机的组成原理 超长指令字计算机的结构示意如图4.38所示,包含两个存储器读/写部件、一个浮点加法部件和一个浮点乘法部件。所有功能部件均由统一的时钟信号驱动,根据超长指令的各个控制字段工作。 图中包括存/取1、存/取2、浮点加、浮点乘及其相关的数据通路

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档