计算机体系结构chapter03.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 2013-03-20 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 中国科学技术大学 chapter3.* 基本流水线小结 流水线提高的是指令带宽(吞吐率),而不是单条指令的执行速度 相关限制了流水线性能的发挥 结构相关:需要更多的硬件资源 数据相关:需要定向,编译器调度 控制相关:尽早检测条件,计算目标地址,延迟转移,预测 增加流水线的级数会增加相关产生的可能性 异常,浮点运算使得流水线控制更加复杂 编译器可降低数据相关和控制相关的开销 Load 延迟槽 Branch 延迟槽 Branch预测 * 中国科学技术大学 chapter3.* Review 流水线技术并不能提高单个任务的执行效率,它可以提高整个系统的吞吐率 多个任务同时执行,但使用不同的资源 流水线性能分析:吞吐率、加速比、效率 流水线中的瓶颈——最慢的那一段 其潜在的加速比=流水线的级数 流水段所需时间不均衡将降低加速比 流水线存在装入时间和排空时间,使得加速比降低 由于存在相关问题,会导致流水线停顿 结构相关、数据相关和控制相关 * 中国科学技术大学 chapter3.* 流水线的加速比计算 For simple RISC pipeline, CPI = 1: * 中国科学技术大学 chapter3.* review 流水线性能分析 流水线技术应用的难度何在? :相关问题 吞吐率、加速比、效率之间的关系 * 中国科学技术大学 chapter3.* 小结: Pipelining 通过指令重叠减小 CPI 充分利用数据通路 当前指令执行时,启动下一条指令 其性能受限于花费时间最长的段 检测和消除相关 如何有利于流水线技术的应用 所有的指令都等长 只有很少的指令格式 只用Load/Store来进行存储器访问 难度何在? 相关问题 * 中国科学技术大学 chapter3.* Quiz 流水线的成本(cost)可以用c+k*h估算,其中 c为所有功能段本身的总成本,h为段间锁存器成本,k为段数。流水线的性价比可以定义为 PCR = Throughput/(c+k*h), 其中Throughput = 1/t, t为t_{latch}+T/k, t_{latch}为锁存器的延迟时间, T为在非流水线的机器上采用顺序执行方式完成一个任务所花费的总时间。 试推导出使得PCR最大化的最优段数k_opt的表达式。 * 中国科学技术大学 chapter3.* Review- 相关的处理 结构相关 概念:由于争用资源而引起的 解决办法 数据相关 概念:由于存在实际的通信,而引起的 解决办法: 硬件:定向技术(forwarding) 软件: 指令级调度 * 中国科学技术大学 chapter3.* Review (续) 控制相关 概念: 减少性能损失的基本方法-转移地址,条件码 静态处理: 冻结或排空流水线 预测分支成功 预测分支失败 延迟转移 异常 异常的分类 精确中断和非精确中断 * * * * * * * * * * * * * * * * * * * * * 2013-03-15 2013-03-20 * * * * 中国科学技术大学 chapter3.* 精确中断与非精确中断 引起异常的指令前面的指令都已执行完,故障后的指令可以重新从故障点后执行 理想情况,引起故障的指令没有改变机器的状态 要正确的处理这类异常请求,必须保证故障指令不产生副作用 在有些机器上,浮点数异常 流水线段数多,在发现故障前,故障点后的指令就已经写了结果,在这种情况下,必须有办法处理。 当今很多高性能计算机,Alpha 21164,MIPSR10000等支持精确中断,但精确模式要慢10倍,一般用在代码调试时,很多系统要求精确中断模式,如IEEE FP标准处理程序,虚拟存储器等。 精确中断对整数流水线而言,不是太难实现 * 中国科学技术大学 chapter3.* DLX (MIPS)中的异常 IF page fault, misaligned address, memory protection violation ID undefined or illegal opcode EX arithmetic exception MEM page fault, misaligned address, memory protection v

文档评论(0)

peain + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档