计算机组成原理chp3技术总结.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
N = 区内块数,阴影区表示查找范围,根据组号在块表中寻找组,组内相联查找。 直接映象 全相联映象 组相联映象 过程 (1)主存地址分成区号、块号、块内地址 (2)在主存地址中截取与Cache地址对就部分作为Cache地址 (3)以块号为地址访问目录表读出区号与主存地址中区号比较 (4)若相等,命中 (5)若不相等,块失效,停止Cache访问。访主存,并调块 (1)主存地址分成主存块号和块内地址 (2)用主存块号同目录表相联比较 (3)若相同,则取出Cache块号,Cache块号与块内地址拼接成Cache地址,访问Cache (4)若无相同的,则产生缺块、调块 (1)主存地址分区号、组号、块号、块内地址 (2)用组号选出一组 (3)对该组用区号+块号全相联比较 (4)或找不到,则块失效 (5)若找到一样,则将读出的Cache块号与组号和块内地址拼接形成Cache地址。 目录表 长:Cache大小 宽:主存地址位-Cache地址位 长:Cache 大小 宽:(主存块号+Cache块号)位 主存块号位参与比较 长:2ncbCache大小 宽:(区号+2块号)位 (区号+块号)位参与与比较 优点 (1)硬件省,目录表小,成本低 (2)访问Cache与访问区号表同时进行 (1)块冲突最低 (2)Cache空间利用率最高 集中全相联和直接映象的优点弥补他们的缺点 缺点 (1)块冲突概率很大 (2)Cache空间利用率很低 (1)映象表太长 (2)查表速度慢 块冲突仍大于全相联 利用率低于全相联 目录表大于直接方式 * 3.6.3替换策略 LFU(最不经常使用 ):被访问的行计数器增加1,换值小的行,不能反映近期cache的访问情况, LRU(近期最少使用) :被访问的行计数器置0,其他的计数器增加1,换值大的行,符合cache的工作原理 随机替换:随机替换策略实际上是不要什么算法,从特定的行位置中随机地选取一行换出即可。这种策略在硬件上容易实现,且速度也比前两种策略快。缺点是随意换出的数据很可能马上又要使用,从而降低命中率和cache工作效率。但这个不足随着cache容量增大而减小。随机替换策略的功效只是稍逊于前两种策略。 * 3.6.3替换策略 例子:设cache有1、2、3、4共4个块,a、b、c、d等为主存中的块,访问顺序一次如下:a、b、c、d、b、b、c、c、d、d、a ,下次若要再访问e块。 问,采用LFU和LRU算法替换结果是不是相同? ? * ? ? LFU(最不经常使用) LRU(近期最少使用) ? 说明 1块 2块 3块 4块 说明 1块 2块 3块 4块 a a进入 1 0 0 0 a进入 0 1 1 1 b b进入 1 1 0 0 b进入 1 0 2 2 c c进入 1 1 1 0 c进入 2 1 0 3 d d进入 1 1 1 1 d进入 3 2 1 0 b 命中 1 2 1 1 命中 4 0 2 1 b 命中 1 3 1 1 命中 5 0 3 2 c 命中 1 3 2 1 命中 6 1 0 3 c 命中 1 3 3 1 命中 7 2 0 4 d 命中 1 3 3 2 命中 8 3 1 0 d 命中 1 3 3 3 命中 9 4 2 0 a 命中 2 3 3 3 命中 0 5 3 1 e 替换a 1 0 0 0 替换b 1 0 4 2 ? * 3.6.4写操作策略 由于cache的内容只是主存部分内容的拷贝,它应当与主存内容保持一致。而CPU对cache的写入更改了cache的内容。如何与主存内容保持一致,可选用如下三种写操作策略。 写回法:换出时,对行的修改位进行判断,决定是写回还是舍掉。 全写法:写命中时,Cache与内存一起写 写一次法:与写回法一致,但是第一次Cache命中时采用全写法。 * 3.6.5 Pentium PC的Cache 1、主要包括四个部分: 取指/译码单元:顺序从L2cache中取程序指令,将它们译成一系列的微指令,并存入L1指令cache中。 乱序执行逻辑:依据数据相关性和资源可用性,调度微指令的执行,因而微指令可按不同于所取机器指令流的顺序被调度执行。 执行单元:它执行微指令,从L1数据cache中取所需数据,并在寄存器组中暂存运算结果。 存储器子系统:这部分包括L2cache、L3cache和系统总线。当L1、L2cache未命中时,使用系统总线访问主存。系统总线还用于访问I/O资源。 不同于所有先前Pentium模式和大多数处理器所采用的结构,Pentium 4的指令cache位于指令译码逻辑和执行部件之间。其设计理念是:Pentium 4将机器指令译成由微指令组成的简单RISC类指令,而使用简单定长

文档评论(0)

502992 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档