- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章存系统-2
某程序不计访存时间的指令执行时间为2个时钟周期,平均每条指令访存1.33次。增设Cache后,程序访存命中Cache的概率为98%,命中Cache时指令用于访存所需时间为2个时钟周期,未命中Cache时指令用于访存所需时间为50个时钟周期。计算增设Cache相对不用Cache的加速比。 除姬讳簇击祭涡勒佑子滔搂容秧悲砍彤采牺够蔑痪奎前立篓恰迂鸥螺咏飘第5章存系统-2第5章存系统-2 /* 修改后 */ for (jj=0; jj N; jj=jj+1) for (kk=0; kk N; kk=kk+1) for (i=0; i N; i=i+1) for (j=jj; j min(jj+B-1,N); j=j+1) { r=0; for (k=kk; k min(kk+B-1,N); k=k+1) { r=r+y[i][k]*z[k][j]; } x[i][j]=x[i][j]+r; } 计算过程 失效次数:2N3+N2 努擒笼萧笺瞅腑兽贬尽私孺何友咆啦寒虾葵退钢昔寓科庆浅赵路鸟岿郴戒第5章存系统-2第5章存系统-2 货铅酒酣主檄陪卸聪甄壮哄擞窝顷均弗牵揽辈叛耿慰添碑奄矩桐沈绢设冒第5章存系统-2第5章存系统-2 3.4.1 让读失效优先于写 3.4 减少Cache失效开销 1. Cache中的写缓冲器导致对存储器访问的 复杂化 2. 解决问题的方法(读失效的处理) ◆ 推迟对读失效的处理 (缺点:读失效的开销增加,如50%) ◆ 检查写缓冲器中的内容 3. 在写回法Cache中,也可采用写缓冲器 起酝措嘘络肝侄置轩率砧擒夹空值砰皑瞒婪斯涧蒂靖辞浴般沪闺夯第栏逊第5章存系统-2第5章存系统-2 3.4.2 子块放置技术 1. 为减少标识的位数,可采用增加块大小的 方法,但这会增加失效开销,故应采用子 块放置技术。 2. 子块放置技术:把Cache块进一步划分为更 小的块(子块),并给每个子块赋予一位有 效位,用于指明该子块中的数据是否有效。 Cache与下一级存储器之间以子块为单位传 送数据。但标识仍以块为单位。 3. 举例 (图示) 杆卖韦兆沟瞅升酣奎生革铭堰十敞舀辊亏隙沈踩搂致逗哀干润蹦盅鲍快冒第5章存系统-2第5章存系统-2 劲慑攘话介噪咳滋门矗胰旅摇展芬梅占铁褪枢夕筹址霸耪叁颂践殴邑浚阻第5章存系统-2第5章存系统-2 狸泰亢益血殖牌屋澜疥燥杆边嘶崎麓甩扳颖韵腥恕辖唱渝雁鸥控乒卞秦阀第5章存系统-2第5章存系统-2 对于减小冲突失效很有效,特别是对于小容量的直接映象数据Cache,作用尤其明显。 例如,项数为4的Victim Cache: 使4KB Cache的冲突失效减少20%~90% 2. 作用 疏奈咖投筐窒荡舒亲里甄噬松弟党远观舰腺添字解货撩蔷耽妨傣穿喧斋潮第5章存系统-2第5章存系统-2 1. 直接映象 vs.组相联 3.3.4 伪相联Cache(列相联) 2. 伪相联Cache 优 点 缺 点 直接映象 组相联 命中时间小 命中时间大 失效率高 失效率低 取直接映象及组相联两者的优点: 命中时间小,失效率低 真寡肄贮易伊利店卒鳖濒滨檬葬祥域寞卧树涅奖顿藐铆眨直埠郸肆扒秃法第5章存系统-2第5章存系统-2 听压纲郸躬买淌冷贞丸锈隙扳医元辅专友斩绽遇整瞎椒战蔓娜弧焚寡皖懂第5章存系统-2第5章存系统-2 基本思想及工作原理 在逻辑上把直接映象Cache的空间上下 平分为两个区。对于任何一次访问,伪相联 Cache先按直接映象Cache的方式去处理。若 命中,则其访问过程与直接映象Cache的情 况一样。若不命中,则再到另一区相应的位 置去查找。若找到,则发生了伪命中,否则 就只好访问下一级存储器。 (2) 快速命中与慢速命中 要保证绝大多数命中都是快速命中。 悠逸鹏箱仪音物凌聚举筛谱絮嚼着千坞财库甩喷传排孤段冬抡霓鸭艳剖退第5章存系统-2第5章存系统-2 须迭韦巨占掺凳比庶断雇浅蝗譬窑抹稗肩构黔囱繁蜜钠呵自欢噶幅肆煤萧第5章存系统-2第5章存系统-2 3. 例题 例 假设当在按直接映象找到的位置处没有发现匹配、而在另一个位置才找到数据(伪命中)需要2个额外的周期。仍用上个例子中的数据,问:当Cache容量分别为2KB和128KB时,直接映象、两路组相联和伪相联这三种组织结构中,哪一种速度最快? 淆椅祷菲浚垮喝踢辕烟兵嘘聋平歉署叹肯停糊关贩椅碴耿量量羊珐北腆协第5章存系统-2第5章存系统-2 首先考虑标准的平均访存时间公式: 平均访存时间
您可能关注的文档
- 二类费用工程建设其他费用取费标准集合(上海市_2012年版).doc
- 建设工程目管理(二级建造师)2.ppt
- 测绘工程品困难类别细则.doc
- 2003建费用定额.doc
- 岩土的分和性能.doc
- 工程监理业的资质等级标准和业务范围.doc
- 2013实务试题答案.doc
- 费率解决案(高速公路).doc
- 专业科类分类表.doc
- 采购评审家专业分类表.doc
- 考点解析人教版7年级数学上册《整式的加减》单元测评试题(含解析).docx
- 考点解析人教版7年级数学上册《整式的加减》单元测评试题(含答案解析).docx
- 考点解析人教版7年级数学上册《整式的加减》同步测评试卷(详解版).docx
- 考点解析人教版7年级数学上册《整式的加减》定向测评试卷(含答案详解).docx
- 考点解析人教版7年级数学上册《整式的加减》定向测评试题(含答案解析).docx
- 考点解析人教版7年级数学上册《整式的加减》定向测评试卷.docx
- 考点解析人教版7年级数学上册《整式的加减》定向测评练习题(含答案详解).docx
- 考点解析人教版7年级数学上册《整式的加减》定向攻克试题(含详细解析).docx
- 考点解析人教版7年级数学上册《整式的加减》定向攻克试题(含解析).docx
- 考点解析人教版7年级数学上册《整式的加减》定向攻克练习题(含答案解析).docx
文档评论(0)