- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章安腾高性处理机体系结构
第十章安腾高性能处理机体系结构 第十章安腾高性能处理机体系结构 高性能处理机体系结构的演变 安腾体系结构的基本设计思想 安腾指令系统结构 指令级并行机制 双核安腾处理机的组成 10.1高性能处理机体系结构的演变 一、IA体系结构的历史演变 二、英特尔64位处理机的两种体系结构 10.1高性能处理机体系结构的演变 一、IA体系结构的历史演变 IA32体系结构:IA32家族中的第一款32位微处理机流水技术 IA32体系结构仍是基于CISC架构的处理机。 Pentium体系结构:CISC外壳加RISC内核的结构 10.1高性能处理机体系结构的演变 二、英特尔64位处理机的两种体系结构 1、64T(英特尔64):基于显式并行指令计算EPIC(Explicitly Parallel Instruction Computing)技术的IA64体系结构,不与IA32指令系统的兼容性。 2、安腾体系结构:与IA32指令系统的兼容性。 10.2安腾体系结构的基本设计思想 安腾体系结构脱离了IA32 CISC体系结构的束缚,但并没有完全照搬RISC处理机的设计思想。EPIC既不是RISC,也不是CISC,而是一种吸收了CISC和RISC两者长处的全新的体系结构。主要体现在以下几个方面: 显式并行指令计算(EPIC)技术 超长指令字(VLIW)技术 分支推断技术 推测技术 软件流水技术 寄存器堆栈技术 10.2安腾体系结构的基本设计思想 1、显式并行指令计算(EPIC)技术 安腾的指令中设计了属性字段,用于指明哪些指令可以并行执行。这些属性信息并不是在指令执行过程中由处理机判定后获得的,而是由编译程序在编译时通过对源代码的分析获取指令级的并行性信息,并填写到执行代码中。这就是所谓显式并行的概念。 EPIC技术则充分利用现代编译程序强大的对程序执行过程的调度能力,由专用的EPIC编译器首先分析源代码,根据指令之间的依赖关系最大限度地挖掘指令级的并行性,从而确定哪些指令可以并行执行,然后把并行指令放在一起并重新排序,提取并调度其指令级的并行,并将这种并行性通过属性字段“显式”地告知指令执行部件。 10.2安腾体系结构的基本设计思想 2、超长指令字(VLIW)技术 超长指令字(VLIW)技术是提高计算机系统并行性的有效手段。VLIW系统中指令字长可多达几百位,编译器经过优化,能将多条能够并行执行的指令合并成一个具有多个操作码的超长指令字,控制多个独立的功能部件工作。 EPIC是基于超长指令字的设计。 通过将多条指令放入一个超长指令字,能有效提高处理机内各个执行部件的利用率。 10.2安腾体系结构的基本设计思想 3、分支推断技术 技术能将传统的“ifthenelse”分支结构转变为无分支的顺序/并行代码,以避免由于错误预测分支而付出代价。当处理机在运行中遇到分支时,它并不是进行传统的分支预测并选择可能性最大的一个分支执行,而是按分支的所有可能的后续路径开始并行执行多段代码并暂存各段代码的执行结果,直到处理机能够确认分支转移与否的条件是真是假时,处理机再把应该选择的路径上的指令执行结果保留下来。 采用了推断技术后,原有的转移指令被转换成条件执行指令。原有的转移指令的所有的分支都被并行执行,无论哪条分支将被命中,都不会出现流水线断流现象,故消除了因分支预测失误而重新装载流水线导致的低效率现象。更进一步,以前由于程序分支和指令依赖等因素不能并行执行的许多指令现在完全可以并行执行,从而提高了处理机的执行效率。 10.2安腾体系结构的基本设计思想 4、推测技术 推测技术,包括控制推测和数据推测,以减少存储器访问响应时间的影响。 控制推测技术和数据推测技术允许提前执行从内存单元至通用寄存器的取数指令。当程序中有分支时,控制推测技术将位于分支指令之后的取数指令提前若干周期执行,以此消除访存延时,提高指令执行的并行度。而数据推测技术则用于解决提前取数指令后的数据相关性问题。 推测技术避免了cache命中失败而导致访存延迟的损失,消除了因处理机空闲而导致的并行性降低的缺憾。 10.2安腾体系结构的基本设计思想 5、软件流水技术 安腾体系结构提供了很强的硬件支持,使循环执行过程中一次循环的代码执行与下一次循环代码的执行在时间上部分重叠,也即下一个循环步可以在上一个循环步结束前开始执行。 安腾体系结构引入了新机制来支持软件流水,包括自动寄存器重命名、推断执行和特殊的循环终止指令。因此,安腾处理机能够通过旋转寄存器机制为每个循环步提供自己的寄存器,并且不需要把循环扩展开来。 安腾体系结构中硬件对编译器管理软件流水线的支持使得编译器能够生成精简的代码,以高度并行的方式实现循环操作。 10.2安腾体系结构的基本设计思想 6、寄存器堆栈技术 安腾处理
您可能关注的文档
- 第十章 投资组管理概述.ppt
- 第十章 折算风和交易风险(国际财务管理,Joseph F.Greco).ppt
- 第十章 教育学教育科学.ppt
- 第十章 指针§0.1 指针的概念.ppt
- 第十章 收益确和利润分配.ppt
- 第十章 教学设与课堂管理中的心理学原则.ppt
- 第十章 指针 0.1 指针的概念 10.2 变量的指针和指向变量的指.ppt
- 第十章 数据的集、整理与描述10.2 直方图.ppt
- 第十章 数字式感器ppt.ppt
- 第十章 数模、数转换接口.ppt
- 百度作文食品安全课件下载.ppt
- 疫情后的安全第一课课件.ppt
- 网络安全教育培训课件.ppt
- 网络安全教育漫画课件.ppt
- 《阿利的红斗篷》课件.pptx
- 8文本类主题教育活动设计与实施策略(课件)《幼儿园主题教育活动设计与指导》(首都师范大学出版社).pdf
- 1.3果树的植物学分类(课件)-高一《果树生产技术》同步教学(中国农业出版社).pdf
- 7.2相约博物馆-主题教育活动设计与实施(课件)《幼儿园主题教育活动设计与实施》(电子工业出版社).pdf
- 10幼儿园社会热点类主题教育活动设计与实施策略《幼儿园主题教育活动设计与指导》(首都师范大学出版社).pdf
- 3 幼儿讲述活动设计与指导(课件)-《幼儿语言教育活动设计与指导(第二版)》同步教学(劳动出版社).pptx
最近下载
- 《高等数学基础》课件——第四章 导数的应用(含课程思政元素).pptx VIP
- 职域行销BBC模式开拓流程-企业客户营销技巧策略-人寿保险营销实战-培训课件.pptx VIP
- 第三单元第三课《气韵生动》课件 人教版(2024)初中美术八年级上册.pptx VIP
- ek-220说明书中文版.pdf VIP
- 2025年天津市专业技术人员公需考试试题-为中国式现代化提供强大动力和制度保障——党的二十届三中全会暨《中共中央关于进一步全面深化改革、推进中国式现代化的决定》总体解读.docx VIP
- 16949全套程序文件及表单(全套质量手册、程序文件、表单).doc
- DB34_T 5197-2025 水利信息化项目验收规程.docx
- 2026年日历表(A4纸一页打印、可编辑).pdf VIP
- 医美整形顾客管理存量增长运营方式.pptx VIP
- POA课程市公开课一等奖省赛课微课金奖PPT课件.pptx VIP
有哪些信誉好的足球投注网站
文档评论(0)