第2课向量处理机.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2课向量处理机

第六章 向量处理机;目录;6.3 SIMD计算机的互连网络;控制信号为111时,实现全交换,也称镜像交换,完成对这8个处理单元(元素)的一组8元交换,其变换图像如下: 入端排列 出端排列 控制信号为001时,完成对这8个处理单元(元素)的4组2元交换,其变换图像如下: 入端排列01234567 出端排列10325476 ;控制信号为010时,完成的功能相当于在进行4组2元交换后再进行2组4元交换,其变换图像如下: 入端排序1 0 3 2 5 4 7 6 出端排列2 3 0 1 6 7 4 5 而控制信号为101时,相当于实现上述两种交换后再进行1组8元交换,其变换图像如下: 入端排序 2 3 0 1 6 7 4 5 端排列序5 4 7 6 1 0 3 2  ;;;;;;;;;;;;;;;;6.3.5 全排列网络 如果互连网络是从N个入端到N个出端的一到一的映射,就可以把它看成是对此N个端的重新排列,因此互连网络的功能实际上就是用新排列来置换N个入端原有的排列。前面所介绍的各种基本多级网络都能实现任意一个入端与任意一个出端间的连接,但要同时实现两对或多对入、出端间的连接时,都有可能发生争用数据传送路径的冲突。前面在多级立方体网络和多级混洗交换网络中已举过这种例子。称有这类性质的互连网络为阻塞式网络 (BLOCKINGNETWORK),称无这类性质的互连网络为非阻塞式网络或全排列网络。非阻塞式网络连接灵活,但连线多、控制复杂、成本高。 ;6.4 共享主存构形的阵列处理机中并行储存器的无冲突访问;;;;;;;6.5 脉动阵列流水处理机(领会);脉动阵列结构具有如下一些特点: (1)结构简单、规整,模块化强,可扩充好,非常适合用超大规模集成电路实现。 (2)PE间数据通信距离短、规则,使数据流和控制流的设计、同步控制等均简单规整。 (3)脉动阵列中所有PE能同时运算,具有极高的计算并行性,可通过流水获得很高的运算效率和吞吐率。输入数据能被多个处理单元重复使用,大大减轻了阵列与外界的I/O通信量,降低了对系统主存和I/O系统频宽的要求。 (4)脉动阵列结构的构形与特定计算任务和算法密切相关,具有某种专用性,限制了应用范围,这对VLSI是不利的。;;第七章 多处理机;目录;7.1 多处理机的概念、问题和硬件结构;;多处理机的主要技术问题 1、硬件上处理好处理机、I/O通道、存储模块的互连问题。 2、软件上最大限度开发系统的并行性,以实现多处理机各级的全面并行。 3、确定任务粒度问题,即如何选择任务和子任务的大小。 4、进程同步问题。 5、任务分配,资源分配,防止死锁问题。 6、当系统中某个处理机发生故障后的恢复问题。 7、多处理机机数增多后,如何能给编程者提供良好的编程环境问题。 ;;;(2)松耦合多处理机 松耦合多处理机中,每台处理机都有一个容量较大的局部存储器,用于存储经常用的指令和数据,以减少紧耦合系统中存在的访主存冲突。 消息传送系统常采用分时总线或环形、星形、树形等拓扑结构。松耦合多处理机较适合做粗粒度的并行计算。 互连网络:实现结点(非PE与PSM)间互连。 控制—分布式控制(消息传递机制)。 结点结构:是完整的处理机系统; 当结点为多处理机系统时,构成了层次系统。 ;;;;;;;(5)蠕虫穿洞寻径网络 (6)开关枢纽结构形式 参照多端口存储器的思想,把互连结构的开关设置在各处理机或接口内部,组成分布式结构,则称为开关枢纽结构形式。 每一台处理机通过它的开关枢纽与其他多台处理机连接组成各种有分布结构的多处理机。开关枢纽的选择,应使组成的多处理机有较佳的拓扑结构和良好的互连特性,特别是要适应处理机机数很多的情况。 理想的拓扑结构应该是:所用开关枢纽数量少,每个开关枢纽的端口数不多,能以较短的路径把数量很多的处理机连接起来,实现快速而灵活的通讯;不改变模块本身的结构,就可使系统规模得到任意扩充。 ;;7.2 紧耦合多处理机多CACHE的一致性问题(领会);;;7.3多处理机的并行性和性能(综合应用);;;;;;;;1.数据相关 如果PI的左部变量在PJ的右部变量集内,且PJ必须取出PI运算的结果来作为操作数,就称PJ“数据相关”于PI。 PI A=B+D PJ C=A*E 相当于流水中发生的“先写后读”相关。顺序串行运行的正确结果应当是: PI A新= B原+ D原 PJ C新= A新* E原=(B原+ D原)* E原 ;2.数据反相关 如果PJ的左部变量在PI的右部变量集内,且当PI未取用其变量的值之前,是不

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档