- 1、本文档共63页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章 向量处理机 6.1 向量处理的基本概念 6.1.1 向量处理概念 6.1.2 向量处理方式 6.1.1 向量处理概念 这里常量2和数组A、B和C中的每一个元素都是标量。这一指令序列称为“标量指令序列”,它的执行过程为“标量处理”过程。一般来说,一条标量指令只能处理一个或一对操作数。????上面的程序循环,在向量计算机中通过向量化编译程序得到下面三条向量指令组成的一个向量指令序列: A(1:N)=B(1:N) + C(1:N)TEMP(1:N)=A(2:N+1)B(1:N)=2 * TEMP(1:N)???? 第一条指令取出数组B和数组C的N个元素,并分别相加,然后将N个和存入数组A。第二条指令将取出数组A的N个元素存入暂存区TEMP的N个单元。第三条指令使暂存区TEMP的N个元素分别乘2,并将N个乘积存入数组B。我们把这N个互相独立的数叫做“向量”,对这样一组数的运算叫做“向量处理”。可以看到,一条向量指令可以处理N个或N对操作数。因此,向量指令的处理效率要比标量指令的处理效率高得多。? 6.1.2 向量处理方式 有三种处理方式: 横向处理方式,又称为水平处理方式,横向加工方式等。向量计算是按行的方式从左至右横向地进行。 纵向处理方式,又称为垂直处理方式,纵向加工方式等。向量计算是按列的方式自上而下纵向地进行。 纵横处理方式,又称为分组处理方式,纵横向加工方式等。横向处理和纵向处理相结合的方式。 要根据向量运算的特点和向量处理机的类型选择向量的处理方式。 以一个简单的C语言编写的程序为例,说明向量的三种处理方式的工作原理。 for (i = 1;i = n;i++) y[i] = a[i] ×( b[i] + c[i] ); 1. 横向处理方式 也称为水平处理方式,横向加工方式等逐个分量进行处理:假设中间结果为T(I)计算第1个分量: T(1) =B(1)+C(1) Y(1) =A(1)×T(1)计算第2个分量: T(2) =B(2)+C(2) Y(2) =A(2)×T(2) ……计算最后一个分量: T(N) =B(N)+C(N) Y(N)=A(N)×T(N) 存在两个问题: 在计算向量的每个分量时,都发生写读数据相关。流水线效率低 如果采用多功能流水线,必须频繁进行流水线切换 横向处理方式对向量处理机不适合 即使在标量处理机中,也经常通过编译器进行指令流调度。 2. 纵向处理方式 也称为垂直处理方式,纵向加工方式等 T(1) = B(1) + C(1) T(2) = B(2) + C(2) …… T(n) = B(n) + C(n) Y(1) = A(1)×T(1) Y(2) = A(2)×T(2) …… Y(N) = A(N) ×T(N) 采用向量指令只需要2条: VADD B, C, T VMUL A, T, Y 这种处理方式适用于向量处理机 数据相关不影响流水线连续工作。 不同的运算操作只需要切换1次。 这种处理方式适用于存储器-存储器结构 3. 纵横处理方式 用于寄存器-寄存器结构的向量处理机中,向量寄存器的长度是有限的。 当向量长度N大于向量寄存器长度n时,需要分组处理。 分组方法:N=K·n+r 其中:r为余数, 共分K+1组。 组内采用纵向处理方式,组间采用横向处理方式。因此,也称为分组处理方式,纵横向 加工方式等。 运算过程为: 第1组: T(1, n) = B(1, n) + C(1, n) Y(1, n) = A(1, n)×T(1, n) 第2组: T(n+1, 2n) = B(n+1, 2n)+C(n+1, 2n) Y(n+1, 2n) = A(n+1, 2n)×T(n+1, 2n) …… 最后第k+1组: T(kn+1, N) = B(kn+1, N) + C(kn+1, N) Y(kn+1, N) = A(kn+1, N) + T(kn+1, N) 每组用两条向量指令, 每组发生相关两次, 其中组内发生数据相关一次, 组间切换时发生相关一次。 主要优点: 减少访问主存储器的次数 例如:中间变量T不写入主存储器 6.2 向量处理机的结构 向量处理机的基本思想是把两个向量的对应分量进行运算,产生一个结果向量。 如:C=A+B 一种采用流水线运算部件实现这个运算的方法如P350图6.1
文档评论(0)