计算机组成与结构课后习题

一、 选择

选择第1题
Cray-1机启动存储器、流水部件以及寄存器打入各需要1拍,加法需要6拍、乘法需要7拍、访存需要6拍。现有向量指令串:  V3←存储器  V4←V0+V1  V2←V4*3 向量长度为N,则指令串最短执行时间为

A N+19

B N+18

C N+17

D N+16

、 填空题


Cray-1机的链接技术,表现为只要不发生和源Vi冲突,向量指令之间即使有数据相关,也能大部分时间并行

三、 问答题


1、向量流水处理 分段开采 链接技术 向量和标量的平衡点 向量循环 向量递归 向量流水线流过时间 半性能向量长度 最大性能




2、向量流水处理的主要特点是什么,它与标量流水相比有何不同之处?




3、向量流水机的工作方式可分为哪两大类?它们的主要特点是什么




4、在CRAY-1机上,V为向量寄存器,设向量长度为32,s为标量寄存器,所有浮点功能执行部件的执行时间分别为:加法需6拍,相乘需7拍,从存储器读数需6拍,求倒数近似值需14拍,打入寄存器和启动功能部件(包括存储器)各需1拍,问下列指令中哪些指令可以链接?哪些指令可以并行执行?试说明其原因并分别计算出各指令组全部完成所需要的拍数。
(1) V2←V0*V1
  V3←存储器
  V4←V2+V3
(2) V0←存储器
  V3←V1+V2
  V4←V0*V3
  V6←V4+V5
(3) V0←存储器
  V2←V0+V1
  V3←V2*V1
  V5←V3+V4




5、假设一台向量处理机中功能部件的启动开销为:取数和存数部件为12个时钟周期、乘法部件为7个时钟周期,加法部件为6个时钟周期。请计算出上例中每个编队的开始时间、获得第一个结果元素的时间和获得最后一个结果元素的时间。




6、设有如下所示的4段流水线加法器,输入线为X和Y,输出线为Z。在它的输出部分还有一个寄存器R,用来存放暂时结果并可将此结果在下一时间点反馈到S1,输入X和Y与输出R和Z一起多路复用。

(a) 假设向量A以每个周期1个元素的速率经输入X馈入流水线,试问计算向量A的N个元素之和: 的最小时钟周期数是多少?在缺少一个操作数时,按照缺省规定即将一个0值输入给流水线。忽略流水线的建立时间。
(b) 令流水线的加法器的时钟周期为 。设有一个流过延迟为 的等效非流水线加法器。当使用上面的流水线加法器且 时,求实际的加速比 和效率
(c) 当N趋于无穷大时,求出最大加速比 和效率
(d) 如要求加速比达到最大值的一半,试求出最小向量长度 。




7、一台向量计算机一次只能以下述两种方式中的一种运动:一种是向量方式,执行速度Rv为10Mflops;另一种是标量方式,执行速度Rs为1Mflops。设a是该计算机的典型程序代码中可向量化部分的百分比
(a) 推导出该计算机平均执行速度Ra的公式。
(b) 画出以a 为横坐标,Ra为纵坐标的曲线,a的范围为(0,1)。
(c) 要使Ra达到7.5Mflops,问向量化百分比a应多大?
(d) 假设Rs=1Mflops,a=0.7,要使Ra达到2Mflops,问Rv应为多大?




8、试计算下列两种向量超级计算机的峰值性能(Gflops表示)。
(a) 16台向量处理机的Cary Y-MP C-90。
(b) 4台向量处理机的NEC SX-X
(c) 解释这两种机器为什么能提供最大64路并行度的向量操作。