下载此文档

重叠流水和向量流水处理机.ppt


文档分类:IT计算机 | 页数:约119页 举报非法文档有奖
1/119
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/119 下载此文档
文档列表 文档介绍
第 5 章 重叠、流水和向量流水处理机
重叠方式
流水方式
向量的流水处理与向量流水处理机
指令级高度并行的超级处理机
1
本章要点
“一次重叠”方式中各种相关的处理;
流水线的时空图和性能分析;
流水的局部性相关处理,全局性相关处理
单功能非线性流水线的调度;
向量处理方法
增强向量处理性能的方法
采用链接技术,从访存开始到一个一个结果分
量输出所需的拍数。
2
重叠方式
重叠原理和一次重叠
图 对一条机器指令的解释
取指令
分析
执行
。。。
t
一、顺序解释(sequence):一条指令执行完再取下一条指令。
若各阶段执行时间相等,则共需3 n t
优点:控制简单,节省设备;
缺点:速度慢,机器各部件的利用率很低。
取k
分析k
执行k
取k+1
分析k+1
执行k+1
指令的解释方式一般分为顺序、重叠、流水三种。
设指令工作方式分成取指令、分析、执行指令阶段
3
执行n条指令需:T=(1+2n)t;
优点:指令执行时间缩短了近1/2;功能部件的利用率也有
所提高;
缺点:需要增加一些部件,控制也要复杂些;
取k
分析k
执行k
分析k+1
取k+1
执行k+1
取k+2
分析k+2
执行k+2
二、重叠(Overlap):在两条相近指令的解释过程中,某
些不同解释阶段在时间上存在重叠部分。

取k
分析k
执行k
分析k+1
取k+1
执行k+1
取k+2
分析k+2
执行k+2

4
执行n条指令需要:T=(2+n)t
指令的执行时间缩短了近2/3,是一种比较理想的指令执行方式;
这种执行方式存在着访存冲突,要解决访主存的冲突问题,通常采用以下几种方式:
(1)主存分成两个独立编址的存储器,一个专门存放指令,一个专门存放操作数;
(2)指令和数据仍然混存在一个存储器中,采用多体交叉主存结构,不能根本解决;
(3)采用先行控制技术,增设采用先进先出方式工作的指令缓冲寄存器。
5
3 一次重叠:把取指令操作隐含在分析、执行指令过程中,则
在任何时候只允许上条指令“执行”与下条指令“分析”相重叠。
分析k
执行k
执行k+1
分析k+1
连续执行n条指令所需时间为:T=(1+n)t;
实际达到这个速度是很难得,存在几个问题:
(1)各种类型的指令“分析”与“执行”所需时间差别很大;
从而导致相互等待。
(2)当出现转移指令或转移子程序指令时,程序的执行过
程就不是顺序的了,那么指缓中的内容以及已经分析完的
下一条指令都将作废;
(3)数据相关以及控制相关;
6
三、先行控制
使分析和执行部件分别连续不断地运行,使部件空闲状态减至最低。
(a)重叠方式
分析k+1
分析k
执行k
执行k+1
分析k+2
执行k+2
分析部件空闲
执行部件空闲
分析k+1
分析k
执行k
分析k+2
(b)先行控制
执行k+1
执行k+2

7
结果:解决了分析与执行时间不等长问题。
与重叠区别:分析和执行部件可同时处理两条不相邻指令。

增设指令缓冲栈,消除取指过程;
增设数据缓冲栈,保证不同指令的读、写操作并行;
增设先行操作栈,保证执行部件能连续执行。
8
硬件结构:
主 存
存 控
指令分析器
指令缓冲栈
读数据缓冲区
执行
部件
先行操作栈
数据缓冲栈
写数据缓冲区
9
相关处理
1. 转移指令的处理
采用延迟转移技术,将转移指令与条件转移无关的第k-1条指
令交换一下位置,即使转移成功也不会使重叠效率下降。
2. 指令相关的处理
“执行”指令是IBM 370机器为此设置的一条指令,其形式为
执行
R1
X2
B2
D2
当执行到“执行”指令时,按第二操作数(X2)+(B2)+D2地址取出操作数区中单元的内容作为指令来执行,。
10

重叠流水和向量流水处理机 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数119
  • 收藏数0 收藏
  • 顶次数0
  • 上传人sxlw2014
  • 文件大小1.60 MB
  • 时间2021-07-29