计算机系统结构(第八讲)
厦门大学计算机科学系陆达
2004年12月13日
第五章标量处理机
超流水线处理机
什么是超流水线处理机?
这种在一个基本时钟周期内能够分时发射多条指令的处理机称为超流水线处理机
超流水线处理机:流水线的级数≥8
超标量处理机:是以增加硬件资源为代价来换取处理机的性能;空间并行性
超流水线处理机:只需增加少量硬件,是通过各部分硬件的充分重叠工作来提高处理机的性能;时间并行性
指令执行时序
在一个时钟周期内能够发射n条指令,每隔1/n个时钟周期发射一条指令
:超流水线处理机的指令执行时空图
(每个时钟周期分时发射2条指令)
功能段可以进一步细分:
“译码(ID)功能段”=“译码”流水级+“取第一个操作数”流水级+“取第二个操作数”流水级
典型处理机结构
CRAY-1、CDC-7600:n=3
SGI公司的MIPS(microprocessor without interlocked piped stages):R2000、R3000、R4000、R5000、R10000
:MIPS R4000超流水线处理机结构
两个Cache:指令Cache、数据Cache
整数部件:通用寄存器堆、ALU、装入对准器/存入驱动器、整数乘法/除法部件
浮点部件:浮点通用寄存器堆、浮点乘法部件、浮点除法部件、浮点加法/转换/求平方根部件、浮点控制器、浮点流水线专用通路
:MIPS R4000处理机的流水线操作
8级流水线、每个时钟周期包含两个流水线
:MIPS R4000正常指令流水线工作时序
一个时钟周期内,流水线执行完成了两条指令
:LOAD指令引起的流水线暂停
暂停一个时钟周期(两个流水线周期)
超流水线处理机性能
在一台指令级并行度为(1,n)的超流水线处理机上,执行N条没有数据相关和控制相关的指令所需要的时间为:
T(1,n)=[k+(N-1)/n]*△t
n:每个时钟周期分时发射的指令的条数
N:需要执行的指令条数
k:指令流水线的功能段数
k*n:指令流水线的级数
加速比:
S(1,n)=T(1,1)/T(1,n)=n*(k+N-1)/(n*k+N-1)
S(1,n)max=n
8计算机系统结构(第八讲) 来自淘豆网www.taodocs.com转载请标明出处.