中国科学技术大学
1
计算机体系结构
周学海
******@ustc.
0551-63601556, 63492149
中国科学技术大学
第三章流水线技术
DLX(MIPS)基本流水线
流水线的相关
异常处理
DLX (MIPS)中多周期操作的处理
MIPS R4000流水线
中国科学技术大学
中国科学技术大学
Review:性能评测
平均CPI?
每类指令的使用频度
Type CPIi for type Frequency CPIi x freqIi
Arith/Logic 4 40%
Load 5 30%
Store 4 10%
branch 3 20%
Average CPI:
中国科学技术大学
是否可以使 CPI < ?
Ideal
Memory
WrAdr
Din
RAdr
32
32
32
Dout
MemWr
32
ALU
32
32
ALUOp
ALU
Control
32
IRWr
Instruction Reg
32
Reg File
Ra
Rw
busW
Rb
5
5
32
busA
32
busB
RegWr
Rs
Rt
Mux
0
1
Rt
Rd
PCWr
ALUSelA
Mux
0
1
RegDst
Mux
0
1
32
PC
MemtoReg
Extend
ExtOp
Mux
0
1
32
0
1
2
3
4
16
Imm
32
<< 2
ALUSelB
Mux
1
0
32
Zero
Zero
PCWrCond
PCSrc
32
IorD
Mem Data Reg
ALU Out
B
A
在一条指令执行过程中下图有许多空闲部件
可以让指令重叠执行??
中国科学技术大学
洗衣为例
Ann, Brian, Cathy, Dave 每人进行洗衣的动作: wash, dry, and fold
washer需要 30 minutes
Dryer 需要 40 minutes
“Folder”需要 20 minutes
A
B
C
D
流水线的基本概念
中国科学技术大学
Sequential Laundry
顺序完成这些任务需要 6 小时
如果采用流水作业, 需要多长时间?
A
B
C
D
30
40
20
30
40
20
30
40
20
30
40
20
6 PM
7
8
9
10
11
Midnight
T
a
s
k
O
r
d
e
r
Time
中国科学技术大学
流水线作业: 尽可能让任务重叠进行
流水作业完成四人的洗衣任务只需要 hours
A
B
C
D
6 PM
7
8
9
10
11
Midnight
T
a
s
k
O
r
d
e
r
Time
30
40
40
40
40
20
中国科学技术大学
流水线技术要点
流水线技术并不能提高单个任务的执行效率,它可以提高整个系统的吞吐率
流水线中的瓶颈——最慢的那一段
多个任务同时执行,但使用不同的资源
其潜在的加速比=流水线的级数
流水段所需时间不均衡将降低加速比
流水线存在装入时间和排空时间,使得加速比降低
由于存在相关问题,会导致流水线停顿
中国科学技术大学
指令流水线:CPU执行大量的指令,指令吞吐率非常重要
DLX 的指令格式
DLX (MIPS)的基本流水线
Op
0
5
31
16
15
11
10
6
rs
rt
immediate
Op
0
5
31
Op
0
5
31
16
15
11
10
6
rs
rt
offset added to PC
rd
Register-Register (R-type) ADD R1, R2, R3
26
25
21
20
Register-Immediate (I-type) SUB R1, R2, #3
Jump / Call (J-type) JUMP end
func
(jump, jump and link, trap and return from excep
流水线技术-中国科学技术大学 来自淘豆网www.taodocs.com转载请标明出处.