下载此文档

计算机系统结构习题课2012-万继光.ppt

文档分类：IT计算机 | 页数：约52页举报非法文档有奖

1/52

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/52 下载此文档

文档列表 文档介绍

,,,,,,,,,(补充),,,(补充),,=IC×CPI×时钟周期时间=(CPIi×ICi)×时钟周期时间CPI===i=1n时钟周期数IC(CPIi×ICi)i=1nIC(CPIi×)i=1nICiICAmdahl定律:对于一台400MHz计算机执行标准测试程序,程序中指令类型,执行数量和平均时钟周期数如下:求该计算机的有效CPI、MIPS和程序执行时间。指令类型指令执行数量平均时钟周期数整数450001数据传送750002浮点80004分支15002解:程序执行时间=()/400=575ns程序执行时间=(CPI×IC)/,这三个部件的加速比如下:部件加速比1=30;部件加速比2=20;部件加速比3=10;(1)如果部件1和部件2的可改进比例为30%,那么当部件3的可改进比例为多少时,系统的加速比才可以达到10?(2)如果三个部件的可改进比例为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?%,其中浮点数平方根FPSQR占全部指令的比例为4%,FP操作的CPI为5,FPSQR操作的CPI为20,。现有两种改进方案,第一种:把FPSQR操作的CPI减至3第二种:把所有的FP操作的CPI减至3试比较两种方案对系统性能的提高程度。解法1:利用原始CPI的唯一性,先使用已知条件求出原始CPI,再求出除去FPSQR指令外其他指令的平均CPI,最后比较改进后的CPI大小。原始CPI=5×30%+×(1-30%)= =20×4%+(1-4%)X,解出X=: CPI1=3×4%+×(1-4%)=: CPI2=3×30%+×(1-30%)=: 方案1导致的新CPI更小,:用Amdahl公式求。记指令总条数=M,时钟周期长度=CYCLE。原始总时间Told=×5×CYCLE+××CYCLE=M××CYCLETFP=×5×CYCLE=M××CYCLE,≈63%TFPSQR=×20×CYCLE=M××CYCLE,≈34%方案1:Se=20/3,Fe≈34%,Sn1=1/[(1-Fe)+Fe/Se]≈:Se=5/3,Fe≈63%,Sn2=1/[(1-Fe)+Fe/Se]≈: 方案1导致加速比更大,(补充)MIPS指令集。人工模拟以下MIPS程序的单条指令运行方式,在表中用16进制编码记录每一步产生的结果(不得借助模拟软件)。 .datan: .word3 ;n和x是偏移地址x: . .text LDR1,n(R0) ;R1装入双字3(64位) ,x(R0) ;(64位) DADDIR2,R0,1 ;R2←1 MTC1R2,F11 ;把通用寄存器R2中的低32位传送到浮点寄存器F11的低32位 ,F11 ;把F11中的数据转换成双精度浮点数,送给F2。loop:,F2,F0 ;F2←F2*F0 DADDIR1,R1,-1 ;decrementR1by1 BNEZR1,loop ;ifR1≠0continue HALT ;此条不填表 :,浮点数的表示格式应该有统一标准(定义)。1985年IEEE提出了IEEE754标准。该标准规定基数为2,阶码E用移码表示,尾数M用原码表示,根据原码的规格化方法,最高数字位总是1,该标准将这个1缺省存储,使得尾数表示范围比实际存储的多一位。:=*(10)^-1尾数:(1).000…0阶码:-1+1023=0x3fe0x3fe00000000000001的二进制表示:=*(10)^0尾数(1).000…0阶码:0+1023=0x3ff0x3ff000000000000

计算机系统结构习题课2012-万继光来自淘豆网www.taodocs.com转载请标明出处.