淘豆网
下载此文档放大查看缩小查看   1/52
0/100
您的浏览器不支持进度条
更多>>该用户其他文档
下载所得到的文件列表
计算机系统结构习题课2012-万继光.ppt
文档介绍:
习题内容7.9,7.10,7.11,7.12,7.146.7,6.85.8,5.9,5.113.8,3.10,3.112.14(补充)1.7,1.10,1.118.11,8.12(补充)9.9,9.1310.6,10.9第一章CPU时间=IC×CPI×时钟周期时间=(CPIi×ICi)×时钟周期时间CPI===i=1n时钟周期数IC(CPIi×ICi)i=1nIC(CPIi×)i=1nICiICAmdahl定律:对于一台400MHz计算机执行标准测试程序,程序中指令类型,执行数量和平均时钟周期数如下:求该计算机的有效CPI、MIPS和程序执行时间。指令类型指令执行数量平均时钟周期数整数450001数据传送750002浮点80004分支15002解:程序执行时间=()/400=575ns程序执行时间=(CPI×IC)/频率f习题1.7习题1.10计算机系统有三个部件可以改进,这三个部件的加速比如下:部件加速比1=30;部件加速比2=20;部件加速比3=10;(1)如果部件1和部件2的可改进比例为30%,那么当部件3的可改进比例为多少时,系统的加速比才可以达到10?(2)如果三个部件的可改进比例为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?习题1.10习题1.11假设浮点数指令FP指令的比例为30%,其中浮点数平方根FPSQR占全部指令的比例为4%,FP操作的CPI为5,FPSQR操作的CPI为20,其他指令的平均CPI为1.25。现有两种改进方案,第一种:把FPSQR操作的CPI减至3第二种:把所有的FP操作的CPI减至3试比较两种方案对系统性能的提高程度。解法1:利用原始CPI的唯一性,先使用已知条件求出原始CPI,再求出除去FPSQR指令外其他指令的平均CPI,最后比较改进后的CPI大小。原始CPI=5×30%+1.25×(1-30%)=2.375设除FPSQR外其余指令的平均CPI为X 则2.375=20×4%+(1-4%)X,解出X=1.640625方案1: CPI1=3×4%+1.640625×(1-4%)=1.695方案2: CPI2=3×30%+1.25×(1-30%)=1.775结论: 方案1导致的新CPI更小,性能更好习题1.11解法2:用Amdahl公式求。记指令总条数=M,时钟周期长度=CYCLE。原始总时间Told=0.3M×5×CYCLE+0.7M×1.25×CYCLE=M×2.375×CYCLETFP=0.3M×5×CYCLE=M×1.5×CYCLE,所占比例为1.5/2.375≈63%TFPSQR=0.04M×20×CYCLE=M×0.8×CYCLE,所占比例为0.8/2.375≈34%方案1:Se=20/3,Fe≈34%,Sn1=1/[(1-Fe)+Fe/Se]≈1.4方案2:Se=5/3,Fe≈63%,Sn2=1/[(1-Fe)+Fe/Se]≈1.3结论: 方案1导致加速比更大,性能更好习题2.14(补充)MIPS指令集。人工模拟以下MIPS程序的单条指令运行方式,在表中用16进制编码记录每一步产生的结果(不得借助模拟软件)。 .datan: .word3 ;n和x是偏移地址x: .double0.5 .text LDR1,n(R0) ;R1装入双字3(64位) L.DF0,x(R0) ;F0装入双精度浮点数0.5(64位) DADDIR2,R0,1 ;R2←1 MTC1R2,F11 ;把通用寄存器R2中的低32位传送到浮点寄存器F11的低32位 CVT.D.LF2,F11 ;把F11中的数据转换成双精度浮点数,送给F2。loop:MUL.DF2,F2,F0 ;F2←F2*F0 DADDIR1,R1,-1 ;decrementR1by1 BNEZR1,loop ;ifR1≠0continue HALT ;此条不填表 :MIPS浮点数的格式是IEEE754习题2.14IEEE754为便于软件的移植,浮点数的表示格式应该有统一标准(定义)。1985年IEEE提出了IEEE754标准。该标准规定基数为2,阶码E用移码表示,尾数M用原码表示,根据原码的规格化方法,最高数字位总是1,该标准将这个1缺省存储,使得尾数表示范围比实际存储的多一位。习题2.14双精度浮点数类型数符阶码尾数总位数指数偏移短实数1位8位23位32位127长实数1位11位52位64位10230.5的二进制表示:0.1=1.0*(10)^-1 尾数:(1).000…0 阶码:-1+1023=0x3fe 0x3fe00000000000001的二进制表示:1.0=1.0*(10)^0 尾数(1).000…0 阶码:0+1023=0x3ff 0x3ff000000000000 内容来自淘豆网www.taodocs.com转载请标明出处.