腰斩-
华科大
200
×年计算机系统结构博士生入学考题
一、判断题
(
选择一个最佳的答案
,
每题
3
分
,
共18分
)
红色标注答案供参考
1.
测量计算机对事务处理的性能,所用的测试基准 程序(
Benchmark
)应该是:
(a)
Whetstone;
(b) SPECint;
(c)TPC-C;
(d) SPECfp
2.
从汇编语言程序员的角度看
,
下列哪个是不透明的
:
(a)cache;
(b)
数据通路的宽度
;(c)
虚拟存储器
;(d)
流水线
3.
某个应用程序 运行所需要的最少存储空间为
320
页,每页
32KBytes
。某计算机实
际物理内存为
256MBytes,
但
250Mbytes
的内存 已被其它程序占用,硬盘的容量为
40GBytes,
操作系统为该程序分配的虚拟内存地址空间应该是:
(a) 6MBytes;
(b) 10MBytes;
(c) 256MBytes; (d)40GBytes
4.
某个由多处理器构成的服务器中
,
每个处理器都有自己的存储器
,
但所有存储器
都统一编址
,
这种结构属于
:
(a)
UMA
(b)NUMA
(c)SMP
(d)CLUSTER
5.
某计算机采用了超标量流水线技术
,
其指令级并行度为
8
(即平均每个时钟周期
完成
8
条指令的执行)
,
若已知该机采用了两条流水线
,
其机器超流水线周期为
:
(a) 2
个时钟周期
;
(b) 1
个时钟周期
;
(c) 1/2
个时钟周期
;
(d) 1/4
个时钟周期
;
6.
一台由8
个磁盘构成的磁盘阵列,其冗余校验信息在某个磁盘中,所属的
RAID
级别是 :
(a) RAID0
;
(b) RAID1;
(c)RAID3;
(d) RAID5.
二、问答题:
(10
分
)
1
.
RISC
机和
CISC
机相比,
提高性能的基本原理是什么
?
在指令条数(
增加
)
,CPI
(
减少
)和时钟频率()等方
面,它提高性能的关键点在什么地方
?(4
分
)
2
.
机群系统和多台计算机组成的局域网有什么区别
?
(3
分)
3
.
SIMD
和向量机(
Vector
)的异同点是什么?(3分)
1
三、
计算题(49分)
(1)
(8分
)
一个程序有
40%
的部分可以 并行化,
若采用多个
CPU
的办法
来加速可并行化部分,而总程序运行时间由 于多
CPU
的原因由原来单
CPU
的
120
秒缩短为
80
秒,试问至少要用几个
CPU?
解:设要
x
个,则
120/80
=
1/(0.4/x+0.6)
得
x
=
6
(2)
(12分)某一存储子系统包 括
SCSI
控制器和一个磁盘。
SCSI
控制
器通过总线将请求发送 到磁盘上,然后将数据写到磁盘上,在此过程中
它不响应其它请求。假设
SCSI
控制器命令总开销为
1ms,
磁盘的传输
率为
4 0M
byte
/s
,
平均旋转延迟和寻道延迟之和为
6.6ms。
忽略磁盘中的
cache
影响,
CPU
向存储子系统每秒发出
60
个
16K
B
的写请求,达到
SCSI
控制器的
I/O
请求按指数分布。
a.
计算存储子系统对于
16KB
读请求的服务时间。
b.
存储子系统的利用率是多少?
c.
计算
I/O
请求的系统平均响应时间,包括排队和服务时间。
解:
a
:平均服务时间=
1
+
6.6
+
1 6/40
=
8ms
b
:系统利 用率=到达速率×平均服务时间=
60
×
0.008
=
48
%
c
:
Time(
排 队
)
=
8
×
0. 48/(1
-
0. 48)
=
7.4
平均响应时间=
8
+
7.4
=
15.4ms
(3)
(10分)某种机器具有层次型存储结构,包含
cache
,内存和磁盘系
统。内存的平均存取时间
50
个时钟周期,磁盘的平均存取时间
1,000,000
个时钟周期。在不发生存储器停顿
(memory stall)
时,所有的
指令通常是用两个时钟周期完成(
CPI=2
)
。如果有一个程 序在此机器
上运行,
平均每条指令要访问
存储器
1.5
次,
在
cache
的命中率是
98%
,
而读内存的缺失率
(mi ss
rate)
为
0.01%
。程序运行执行的总指令数为
1,0 00,000
条,时钟周期为
10ns
,请问这个程序的总的运行时间
T,并
分析这个程序有多少时间是花在磁盘
I/O
上。
解:T
=指令数×(指令执行时钟周期数+缺失率×存储器存取次数
/
指令
数 ×缺失代价)×时钟周期时间
下一级得缺失代价=
50
+
0.00 01
×
1000000
=
150
个时钟周期
花在 磁盘上得
IO
时间=
1000000
×
1.5
×
0 .02
×
0.0001
×
1000000
×
10
=
30ms
T
=
1000000
×(
2
+
0.02
×
1.5
×
150
)×
10
=
65ms
(4)
(
8分
)
一个具有
64
个相同处理器的
DSM
机器运行某个程序
,
每
个处理器在存取本地存储器时的
CPI
为
1,
存取远端存储器的时间为
3000ns.
处理器的时钟周期为
20ns.
与
2%
的指令需要远端存取相比
,
处
理器完全没有远端存储器存取时
,
速度会提高多少
?
2
(5)
(6分)
设指令在
4
个功能部件的执行时间分别为
20ns, 16ns, 18ns, 12ns,
如果采用流水线增加了
2ns
的附加开销
,
与不采用流水线相比
,
流水
线的最大加速比将是多少
?
解:
(20
+
16
+< br>18
+
12)/(20+2)=3
(
6
)
(5分
)
在
100Mbits/s
的网络上传送
2000Bytes
的信息,
通行时间为
600
μ
s,
发 送方和接受方的开销均为
200
μ
s.
接收方所花费的时间为多
少?
四、
分析题(23分)
(1)
(7分)
列出下面代码的相关关系,并把它改写为并行程序
for (i=1; i<=100; i=i+1) {
a[i]=b[i]+c[i];
/* S1 */
b[i]=a[i]+d[i];
/* S2 */
c[i+1]=a[i]+e[i];
/* S3 */
}
(
2
)
(10
分
)
在一个包括取指F
、译码
D
、执行
X
、存数
M
、写回
W
的五段流水线
机器上,
假设每段都花费一个时钟周期,
流水线没有采用forwarding
或者
Bypassing
技术,但寄存器在同一时间的读 和写可通过寄存器堆来
forward.
机器运行下列代码:
loop:
LW
R1,0 (R2)
ADDI R1, R1,#1
SW
R1, 0 (R2)
ADDI R2, R2,#5
SUB R4,R3,R2
BNZ R4, loop
假设
R3
的初始值为
R2 + 100,
并假设所有的存储器存取都命中。
画出执行上述程序的时空图,
并计算这段程序的执行将花费多少个周期。
(
3
)
(6分
)
一个程序一共有
6
页
,
但分配给该程序的实际内存空间只有
3
页
,
该程序的执行顺序为
:
P1,P2,P3,P4,P2,P3,P5,P5,P4,P6,P3,P3,P2,P1,P5
请画出用
LRU
和
LFU
替换算法进行工作时的替换表
,
并指出两种情
况下的命中率为多少?
3
腰斩-
腰斩-
腰斩-
腰斩-
腰斩-
腰斩-
腰斩-
腰斩-
本文更新与2021-01-21 20:33,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/546022.html
-
上一篇:大学英语六级分类模拟题374
下一篇:无线传感器网络模型设计-英文文献翻译.doc