Académique Documents
Professionnel Documents
Culture Documents
n ciclos
f CPU
segundo
2. Periodo de la CPU
1
TCPU =
f CPU
N Instruc
i 1
i CPI i
CPI
N InstrucTot
4. Rendimiento de un procesador
1
prog
Tprog
1 1 fCPU
prog s 1
Tprog N instruc * CPI * TCPU N instruc * CPI
2. MIPS VAX
3. Megaflops Nativos
Millones instruc
MFLOPS nativos
TPr og * 10 6
Leyes de Amdahl
1. Aceleracin
sist.nuevo
Aceleracin
sist.antiguo
2. Ganancias
Tiempo sist.nuevo
Ganancia Velocidad
Tiempo sist.antiguo
3. Aumento de rendimiento
M aritmtica
t i
n
2. Medida geomtrica
n
M geomtrica t
i 1
i
UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES
ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2
Ejercicios Propuestos
EJERCICIO 1
Se propone a un 386 aadirle una memoria cach con una tasa de acierto de un 90%, de forma que,
cuando el acceso se haga en la cach, el CPI de las instrucciones que afectan a la memoria se
decrementa en una unidad. Al poner la cach, en los fallos se pierde un ciclo, es decir, se le suma al
CPI 1 unidad. Se pide:
- Calcular el rendimiento del 386 sin cach.
- Calcular el rendimiento del 386 con cach.
- Calcular la relacin de rendimientos entre el 386 con cach y el 386 sin cach.
Las diferentes instrucciones tienen la frecuencia y el CPI que se refleja en la tabla:
Solucin:
(20 2 + 10 4 + 15 2 + 8 9 + 7 3 + 10 9 + 30 5)
sin =
100
sin = 4.43
386 109
sin = = 8713318 1
100 4.43
con
((18 1 + 2 2) + (9 3 + 1 4) + 15 2 + 8 9 + 7 3 + 10 9 + 30 5)
=
100
sin = 4.16
486 109
con = = 8278846 1
100 4.16
Relacin de rendimiento entre el 386 con cach y el 486 sin cach
8713318
= = 1,052479 1
8278846
UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES
ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2
EJERCICIO 2
Suponiendo que tenemos 2 mquinas con las siguientes caractersticas para un determinado programa
R:
- Maquina A: Duracin del ciclo de reloj de 23 ns. Con un CPI de 3,2
- Maquina B: Duracin del ciclo de reloj de 15 ns. Con un CPI de 4
Cul de las dos maquinas tiene mayor rendimiento para el programa R?
Solucin
Mquina A:
1
= = 0,04347826 1
23
Mquina B:
1
= = 0,0666666 1
15
EJERCICIO 3
Estamos interesados en dos implementaciones de una mquina. Una con hardware especial de punto
flotante y otra sin l. Considerar un programa P, con la siguiente mezcla de operaciones:
Multiplicacin en punto flotante 10%
Suma en punto flotante 15%
Divisin en punto flotante 5%
Instrucciones enteras 70%
La mquina MFP (mquinas con punto flotante), tiene hardware de punto flotante y adems puede
implementar directamente las operaciones en punto flotante.
Necesita el siguiente nmero de ciclos para cada clase de instruccin:
Multiplicacin en punto flotante 6
Suma en punto flotante 4
Divisin en punto flotante 20
Instrucciones enteras 2
La mquina MNFP (mquina sin puntos flotante) no tiene hardware de punto flotante y por
ello debe las operaciones en punto flotante utilizando instrucciones enteras. Todas las instrucciones
UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES
ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2
enteras necesitan dos ciclos de reloj. El nmero de instrucciones enteras necesarias para implementar
cada una de las operaciones en punto flotante es como sigue:
Mquina MNFP:
(0.10 30 + 0.15 20 + 0.05 50)
= = 28,3333
0,30
= 0,30 28,3333 108 = 8,49999 108
0.30
= = 3,5294159
1 8,49999 108 106
EJERCICIO 4
Se va a mejorar una mquina y se barajan dos opciones: hacer que las ejecuciones de las instrucciones
de multiplicacin tarden 4 veces menos, o que la ejecucin de las de acceso a memoria tarde 2 veces
menos. Se ejecuta un programa de prueba antes de realizar la mejora y se obtienen las siguientes
medidas de tiempo de uso de la CPU: el 20% del tiempo es utilizado para multiplicar, el 50% para
instrucciones de acceso a memoria y el 30% restante para otras tareas.
Cul ser el incremento de velocidad si slo se mejora la multiplicacin? Y si slo se mejoran los
accesos a memoria? Y si se realizan ambas mejoras?
Solucin
1 109
= =
3.2 23 109 73,6
1 109
= =
4 15 109 60
UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES
ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2
R/. El rendimiento de la mquina A es 1,23 veces mejor que el rendimiento de la mquina B
= 1,23
EJERCICIO 5
Se ejecutan sobre una mquina dos programas A y B utilizados como test para medir su rendimiento.
Los recuentos de instrucciones tienen la siguiente distribucin en ambos:
PROGRAMA A PROGRAMA B
Instrucciones de proceso 37% 48%
Instrucciones de transferencia 45% 36%
Instrucciones de salto 18% 16%
La mquina presenta los siguientes CPI (ciclos por instruccin) medios para cada grupo de
instrucciones sin memoria cach de 2 nivel y con ella.
CPI MEDIO
SIN CACHE DE 2 NIVEL CON CACHE DE 2 NIVEL
Instrucciones de proceso 1.0 1.0
Instrucciones de transferencia 5.2 2.4
Instrucciones de salto 1.1 1.0
Determinar la ganancia de rendimiento (aceleracin o speed up) que presenta la mejora de la jerarqua
de memoria introducida en la mquina con respecto a la situacin sin mejora.
Solucin
Calcular el rendimiento de la mquina A
EJERCICIO 6
Una vez graduado, el lector se preguntar cmo llegar a ser un lder en el diseo de computadores.
Su estudio sobre la utilizacin de construcciones de los lenguajes de alto nivel sugiere que las llamadas
a los procedimientos son una de las operaciones ms caras. Suponga que ha inventado un esquema
que reduce las operaciones de carga y almacenamiento normalmente asociadas con las llamadas y
vueltas de procedimientos. Lo primero que hace es ejecutar algunos experimentos con y sin esta
optimizacin. Sus experimentos utilizan el mismo compilador optimizador en ambas versiones del
computador.
Los experimentos realizados revelan lo siguiente:
La duracin del ciclo de reloj de la versin no optimizada es el 5% ms rpido.
El 30% de las instrucciones de la versin no optimizada son operaciones de carga o
almacenamiento.
La versin optimizada ejecuta 1/3 menos de operaciones de carga y almacenamiento que la
versin no optimizada. Para las dems instrucciones, el recuento de ejecucin dinmica es inalterable.
Todas las instrucciones (incluyendo las de carga y almacenamiento) emplean un ciclo de reloj.
Qu versin es ms rpida? Justificar cuantitativamente la decisin.
Solucin
No Optimizado
(1 + 0.05) = (1.05)
0,3
{
0,7 = 1
1,05
=
1
Optimizado
() =
0,2
{
0,7 = 1
=
0.9 1
UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES
ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2
0.9 1 = 1,058
= =
1,05
1
R/. La versin optimizada es 5.8% mejor que la no optimizada.