Taller2 Ecuaciones

UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES

ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2
Pertenece a: Pascasio Jos 9-747-2108 Grupo: 4IL131
Ecuaciones utilizadas en el rendimiento en los computadores
Rendimiento en los computadores

1. Frecuencia de la CPU:
n ciclos
f CPU
segundo
2. Periodo de la CPU
1
TCPU =
f CPU
3. Ciclos por instruccin

n
N Instruc
i 1
i CPI i
CPI
N InstrucTot
4. Rendimiento de un procesador
1
prog
Tprog
5. Tiempo del programa

TProg Ninstruc. Tinstrucciones
6. Tiempo del programa en ejecutar una instruccin
Tinstruccin CPI * TCPU
Tprog N instruccio nes * CPI * TCPU
1 1 fCPU
prog s 1
Tprog N instruc * CPI * TCPU N instruc * CPI
Comparacin del rendimiento

1. Aceleracin del rendimiento

A = A
B
2. Aceleracin del tiempo
T
AT = A = B
TB A
TALLER N. 2
Unidades de medida de Rendimiento Global

1. MIPS
N instruc prog N instruc prog f CPU

MIPS = 6
= 6
=
TPr og * 10 N instruc prog * CPI * TCPU * 10 CPI * 10 6
2. MIPS VAX
TPr og VAX11 / 780

MIPS VAX =
TPr og CPU
3. Megaflops Nativos
Millones instruc
MFLOPS nativos
TPr og * 10 6
4. Megaflops relativos o normalizados
MFLOPSRelativos MillonesIn struc. i Peso i
Leyes de Amdahl
1. Aceleracin
sist.nuevo
Aceleracin
sist.antiguo
2. Ganancias
Tiempo sist.nuevo
Ganancia Velocidad
Tiempo sist.antiguo
3. Aumento de rendimiento
Fraccin de tiempo mejorada

Tnuevo Tantiguo * Fraccin de tiempo sin mejora
Ganancia Velocidad
Medida Aritmtica y Geomtrica

1. Medida aritmtica
M aritmtica
t i
n
2. Medida geomtrica
n
M geomtrica t
i 1
i
TALLER N. 2
Ejercicios Propuestos
EJERCICIO 1
Se propone a un 386 aadirle una memoria cach con una tasa de acierto de un 90%, de forma que,
cuando el acceso se haga en la cach, el CPI de las instrucciones que afectan a la memoria se
decrementa en una unidad. Al poner la cach, en los fallos se pierde un ciclo, es decir, se le suma al
CPI 1 unidad. Se pide:
- Calcular el rendimiento del 386 sin cach.
- Calcular el rendimiento del 386 con cach.
- Calcular la relacin de rendimientos entre el 386 con cach y el 386 sin cach.
Las diferentes instrucciones tienen la frecuencia y el CPI que se refleja en la tabla:
N de instrucciones Tipo de instrucciones CPI386

20 Carga 2
10 Almacenar 4
15 Reg/Reg 2
8/7 Salto condicional 9/3
10 Call 9
30 Operaciones Aritmticas 5
Solucin:
(20 2 + 10 4 + 15 2 + 8 9 + 7 3 + 10 9 + 30 5)
sin =
100
sin = 4.43
386 109
sin = = 8713318 1
100 4.43
con
((18 1 + 2 2) + (9 3 + 1 4) + 15 2 + 8 9 + 7 3 + 10 9 + 30 5)
=
100
sin = 4.16
486 109
con = = 8278846 1
100 4.16
Relacin de rendimiento entre el 386 con cach y el 486 sin cach
8713318
= = 1,052479 1
8278846
TALLER N. 2
EJERCICIO 2
Suponiendo que tenemos 2 mquinas con las siguientes caractersticas para un determinado programa
R:
- Maquina A: Duracin del ciclo de reloj de 23 ns. Con un CPI de 3,2
- Maquina B: Duracin del ciclo de reloj de 15 ns. Con un CPI de 4
Cul de las dos maquinas tiene mayor rendimiento para el programa R?
Solucin
Mquina A:
1
= = 0,04347826 1
23
Mquina B:
1
= = 0,0666666 1
15
R/. La mquina B tiene mayor rendimiento que la mquina A
EJERCICIO 3
Estamos interesados en dos implementaciones de una mquina. Una con hardware especial de punto
flotante y otra sin l. Considerar un programa P, con la siguiente mezcla de operaciones:
Multiplicacin en punto flotante 10%
Suma en punto flotante 15%
Divisin en punto flotante 5%
Instrucciones enteras 70%
La mquina MFP (mquinas con punto flotante), tiene hardware de punto flotante y adems puede
implementar directamente las operaciones en punto flotante.
Necesita el siguiente nmero de ciclos para cada clase de instruccin:
Multiplicacin en punto flotante 6
Suma en punto flotante 4
Divisin en punto flotante 20
Instrucciones enteras 2
La mquina MNFP (mquina sin puntos flotante) no tiene hardware de punto flotante y por
ello debe las operaciones en punto flotante utilizando instrucciones enteras. Todas las instrucciones
TALLER N. 2
enteras necesitan dos ciclos de reloj. El nmero de instrucciones enteras necesarias para implementar
cada una de las operaciones en punto flotante es como sigue:
Multiplicacin en punto flotante 30

Suma en punto flotante 20
Divisin en punto flotante 50
Ambas mquinas tienen una frecuencia de reloj de 100 MHz. Calcular las frecuencias en MIPS nativos
para ambas mquinas.
Solucin
Mquina MFP:
(0.10 6 + 0.15 4 + 0.05 20 + 0.71 2)
= = 3,62
1
= 1 3.62 108
1
= = 27,77777
1 3.62 108 106
Mquina MNFP:
(0.10 30 + 0.15 20 + 0.05 50)
= = 28,3333
0,30
= 0,30 28,3333 108 = 8,49999 108
0.30
= = 3,5294159
1 8,49999 108 106
EJERCICIO 4
Se va a mejorar una mquina y se barajan dos opciones: hacer que las ejecuciones de las instrucciones
de multiplicacin tarden 4 veces menos, o que la ejecucin de las de acceso a memoria tarde 2 veces
menos. Se ejecuta un programa de prueba antes de realizar la mejora y se obtienen las siguientes
medidas de tiempo de uso de la CPU: el 20% del tiempo es utilizado para multiplicar, el 50% para
instrucciones de acceso a memoria y el 30% restante para otras tareas.
Cul ser el incremento de velocidad si slo se mejora la multiplicacin? Y si slo se mejoran los
accesos a memoria? Y si se realizan ambas mejoras?
Solucin
1 109
= =
3.2 23 109 73,6
1 109
= =
4 15 109 60
TALLER N. 2
R/. El rendimiento de la mquina A es 1,23 veces mejor que el rendimiento de la mquina B
= 1,23
EJERCICIO 5
Se ejecutan sobre una mquina dos programas A y B utilizados como test para medir su rendimiento.
Los recuentos de instrucciones tienen la siguiente distribucin en ambos:
PROGRAMA A PROGRAMA B
Instrucciones de proceso 37% 48%
Instrucciones de transferencia 45% 36%
Instrucciones de salto 18% 16%
La mquina presenta los siguientes CPI (ciclos por instruccin) medios para cada grupo de
instrucciones sin memoria cach de 2 nivel y con ella.
CPI MEDIO
SIN CACHE DE 2 NIVEL CON CACHE DE 2 NIVEL
Instrucciones de proceso 1.0 1.0
Instrucciones de transferencia 5.2 2.4
Instrucciones de salto 1.1 1.0
Determinar la ganancia de rendimiento (aceleracin o speed up) que presenta la mejora de la jerarqua
de memoria introducida en la mquina con respecto a la situacin sin mejora.
Solucin
Calcular el rendimiento de la mquina A
0,37 1 + 0,45 5.2 + 0.18 1.1

= = 2,908
1
1
= = 0,34387811 1
1 2,908
TALLER N. 2
Calcular el rendimiento de la mquina B
0,48 1 + 0,16 2.4 + 0.36 1

= = 1,224
1
1
= = 0,81699 1
1 1,224
: = 0,47311
EJERCICIO 6
Una vez graduado, el lector se preguntar cmo llegar a ser un lder en el diseo de computadores.
Su estudio sobre la utilizacin de construcciones de los lenguajes de alto nivel sugiere que las llamadas
a los procedimientos son una de las operaciones ms caras. Suponga que ha inventado un esquema
que reduce las operaciones de carga y almacenamiento normalmente asociadas con las llamadas y
vueltas de procedimientos. Lo primero que hace es ejecutar algunos experimentos con y sin esta
optimizacin. Sus experimentos utilizan el mismo compilador optimizador en ambas versiones del
computador.
Los experimentos realizados revelan lo siguiente:
La duracin del ciclo de reloj de la versin no optimizada es el 5% ms rpido.
El 30% de las instrucciones de la versin no optimizada son operaciones de carga o
almacenamiento.
La versin optimizada ejecuta 1/3 menos de operaciones de carga y almacenamiento que la
versin no optimizada. Para las dems instrucciones, el recuento de ejecucin dinmica es inalterable.
Todas las instrucciones (incluyendo las de carga y almacenamiento) emplean un ciclo de reloj.
Qu versin es ms rpida? Justificar cuantitativamente la decisin.
Solucin
No Optimizado
(1 + 0.05) = (1.05)
0,3
{
0,7 = 1
1,05
=
1
Optimizado
() =
0,2
{
0,7 = 1

=
0.9 1
TALLER N. 2

0.9 1 = 1,058
= =
1,05
1
R/. La versin optimizada es 5.8% mejor que la no optimizada.

Taller2 Ecuaciones

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Taller2 Ecuaciones

Transféré par

Droits d'auteur :

Formats disponibles

UNIVERSIDAD TECNOLGICA DE PANAM

FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES

Ecuaciones utilizadas en el rendimiento en los computadores

Rendimiento en los computadores

3. Ciclos por instruccin

5. Tiempo del programa

Comparacin del rendimiento

Unidades de medida de Rendimiento Global

N instruc prog N instruc prog f CPU

TPr og VAX11 / 780

4. Megaflops relativos o normalizados

MFLOPSRelativos MillonesIn struc. i Peso i

Fraccin de tiempo mejorada

Medida Aritmtica y Geomtrica

N de instrucciones Tipo de instrucciones CPI386

R/. La mquina B tiene mayor rendimiento que la mquina A

Multiplicacin en punto flotante 30

0,37 1 + 0,45 5.2 + 0.18 1.1

0,48 1 + 0,16 2.4 + 0.36 1

Vous aimerez peut-être aussi