Vous êtes sur la page 1sur 8

UNIVERSIDAD TECNOLGICA DE PANAM

FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES


ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2
Pertenece a: Pascasio Jos 9-747-2108 Grupo: 4IL131

Ecuaciones utilizadas en el rendimiento en los computadores

Rendimiento en los computadores


1. Frecuencia de la CPU:

n ciclos
f CPU
segundo

2. Periodo de la CPU

1
TCPU =
f CPU

3. Ciclos por instruccin


n

N Instruc
i 1
i CPI i
CPI
N InstrucTot

4. Rendimiento de un procesador

1
prog
Tprog

5. Tiempo del programa


TProg Ninstruc. Tinstrucciones
6. Tiempo del programa en ejecutar una instruccin
Tinstruccin CPI * TCPU
Tprog N instruccio nes * CPI * TCPU

1 1 fCPU
prog s 1
Tprog N instruc * CPI * TCPU N instruc * CPI

Comparacin del rendimiento


1. Aceleracin del rendimiento

A = A
B
2. Aceleracin del tiempo
T
AT = A = B
TB A
UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES
ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2

Unidades de medida de Rendimiento Global


1. MIPS

N instruc prog N instruc prog f CPU


MIPS = 6
= 6
=
TPr og * 10 N instruc prog * CPI * TCPU * 10 CPI * 10 6

2. MIPS VAX

TPr og VAX11 / 780


MIPS VAX =
TPr og CPU

3. Megaflops Nativos

Millones instruc
MFLOPS nativos
TPr og * 10 6

4. Megaflops relativos o normalizados

MFLOPSRelativos MillonesIn struc. i Peso i

Leyes de Amdahl
1. Aceleracin

sist.nuevo
Aceleracin
sist.antiguo

2. Ganancias

Tiempo sist.nuevo
Ganancia Velocidad
Tiempo sist.antiguo

3. Aumento de rendimiento

Fraccin de tiempo mejorada


Tnuevo Tantiguo * Fraccin de tiempo sin mejora
Ganancia Velocidad

Medida Aritmtica y Geomtrica


1. Medida aritmtica

M aritmtica
t i

n
2. Medida geomtrica
n
M geomtrica t
i 1
i
UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES
ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2

Ejercicios Propuestos
EJERCICIO 1
Se propone a un 386 aadirle una memoria cach con una tasa de acierto de un 90%, de forma que,
cuando el acceso se haga en la cach, el CPI de las instrucciones que afectan a la memoria se
decrementa en una unidad. Al poner la cach, en los fallos se pierde un ciclo, es decir, se le suma al
CPI 1 unidad. Se pide:
- Calcular el rendimiento del 386 sin cach.
- Calcular el rendimiento del 386 con cach.
- Calcular la relacin de rendimientos entre el 386 con cach y el 386 sin cach.
Las diferentes instrucciones tienen la frecuencia y el CPI que se refleja en la tabla:

N de instrucciones Tipo de instrucciones CPI386


20 Carga 2
10 Almacenar 4
15 Reg/Reg 2
8/7 Salto condicional 9/3
10 Call 9
30 Operaciones Aritmticas 5

Solucin:
(20 2 + 10 4 + 15 2 + 8 9 + 7 3 + 10 9 + 30 5)
sin =
100
sin = 4.43
386 109
sin = = 8713318 1
100 4.43
con
((18 1 + 2 2) + (9 3 + 1 4) + 15 2 + 8 9 + 7 3 + 10 9 + 30 5)
=
100
sin = 4.16
486 109
con = = 8278846 1
100 4.16
Relacin de rendimiento entre el 386 con cach y el 486 sin cach
8713318
= = 1,052479 1
8278846
UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES
ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2

EJERCICIO 2
Suponiendo que tenemos 2 mquinas con las siguientes caractersticas para un determinado programa
R:
- Maquina A: Duracin del ciclo de reloj de 23 ns. Con un CPI de 3,2
- Maquina B: Duracin del ciclo de reloj de 15 ns. Con un CPI de 4
Cul de las dos maquinas tiene mayor rendimiento para el programa R?
Solucin

Mquina A:
1
= = 0,04347826 1
23
Mquina B:
1
= = 0,0666666 1
15

R/. La mquina B tiene mayor rendimiento que la mquina A

EJERCICIO 3
Estamos interesados en dos implementaciones de una mquina. Una con hardware especial de punto
flotante y otra sin l. Considerar un programa P, con la siguiente mezcla de operaciones:
Multiplicacin en punto flotante 10%
Suma en punto flotante 15%
Divisin en punto flotante 5%
Instrucciones enteras 70%
La mquina MFP (mquinas con punto flotante), tiene hardware de punto flotante y adems puede
implementar directamente las operaciones en punto flotante.
Necesita el siguiente nmero de ciclos para cada clase de instruccin:
Multiplicacin en punto flotante 6
Suma en punto flotante 4
Divisin en punto flotante 20
Instrucciones enteras 2

La mquina MNFP (mquina sin puntos flotante) no tiene hardware de punto flotante y por
ello debe las operaciones en punto flotante utilizando instrucciones enteras. Todas las instrucciones
UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES
ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2
enteras necesitan dos ciclos de reloj. El nmero de instrucciones enteras necesarias para implementar
cada una de las operaciones en punto flotante es como sigue:

Multiplicacin en punto flotante 30


Suma en punto flotante 20
Divisin en punto flotante 50
Ambas mquinas tienen una frecuencia de reloj de 100 MHz. Calcular las frecuencias en MIPS nativos
para ambas mquinas.
Solucin
Mquina MFP:
(0.10 6 + 0.15 4 + 0.05 20 + 0.71 2)
= = 3,62
1
= 1 3.62 108
1
= = 27,77777
1 3.62 108 106

Mquina MNFP:
(0.10 30 + 0.15 20 + 0.05 50)
= = 28,3333
0,30
= 0,30 28,3333 108 = 8,49999 108
0.30
= = 3,5294159
1 8,49999 108 106

EJERCICIO 4
Se va a mejorar una mquina y se barajan dos opciones: hacer que las ejecuciones de las instrucciones
de multiplicacin tarden 4 veces menos, o que la ejecucin de las de acceso a memoria tarde 2 veces
menos. Se ejecuta un programa de prueba antes de realizar la mejora y se obtienen las siguientes
medidas de tiempo de uso de la CPU: el 20% del tiempo es utilizado para multiplicar, el 50% para
instrucciones de acceso a memoria y el 30% restante para otras tareas.
Cul ser el incremento de velocidad si slo se mejora la multiplicacin? Y si slo se mejoran los
accesos a memoria? Y si se realizan ambas mejoras?
Solucin
1 109
= =
3.2 23 109 73,6

1 109
= =
4 15 109 60
UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES
ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2
R/. El rendimiento de la mquina A es 1,23 veces mejor que el rendimiento de la mquina B
= 1,23

EJERCICIO 5
Se ejecutan sobre una mquina dos programas A y B utilizados como test para medir su rendimiento.
Los recuentos de instrucciones tienen la siguiente distribucin en ambos:

PROGRAMA A PROGRAMA B
Instrucciones de proceso 37% 48%
Instrucciones de transferencia 45% 36%
Instrucciones de salto 18% 16%

La mquina presenta los siguientes CPI (ciclos por instruccin) medios para cada grupo de
instrucciones sin memoria cach de 2 nivel y con ella.

CPI MEDIO
SIN CACHE DE 2 NIVEL CON CACHE DE 2 NIVEL
Instrucciones de proceso 1.0 1.0
Instrucciones de transferencia 5.2 2.4
Instrucciones de salto 1.1 1.0

Determinar la ganancia de rendimiento (aceleracin o speed up) que presenta la mejora de la jerarqua
de memoria introducida en la mquina con respecto a la situacin sin mejora.
Solucin
Calcular el rendimiento de la mquina A

0,37 1 + 0,45 5.2 + 0.18 1.1


= = 2,908
1
1
= = 0,34387811 1
1 2,908
UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES
ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2
Calcular el rendimiento de la mquina B

0,48 1 + 0,16 2.4 + 0.36 1


= = 1,224
1
1
= = 0,81699 1
1 1,224
: = 0,47311

EJERCICIO 6
Una vez graduado, el lector se preguntar cmo llegar a ser un lder en el diseo de computadores.
Su estudio sobre la utilizacin de construcciones de los lenguajes de alto nivel sugiere que las llamadas
a los procedimientos son una de las operaciones ms caras. Suponga que ha inventado un esquema
que reduce las operaciones de carga y almacenamiento normalmente asociadas con las llamadas y
vueltas de procedimientos. Lo primero que hace es ejecutar algunos experimentos con y sin esta
optimizacin. Sus experimentos utilizan el mismo compilador optimizador en ambas versiones del
computador.
Los experimentos realizados revelan lo siguiente:
La duracin del ciclo de reloj de la versin no optimizada es el 5% ms rpido.
El 30% de las instrucciones de la versin no optimizada son operaciones de carga o
almacenamiento.
La versin optimizada ejecuta 1/3 menos de operaciones de carga y almacenamiento que la
versin no optimizada. Para las dems instrucciones, el recuento de ejecucin dinmica es inalterable.
Todas las instrucciones (incluyendo las de carga y almacenamiento) emplean un ciclo de reloj.
Qu versin es ms rpida? Justificar cuantitativamente la decisin.
Solucin

No Optimizado

(1 + 0.05) = (1.05)
0,3
{
0,7 = 1
1,05
=
1
Optimizado

() =
0,2
{
0,7 = 1

=
0.9 1
UNIVERSIDAD TECNOLGICA DE PANAM
FACULTAD DE INGENIERA DE SISTEMAS COMPUTACIONALES
ORGANIZACIN Y ARQUITECTURA DE COMPUNTADORAS
TALLER N. 2

0.9 1 = 1,058
= =
1,05
1
R/. La versin optimizada es 5.8% mejor que la no optimizada.

Vous aimerez peut-être aussi