Académique Documents
Professionnel Documents
Culture Documents
CISC: Intel lanza el Pentium Pro y el Pentium II, y AMD el K-5 y K-6.
RISC: DEC lanza el Alpha 211164, MIPS el R10000, Sun el UltraSPARC, HP el HPPA8000 y tambin aparecen los PowerPC 603, 604 y 620.
Capacitacin
Decodificacin
Renombramiento de registros
Buffer de reordenamiento
Unidad de emisin/ejecucin
Unidad final de instrucciones
Se realiza en el RAT (Register Allocator) que reasigna las referencias a los 16 registros
de la arquitectura a 40 registros fsicos, eliminando las dependencias falsas.
El RAT no puede manejas 3 microoperaciones.
Se puede renombrar tres registros por ciclo.
Una limitacin importante es que solo se pueden leer 2 registros diferentes en cada
ciclo.
Mantener las microoperaciones que leen el mismo registro lo ms cerca posible para
que sea ms probable que entren a la vez en el RAT.
Mantener las microoperaciones que leen de registros diferentes lo ms lejos posible
para que no entren a la vez en el RAT.
Provocar renombrados de registros para evitar los ciclos perdidos en el acceso a los
registros.
21. Cules son las instrucciones de precaptacin de instrucciones IA-32 del Pentium 4?
captacin
decodificacin, renombramiento, saltos
escritura en cola de instrucciones
emisin
lectura de banco de registros
ejecucin en unidad funcional
escritura en banco de registros
calculo de direcciones, acceso a TLB
carga de memoria
27. Cules son las colas que recepcionan las instrucciones una vez decodificadas en el
R10000?
Cola de direcciones
28. Cuntos registros hay para el desarrollo de instrucciones con enteros en los procesadores
del tipo MIPS?
33 registros lgicos
64 registros fsicos
35. Cules son los modelos de los procesadores Alpha y algunas de sus caractersticas de ella
Captacin
Retardo
Renombramiento
Emisin
Leer registros
Ejecucin
Memoria
37. En la etapa de captacin del alpha 21264. Que se pretende con la prediccin de lnea y
via?
Aprovechar las ventajas de una cache asociativa por conjuntos en cuanto a tasa de fallos,
disponiendo adems de tiempos de acceso tpicos de una cache de correspondencia directa.
38. Qu le permite aprovechar mejor el paralelismo entre instrucciones del Alpha 21264?
La eficacia de prediccin de saltos, las unidades de ejecucin son ms rpidas ya que el 21264
puede mantener 80 instrucciones procesndose
39. En que consiste la etapa de retardo del Alpha 21264
Su nica funcin es proporcionar el retardo suficiente para que las instrucciones puedan
alcanzar la etapa dedicada al renombramiento de los registros.
40. En que consiste la etapa de renombramiento del Alpha 21264
Aqu se asigna un registro interno a cada instruccin, cuyo resultado logrado va a modificar un
registro de su arquitectura, entonces la instruccin al ejecutarse, modifica lo que es el
registro interno que se le ha asignado en el renombramiento y este se escribir en el registro
BALOTARIO CAPITULO 5
1. Qu es un compilador?
Un compilador es un programa informtico que traduce un programa escrito en un lenguaje
de programacin a otro lenguaje de programacin, generando un programa equivalente que
la mquina ser capaz de interpretar. Usualmente el segundo lenguaje es lenguaje de
mquina, pero tambin puede ser un cdigo intermedio (bytecode), o simplemente texto.
Este proceso de traduccin se conoce como compilacin.
2. En qu caracteriza el procesador VLIW?
Los procesadores con arquitecturas VLIW se caracterizan, como su nombre indica, por tener
juegos de instrucciones muy simples en cuanto a nmero de instrucciones diferentes, pero
muy grandes en cuanto al tamao de cada instruccin. Esto es as porque en cada instruccin
se especifica el estado de todas y cada una de las unidades funcionales del sistema, con el
objetivo de simplificar el diseo del hardware al dejar todo el trabajo de planificar el cdigo
en manos del programador/compilador, en oposicin a un procesador superescalar, en el que
es el hardware en tiempo de ejecucin el que planifica las instrucciones.
3. Defina brevemente el IA-64.
Es la primera familia de procesadores de 64 bits de la empresa itanium de Intel.
IA-64 es distinto a las arquitecturas de x86-32 y x86.
La arquitectura IA-64 est basada en un paralelismo explcito a nivel instruccin, con el
compilador tomando decisiones acerca de qu instrucciones ejecutar en paralelo. Esto
permite al procesador ejecutar hasta seis instrucciones por ciclo de reloj (ver frecuencia de
reloj).
4. Que indicaban los estudios realizados cerca de 1970 por Tjaden y Flynn, adems de los de
Foster y Riseman?
El paralelismo que se puede extraer de un bloque bsico como mucho poda llegar a 1.86 y
1.72 instrucciones por ciclo, teniendo en cuenta los compiladores de la poca; hasta se poda
llegar a tener factores de incremento de velocidad entre 2 y 3 aprovechando ILP, segn
Fisher.
5. Qu es prlogo y el epilogo en segmentacin de software?
Son las diversas instrucciones que se tienen que aadir al cdigo para poder captar el primer
dato antes de poder realizar el bucle (prlogo) y las instrucciones para poder almacenar el
ltimo resultado tras el bucle (eplogo).
6. Cul es el segundo proceso en la planificacin de trazas y en qu consiste?
El segundo proceso en la planificacin de traza es la compresin, esta pretende codificar las
operaciones de la traza con el menor nmero de instrucciones VLIW, para lo cual se ubican
p1 cmp.cnd a, b
p1, p2 cmp.cnd a, b
9. Cules son los factores que limitan la utilidad del uso del uso de predicados?
El uso de instrucciones con predicado para facilitar el desplazamiento de instrucciones sigue
siendo una forma de especulacin y supone un costo cuando la ejecucin falla.
Si la condicin que debe evaluarse en una instruccin con predicado, no est disponible con la
suficiente antelacin se producirn atascos en el cauce. Cuando el flujo contiene ms de una
alternativa puede resultar complicado el uso de predicados
10. Cules son las estrategias que permiten garantizar el comportamiento frente del
programa frente a excepciones?
Si se han ejecutado otras operaciones que dependen del LOAD, habr que
repetirlas.
24. Cmo se realizan las operaciones en cada una de las subpalabras de una instruccin VLIW?
Los tipos de operaciones que pueden codificarse en cada una de las subpalabras de la
instruccin VLIW dependen de las unidades funcionales a las que se puede acceder desde
cada ventana de emisin.
o
o
o
o
Seleccin de traza: se elige una seccin de cdigo sin bucles constituida por una serie
de bloques bsicos denominada traza.
Compresin de traza: pretende codificar las operaciones de la traza con el menor
nmero de instrucciones VLIW.
Los Haces.
Grupo de instrucciones.
Cada haz de instrucciones tiene tamao de 128 bits y codifica hasta 3 operaciones, cada
operacin o instruccin dentro del haz se codifica mediante un campo de 41 bits, los cinco
bits sobrantes se utilizan como campo de marca.
35. Describa Grupo de instrucciones
Es una memoria completamente asociativa con 32 lneas y cuatro puertos que almacena
las direcciones de memoria a las que acceden las instrucciones de carga que se adelantan
y los identificadores de registros que se cargan con los datos de memoria.
38. En los procesadores CRUSOE a que se denomina tomos y molculas?
Molculas: son las palabras de instrucciones VLIW del Crusoe que pueden ser de 64 o
128 bits.
Cada instruccin VLIW contiene cuatro operaciones de tipo RISC que reciben el
nombre de tomos.
BALOTARIO CAPITULO 6
1. Cules son las principales caractersticas de las operaciones con vectores?
- En una operacin vectorial, el clculo de cada uno de los componentes del vector es
independiente del clculo de los restantes.
- Una nica instruccin vectorial codifica una gran cantidad de clculos. De esta forma se reduce el
nmero de instrucciones de los programas vectoriales con respecto a los programas que ejecutan
los procesadores escalares.
- Los datos que luego se van a utilizar conjuntamente como componentes de un operador vectorial
se podran ubicar en posiciones contiguas de memoria.
2. Quin fundo CRI y cul fue la primera mquina vectorial disea por CRI?
CRI de las siglas Cray Research Inc. fue fundada por S. Cray, creando la primera mquina vectorial
de CRI conocida como Cray-1 en el ao 1976, siendo una computadora con arquitectura vectorial
registro-registro, donde los datos se cargan desde memoria en registros vectoriales, desde donde
pasan a los causes vectoriales segmentados, cuyos resultados se escriben en registros vectoriales
desde donde se escriben en memoria.
3. Cules son los primeros computadores vectoriales diseados por Fujitsu, Hitachi y NEC?
Fujitsu desarrolla la linea de computadores vectoriales VP100-200 a partir de 1983, y
posteriormente la lnea VP700 (1998) y la VPP5000 (1999). Hitachi introdujo en 1984 el
computador S810, al que rpidamente sigui el S820, para iniciar bastante despus (1998) la lnea
SR8000. En cuanto a NEC, en 1984 presenta el computador vectorial SX/2, al que siguen los
computadores SX/4 (1995), SX/5 (1998), y finalmente los SX/6 (2002) y SX/7.
4. Qu caracterstica con respecto a sus registros tiene un procesador vectorial?
Las instrucciones utilizan dos registros para indicar la ubicacin en memoria de los datos que se
van ha cargar en los componentes de los registros vectoriales (LVI) o donde se van ha almacenar
estos componentes (SVI).
7. Qu es encadenamiento de cauces?
El encadenamiento permite que un cauce pueda empezar a procesar los resultados que producen
otro cauce a medida que este va terminando de procesar componentes. Por lo tanto el segundo el
segundo cauce no tiene que esperar a que termine el procesamiento del todo el operando
vectorial en el primero de os cauces.
8. Qu es el solapamiento?
SURGE:
k
Tk = TBASE +
(TBUCLE + TLI) + k TPC
MVL
k
Tk = TBASE +
1 (TBUCLE + TLI) + MVL TPC + TBUCLE + TLI + (k modMVL ) TPC =
MVL
1 + (k modMVL )
MVL
k
MVL
= TBASE +
(TBUCLE + TLI) + TPC
k
MVL
11. MENCIONE LA ECUACION PARA TIEMPO POR ELEMENTO Y SOBRECARGA POR ELEMENTO
=
+ TPC
k
k
Sobrecarga por elemento
k
TBASE +
( TBUCLE + TLI )
Ok
MVL
=
k
k
12. MENCIONE LAS APLICACIONES DE LOS PROCESADORES VECTORIALES
Etapa de captacin
Decodificacion
Captacion de regitros