Paralelismoa A Nivel de Instrucciones PDF

INFORME GRUPO 1
PARALELISMO A NIVEL DE INSTRUCCIONES, MEMORIA CACHE, MEMORIA FLASH

Y RAM. OPEN HARDWARE: DEFINICIN, ARQUITECTURA INTERNAS, TIPOS,
CARACTERSTICAS, VENTAJAS Y DESVENTAJAS. CPU, FPU, GPU Y APU.
COMPARATIVA DE FABRICANTES, CARACTERSTICAS ACTUALES Y TENDENCIAS
PARA CADA UNO.
1. INTEGRANTES
Altamirano Ordoez, Cristhian.
Huamani Baltazar, Jose Luis
Mantilla Urpi, Rudy
Roja Felix, Ernesto
2. DESARROLLO
2.1 FUNDAMENTO TEORICO
2.2.1 COMPUTACION PARALELA
El paralelismo es una tcnica o forma de computacin en la cual
varios clculos pueden realizarse simultneamente, basado en el
principio de dividir los problemas grandes para obtener varios
problemas pequeos, que son posteriormente solucionados en
paralelo.
Hay varios tipos diferentes de paralelismo: nivel de bit, nivel de
instruccin, de datos y de tarea.
2.2.2 Paralelismo a nivel de bit
Desde el advenimiento de la integracin a gran escala (VLSI) como
tecnologa de fabricacin de chips de computadora en la dcada de
1970 hasta alrededor de 1986, la aceleracin en la arquitectura de
computadores se lograba en gran medida duplicando el tamao de
la palabra en la computadora, la cantidad de informacin que el
procesador puede manejar por ciclo. El aumento del tamao de la
palabra reduce el nmero de instrucciones que el procesador debe
ejecutar para realizar una operacin en variables cuyos tamaos son
mayores que la longitud de la palabra. Por ejemplo, cuando un
procesador de 8 bits debe sumar dos enteros de 16 bits, el procesador
primero debe adicionar los 8 bits de orden inferior de cada nmero

entero con la instruccin de adicin, a continuacin, aadir los 8 bits
de orden superior utilizando la instruccin de adicin con acarreo que
tiene en cuenta el bit de acarreo de la adicin de orden inferior, en
este caso un procesador de 8 bits requiere dos instrucciones para
completar una sola operacin, en donde un procesador de 16
bits necesita una sola instruccin para poder completarla
2.2.3 Paralelismo de datos
Consiste en subdividir el conjunto de datos de entrada a un programa,
de manera que a cada procesador le corresponda un subconjunto de
esos datos. Cada procesador efectuar la misma secuencia de
operaciones que los otros procesadores sobre su subconjunto de
datos asignado. En pocas palabras se distribuyen los datos y se
replican las tareas.
El paralelismo de datos es un paradigma suficientemente adecuado
para operaciones sobre vectores y matrices, dado que muchas de
ellas consisten en aplicar la misma operacin sobre cada uno de sus
elementos.
2.2.4 Paralelismo de tareas

Consiste en asignar distintas tareas a cada uno de los procesadores
de un sistema de cmputo. En consecuencia, cada procesador
efectuar su propia secuencia de operaciones.
En su modo ms general, el paralelismo de tareas se representa
mediante un grafo de tareas, el cual es subdividido en subgrafos que
son luego asignados a diferentes procesadores. De la forma como se
corte el grafo, depende la eficiencia de paralelismo resultante. La
particin y asignacin ptima de un grafo de tareas para ejecucin
concurrente es un problema NP-completo, por lo cual en la prctica se
dispone de mtodos heursticos aproximados para lograr una
asignacin cercana a la ptima.
NP-completo es el subconjunto de los problemas de decisin en NP tal
que todo problema en NP se puede reducir en cada uno de los
problemas de NP-completo.
2.2.5 Paralelismo a nivel de instrucciones

Consiste cuando un grupo de instrucciones que compone un programa
son ejecutadas paralelamente sin cambiar el resultado final del
programa.
2.2 PARALELISMO A NIVEL DE INSTRUCCIONES

Consiste en un tcnica que busca que la combinacin de instrucciones
de bajo nivel que ejecuta un procesador puedan ser ordenadas de
forma tal que al ser procesadas en simultneo no afecten el resultado
final del programa, y ms bien incrementen la velocidad y aprovechen
al mximo las capacidades del hardware. Un pipeline (canalizador) de
instrucciones es el que permite que por cada ciclo de reloj del
procesador mltiples instrucciones se encuentren en distintas fases de
ejecucin.
Caractersticas:
Ejecuta ms de una instruccin por ciclo de reloj. Para ello se usan

mltiples cauces, con lo que varias instrucciones pueden iniciar su
ejecucin de manera independiente.
La incorporacin de cache como un elemento ms del diagrama de

bloques del microprocesador o la virtud para hacerle llegar grande
volmenes de datos con la destreza que lo necesita.
Tiene la capacidad de procesar instrucciones en paralelo. Viene

determinado por el nmero de instrucciones que pueden solaparse en
las etapas de un procesador.
El compilador tiene mucho ms tiempo para determinar las posibles

operaciones paralelas y ve el programa completo.
En su descomposicin funcional ms sencilla, un microprocesador se
compone de una unidad de proceso. En esta ltima conviva
inicialmente la ALU y el banco de registros solitario, pero enseguida se

les unieron nuevas unidades funcionales en la bsqueda de un aumento
de rendimiento. Algunos de estos aditivos llevan a la prctica alguna
forma de paralelismo a nivel de instruccin, ideo que de forma genrica
consiste en romper con la ejecucin secuencial de instrucciones (una
detrs de otra en el tiempo) para simultanear su ejecucin.
Existen distintas formas de explotar este paralelismo y son:
2.2.5.1 SUPERESCALAR
Los procesadores superescalares leen varias instrucciones a la
vez en su cola de instrucciones y dinmicamente emiten cierto
nmero de ellas en cada ciclo de reloj. El nmero y tipo de
instrucciones emitidas depende de cada arquitectura.
2.2.5.2 VLIW
Ejecuta grupos de operaciones empaquetadas en instrucciones
compuestas .Las instrucciones dentro de cada paquete son
independientes entre s. Todas las instrucciones de un paquete se
ejecutan en paralelo y las ms rpidas deben esperar la
finalizacin de las ms lentas. La seleccin de instrucciones de
cada paquete la realiza el compilador
2.2.5.3 SUPERSEGMENTADOS (superpipeline).

Un procesador supersegmentado es aquel que aplica dos veces el
concepto de segmentacin, la primera al nivel de diseo global, y
la segunda al nivel interno de sus unidades. Por ejemplo, una
segmentacin como la del Pentium, compuesta de etapas de
bsqueda, codificacin, lectura, ejecucin y escritura, deja abierta
la puerta a aplicar una nueva segmentacin sobre cada una de las
unidades funcionales que intervienen en cada ciclo: la cache de
instrucciones, el decodificador de instruccin, la cache de datos, la
ALU o el banco de registros, respectivamente.
2.2.5.4 FUNCIONALIDAD
La forma ms efectiva de mejorar el desempeo de los
microprocesadores es implementando tcnicas de hardware y
software que permitan la ejecucin de ms de una instruccin
en paralelo durante un slo ciclo de mquina. Las condiciones
necesarias para satisfacer lo expuesto son los principios de las
tcnicas de paralelismo. La cual establecen que dos procesos
P1 y P2 pueden ser ejecutados de manera paralela si, y slo si,
se cumplen las condiciones expuestas en la figura 1.5.
Figura 1.5 Condiciones de paralelismo
Todo proceso Pi requiere de parmetros de entrada, cuyo conjunto

denotaremos por Ii. Estos parmetros de entrada representan los
valores de las variables de entrada relacionadas al proceso. Sin estas
variables no es posible que el microprocesador realice su tarea
fundamental que es procesar datos. Adicionalmente, la ejecucin del
proceso genera valores de salida, los cuales son escritos en los
registros de propsito general del CPU, posiciones de memoria o
puertos. Estos valores corresponden a las variables de salida del
proceso Pi cuyo conjunto denotaremos por Oi. Esto implica que dos o
ms procesos pueden ser ejecutados en paralelo si y solo si el siguiente
grupo de variables de entrada y salida Ii y Oi no dependan entre s.
Cuando esto ocurre se dice que los procesos pueden ser ejecutados en
paralelo, lo cual se denota por P1||P2.
Con el fin de demostrar la funcin de los principios antes expuestos en
un
sistema
microprocesado,
analicemos el diagrama
de
interdependencia de instrucciones que se presenta en la figura 1.6.
Ejecucin secuencial y ejecucin paralela de instrucciones

Este diagrama de interdependencia de instrucciones consta de 5
instrucciones distribuidas de la siguiente manera:
P1 A = C * B
P2 D = A + E
P3 F = A + G
P4 A = H + D
P5 Y = C / E
Si asumimos que cada instruccin tiene un tiempo de ejecucin t, el
tiempo de ejecucin total del programa ejecutado de manera
secuencial es igual a 5t; y el tiempo de ejecucin del programa
aplicando los principios de paralelismo es de 3t.
Las instrucciones P1 || P5 y P5 || P2 pueden ser ejecutados en
paralelo. En cambio P1 y P2 no pueden ser ejecutados en paralelo ya
que A es la variable de salida del proceso P1 y la variable de entrada
del proceso P2.
Con este ejemplo hemos demostrado que el uso de las condiciones de
paralelismo antes expuestas nos sirve para incrementar el average de
ejecucin de instrucciones disminuyendo as el tiempo de ejecucin de
un programa.
2.2.5.5 Ventajas y Desventajas
Ventajas
Blinda a las empresas, instituciones y usuarios en general el

beneficio de la velocidad.
Ventaja competitiva, provee una mejora de los tiempos para
produccin de nuevos productos y servicios.
Desventajas
Requieren de un gran nmero de ciclos de procesamiento o

acceso a una gran cantidad de datos.
Encontrar un hardware y un software que permitan brindar
estas utilidades comnmente proporciona inconvenientes de
costos, seguridad y disponibilidad.
Mayor ancho del bus de datos desde memoria de
instrucciones.
Banco de registros con varios puertos de lectura/escritura.
Desperdicio de espacio de memoria por instrucciones VLIW

incompletas debido a dependencias.
2.3 MEMORIA CACHE

La memoria cach es una memoria pequea y rpida que se interpone
entre la CPU y la memoria principal para que el conjunto opere a mayor
velocidad. Para ello es necesario mantener en la cach aquellas zonas de
la memoria principal con mayor probabilidad de ser referenciadas.
Esto es posible gracias a la propiedad de localidad de referencia de los
programas.
2.3.1 Localidad de referencia: temporal y espacial
Los programas manifiestan una propiedad que se explota en el diseo

del sistema de gestin de memoria de los computadores en general y
de la memoria cach en particular, la localidad de referencias: los
programas tienden a reutilizar los datos e instrucciones que utilizaron
recientemente. Una regla emprica que se suele cumplir en la mayora
de los programas revela que gastan el 90% de su tiempo de ejecucin
sobre slo el 10% de su cdigo. Una consecuencia de la localidad de
referencia es que se puede predecir con razonable precisin las
instrucciones y datos que el programa utilizar en el futuro cercano a
partir del conocimiento de los accesos a memoria realizados en el
pasado reciente. La localidad de referencia se manifiesta en una doble
dimensin: temporal y espacial.
2.3.2 Localidad temporal:
Las palabras de memoria accedidas recientemente tienen una alta

probabilidad de volver a ser accedidas en el futuro cercano. La localidad
temporal de los programas viene motivada principalmente por la
existencia de bucles.
2.3.3 Localidad espacial:
Las palabras prximas en el espacio de memoria a las recientemente

referenciadas tienen una alta probabilidad de ser tambin referenciadas
en el futuro cercano. Es decir, que las palabras prximas en memoria

tienden a ser referenciadas juntas en el tiempo. La localidad espacial
viene motivada fundamentalmente por la linealidad de los programas
(secuenciamiento lineal de las instrucciones) y el acceso a las
estructuras de datos regulares.
Para implementar el mecanismo de actualizacin de la cach con los

datos con mayor probabilidad de ser referenciados se divide la memoria
principal en bloques de un nmero de bytes (4, 8,16 etc.) y la cach en
marcos de bloque o lneas de igual tamao. El bloque ser, pues, la
unidad de intercambio de informacin entre la memoria principal y la
cach, mientras que entre la cach y la CPU sigue siendo la palabra. El
directorio contiene la informacin de qu bloques de Mp se encuentran
ubicados en Mc
El funcionamiento de la memoria cach se puede resumir en el diagrama

de flujo de la siguiente figura. En l se describe el proceso de traduccin
de la direccin fsica procedente de la CPU (en el supuesto que el
procesador no disponga de memoria virtual o est desactivado) en el
dato ubicado en la posicin de memoria determinada por dicha direccin:
2.3.4 tipos de cache
A parte de la cach con respecto a la memoria RAM, en un PC existen

muchos otros sistemas de cach, como:
Memoria RAM como cach: Las unidades de almacenamiento

(discos duros, discos flexibles, etc.) y otros muchos perifricos
utilizan la memoria RAM como sistema de cach, una zona de la
RAM contiene la informacin que se ha buscado ltimamente en
dichos dispositivos, de forma que basta con acceder a la RAM para
recuperarla.
Disco duro como cach: Se emplea al disco duro como cach a

dispositivos an ms lentos (unidades CD-ROM). Estos sistemas de
cach suelen estar gobernados mediante software, que se suele
integrar en el sistema operativo. La cach de disco almacena
direcciones concretas de sectores, almacena una copia del directorio
y en algunos casos almacena porciones o extensiones del programa
o programas en ejecucin.
Los navegadores Web utilizan el disco duro como cach, al solicitar

una pgina Web, el navegador acude a Internet y comprueba la
fecha de la misma. Si la pgina no ha sido modificada, se toma
directamente del disco duro, con lo que la carga es muy rpida. En
caso contrario se descarga desde Internet y se actualiza la cach,
con un cierto tiempo de espera. En el caso de los navegadores Web,
el uso del disco duro es ms que suficiente, ya que es
extremadamente ms rpido que el acceso a Internet.
2.3.5 NIVELES DE CACHE

Los diferentes tipos de cach se organizan por niveles, formando una
jerarqua. En general se cumple que, a mayor cercana a la CPU, se
presenta mayor velocidad de acceso y menor capacidad de
almacenamiento.
A. CACH DE MEMORIA: De acuerdo a la ubicacin fsica que
tienen en el sistema se denominan o identifican por niveles:
I.
Nivel 1 (L1): Conocido como cach interno, es el nivel ms cercano

a la CPU (est en el mismo ncleo) con lo que el acceso se produce
a la velocidad de trabajo del procesador (la mxima velocidad).
Presenta un tamao muy reducido, en Intel (4 a 32 KB), en
VIA/Cyrix (1 a 64 KB), en AMD (8 a 128 KB).
II.
Nivel 2 (L2): Conocido como cach externo, inicialmente se

instalaba en la placa base (en el exterior de la CPU). A partir de los
procesadores Pentium 4 vienen incorporado en el procesador (no
precisamente en el ncleo). El nivel L2 apareci con el procesador
Pentium Pro, es una memoria ms lenta que L1, pero de mayor
capacidad. Los tamaos tpicos de la memoria cach L2 oscilan en
la actualidad entre 256 KB y 4 MB.
III.
Nivel 3 (L3): Se encuentra en algunas placas base, procesadores y

tarjetas de interfaz. El procesador de Intel Itanium trae contenida en
su cartucho al nivel L3 que soporta un tamao hasta de 4 MB, y el
Itanium 2 tolera hasta 6 MB de cach L3.
IV.
Nivel 4 (L4): Se encuentra ubicado en los perifricos y en algunos

procesadores como el Itanium.
B. Cach de memoria RAM:
La memoria principal RAM suele hacer de cach para los
dispositivos de almacenamiento y otros tipos de perifricos.
C. Cach en disco duro: Utilizadas por los navegadores Web y
algunos perifricos.
2.3.6 Elementos de diseo.
A la hora de disear un sistema de memoria cach hay que elegir

entre una serie de alternativas para cada uno de los siguientes
elementos de diseo:
Funcin de correspondencia: determina las posibles lneas de la
cach (marcos de bloque) en las que se puede ubicar un determinado
bloque de la memoria principal que ha sido referenciado por el

programa y hay que llevarlo a memoria cach.
Algoritmo de sustitucin: determina el bloque que hay que
desubicar de una lnea de la cach cuando sta est llena y hay que
ubicar un nuevo bloque.
Poltica de escritura: determina la forma de mantener la coherencia
entre memoria cach y memoria principal cuando se realizan
modificaciones (escrituras).
Poltica de bsqueda de bloques: determina la causa que
desencadena la llevada de un bloque a la cach (normalmente un fallo
en la referencia).
Cachs independientes para datos e instrucciones: frente a
cachs unificadas.
2.2.5 Funcin de correspondencia
Existen tres funciones de correspondencia para definir la posible
ubicacin de un bloque de memoria principal (Mp) en la memoria
cach (Mc): directa, asociativa y asociativa por conjuntos.
En el primer caso un bloque de Mp slo puede ubicarse en una lnea
de la cach, aquella que coincide con el bloque cuando superponemos
Mc sobre Mp respetando fronteras de Mc, es decir, sobre espacios de
Mp que son mltiplos del tamao de Mc.
En la correspondencia asociativa un bloque puede ubicarse en
cualquier lnea de Mc. Finalmente, la correspondencia asociativa por
conjuntos es un compromiso entre las dos anteriores.
2.4 MEMORIA FLASH
La memoria flash es una manera desarrollada de la memoria EEPROM que

permite que mltiples posiciones de memoria sean escritas o borradas en
una misma operacin de programacin mediante impulsos elctricos, frente a
las anteriores que slo permite escribir o borrar una nica celda cada vez
EPROM. Por ello, la memoria flash permite funcionar a velocidades muy
superiores cuando los sistemas emplean lectura y escritura en diferentes
puntos
a
la
vez.
Las
aplicaciones
ms
habituales
son:
-USB (adems del almacenamiento pueden incluir radio FM grabacin de
voz
-PC card(es un perifrico diseado para computadoras porttiles para
expandir la memoria aunque tambin es utilizado como: tarjeta de red,
sintonizador
de
TV,modem.)
-Tarjetas de memoria flash (sustituto del carrete en la fotografa digital.
2.4.1 tipos de memoria flash
Segn su formato:
2.4.1.1 Tarjetas de memoria:
Compact flash: CF es el tipo de memoria ms comn. Es la ms
barata aunque tambin la ms voluminosa.
Multimedia Card o MMC: Son ligeras y pequeas y su nica

desventaja es la poca resistencia en comparacin a las otras
tarjetas.
Tarjetas SD: Son la evolucin de las anteriores MMC
(multimedia card). Incluyen circuitos adicionales destinados a la
gestin de derechos digitales. Sus principales caractersticas
son su precio competitivo y su gran capacidad de
almacenamiento.
XD: Es un modelo que apareci en 2002. Son empleadas por
cmaras fotogrficas Fuji y Olympus. Su tamao es muy
reducido (como un sello pequeo) pero su precio es, junto con
las memory stick, el ms elevado.
Memory Stick: es la solucin de Sony para este tipo de
memorias. Tiene una forma alargada que la distingue
claramente del resto de formatos. Lleva incorporado un sistema
de control de derechos digitales.
Smart Media: Aproximadamente iguales en superficie a las
Compact Flash pero mucho ms delgadas. Tambin son
conocidas como SSFDC (Solid State Flash Digital Card). No
tienen mucha capacidad a precios razonables ya que su precio
aumenta demasiado para tarjetas de ms capacidad.
2.4.1.2 Pen drive:

Son dispositivos pensados para ser usados como discos duros
porttiles. Llevan una memoria flash en su interior y un conector
usb (la mayoria son USB 2.0) que nos permite conectarlos
directamente al ordenador. Son de reducido tamao lo que
permite llevarlos "encima" sin problemas. Se pueden usar de
llaveros ya que son bastante resistentes a cadas y golpes. La
ventaja de estos dispositivos es que se conectan directamente al
ordenador y no requieren instalacin de software adicional.
2.4.2 Segn su funcionamiento interno
Unas breves caractersticas de comparacin:

El tipo NOR permite una lectura y escritura ms lenta que NAND,
pero archiva muy rpido las rutas de acceso aleatorias. Esto hace
que NOR sea ms adecuado para la ejecucin y almacenamiento de
comandos, mientras que NAND

almacenamiento masivo de datos.
es
ms
indicado
para
el
En cuanto a la arquitectura, NAND puede almacenar ms datos en

un espacio de silicio ms pequeo, lo que ahorra el coste por bit. En
el pasado, cuando el almacenamiento de datos era ms bajo, NOR
tuvo mayor influencia en el mercado. Hoy, con el gran incremento de
la necesidad de guardar ms datos, el consumo de la electrnica y el
negocio de los dispositivos, NAND ha superado de lejos a NOR.
2.4.3 Caractersticas
Cabe destacar su gran resistencia a los golpes (no contiene partes
mviles).
De
bajo
consumo
y
muy
silencioso.
Reducido tamao (lo que nos permite introducirlo en dispositivos
porttiles) y muy ligero.
Funciona bajo temperaturas extremas (-25 hasta los 85).
En lo referente a defectos hay que mencionar que solo permite una
cantidad finita de escrituras y borrados (generalmente entre 10.000 y
un milln), dependiendo de la celda, la precisin y el voltaje
necesario para su borrado. Inicialmente almacenaban 8 MB, pero
actualmente almacenan ms de 64 GB, con una velocidad de hasta
20 MB/s.
Fabricada con puertas lgicas NOR y NAND para almacenar los 0s y

1s correspondientes.
Las tarjetas de memoria flash estn hechas de muchsimas celdas
microscpicas que acumulan electrones con diferentes voltajes a
medida que la electricidad pasa a travs de ellas, creando as un
mapa de diferentes cargas elctricas. De este modo la tarjeta logra
guardar la informacin que el usuario requiere. Mientras ms
compacta est distribuida su estructura, mayor informacin
almacena, y asimismo tambin aumentan los costos en la fabricacin
de estos dispositivos.
Los sistemas de archivos estn en desarrollo, aunque en la prctica

el ms utilizado es el FAT (por compatibilidad).
Para comparar estos tipos de memoria se consideran los diferentes

aspectos de las memorias:
La densidad de almacenamiento de los chips es actualmente bastante

mayor en las memorias NAND.
El coste de NOR es mucho mayor.
El acceso NOR es aleatorio para lectura y orientado a bloques para su
modificacin. Sin embargo, NAND ofrece tan solo acceso directo para
los bloques y lectura secuencial dentro de los mismos.
En la escritura de NOR podemos llegar a modificar un solo bit. Esto
destaca con la limitada reprogramacin de las NAND que deben
modificar bloques o palabras completas.
La velocidad de lectura es muy superior en NOR (50-100 ns) frente a
NAND (10 s de la bsqueda de la pgina + 50 ns por byte).
-La velocidad de escritura para NOR es de 5 s por byte frente a 200 s
por pgina en NAND.
La velocidad de borrado para NOR es de 1 s por bloque de 64 KB frente
a los 2 ms por bloque de 16 KB en NAND.
La fiabilidad de los dispositivos basados en NOR es realmente muy alta,
es relativamente inmune a la corrupcin de datos y tampoco tiene
bloques errneos frente a la escasa fiabilidad de los sistemas NAND
que requieren correccin de datos y existe la posibilidad de que queden
bloques marcados como errneos e inservibles.
2.4.4 Memorias flash en la actualidad

La compaa SandDisk a lanzo su nueva lnea de memorias flash
NAND con una capacidad de 64Gb el doble de lo que hasta ahora
estaban utilizando. Esta nueva lnea de memorias flash ha sido
bautizada como SandDisk X3 que ofrece un mayor redimiento
energtico, son ms robustas y en un tamao ms reducido

(1620x1.4mm).
Aunque otras empresas como Samsung y Toshiba ya tenan en el
mercado memorias de este tamao, la diferencia es que con la nueva
tecnolgia X3 permite cargar el cdigo y sistema operativo de un
mvil.
Kingston es la compaa que en la actualidad tiene en el mercado la
memoria flash usb con mayor capacidad (256Gb), aunque tiene un
precio muy elevado.
Futuro de las memorias flash
Las empresas de semiconductores intentan constantemente
incrementar tanto la capacidad como la velocidad de estas memorias
Lo que actualmente se est tratando de desarrollar tendr lugar en
gran medida gracias al nuevo puerto Usb 3.0 con un consumo ms
bajo y una velocidad 10 veces mayor.
El USB 3.0., que fue presentado en 2008 .La compatibilidad entre USB
2.0 y USB 3.0 es posible, gracias al uso de conectores similares,
cuyos contactos adicionales se sitan en paralelo, de forma que no
afectan en caso de usar algn puerto que no sea del mismo tipo.
2.5 Memoria RAM

La memoria principal o RAM (acrnimo de Random Access Memory,
Memoria de Acceso Aleatorio) es donde el ordenador guarda los datos que
est utilizando en el momento presente. Se llama de acceso aleatorio
porque el procesador accede a la informacin que est en la memoria en
cualquier punto sin tener que acceder a la informacin anterior y posterior.
Es la memoria que se actualiza constantemente mientras el ordenador est
en uso y que pierde sus datos cuando el ordenador se apaga.
Cuando las aplicaciones se ejecutan, primeramente deben ser cargadas en

memoria RAM. El procesador entonces efecta accesos a dicha memoria
para cargar instrucciones y enviar o recoger datos. Reducir el tiempo
necesario para acceder a la memoria, ayuda a mejorar las prestaciones del
sistema. La diferencia entre la RAM y otros tipos de memoria de
almacenamiento, como los disquetes o discos duros, es que la RAM es
mucho ms rpida, y se borra al apagar el ordenador.
Es una memoria dinmica, lo que indica la necesidad de recordar los
datos a la memoria cada pequeo periodo de tiempo, para impedir que esta
pierda la informacin. Eso se llama Refresco. Cuando se pierde la
alimentacin, la memoria pierde todos los datos. Random Access, acceso
aleatorio, indica que cada posicin de memoria puede ser leda o escrita en
cualquier orden. Lo contrario sera el acceso secuencial, en el cual los datos
tienen que ser ledos o escritos en un orden predeterminado.
Las memorias poseen la ventaja de contar con una mayor velocidad, mayor
capacidad de almacenamiento y un menor consumo. En contra partida,
presentan el inconveniente de que precisan una electrnica especial para
su utilizacin, la funcin de esta electrnica es generar el refresco de la
memoria. La necesidad de los refrescos de las memorias dinmicas se
debe al funcionamiento de las mismas, ya que este se basa en generar
durante un tiempo la informacin que contiene. Transcurrido este lapso, la
seal que contena la clula biestable se va perdiendo. Para que no ocurra
est perdida, es necesario que antes que transcurra el tiempo mximo que
la memoria puede mantener la seal se realice una lectura del valor que
tiene y se recargue la misma.
Es preciso considerar que a cada bit de la memoria le corresponde un

pequeo condensador al que le aplicamos una pequea carga elctrica y
que mantienen durante un tiempo en funcin de la constante de descarga.
Generalmente el refresco de memoria se realiza cclicamente y cuando
est trabajando el DMA. El refresco de la memoria en modo normal est a
cargo del controlador del canal que tambin cumple la funcin de optimizar
el tiempo requerido para la operacin del refresco. Posiblemente, en ms
de una ocasin en el ordenador aparecen errores de en la memoria debido
a que las memorias que se estn utilizando son de una velocidad
inadecuada que se descargan antes de poder ser refrescadas.
Las posiciones de memoria estn organizadas en filas y en columnas.
Cuando se quiere acceder a la RAM se debe empezar especificando la fila,
despus la columna y por ltimo se debe indicar si deseamos escribir o leer
en esa posicin. En ese momento la RAM coloca los datos de esa posicin
en la salida, si el acceso es de lectura o coge los datos y los almacena en la
posicin seleccionada, si el acceso es de escritura.
La cantidad de memoria Ram de nuestro sistema afecta notablemente a las
prestaciones, fundamentalmente cuando se emplean sistemas operativos
actuales. En general, y sobre todo cuando se ejecutan mltiples
aplicaciones, puede que la demanda de memoria sea superior a la
realmente existente, con lo que el sistema operativo fuerza al procesador a
simular dicha memoria con el disco duro (memoria virtual). Una buena
inversin para aumentar las prestaciones ser por tanto poner la mayor
cantidad de RAM posible, con lo que minimizaremos los accesos al disco
duro.
Los sistemas avanzados emplean RAM entrelazada, que reduce los
tiempos de acceso mediante la segmentacin de la memoria del sistema en
dos bancos coordinados.
Durante una solicitud particular, un banco suministra la informacin al
procesador, mientras que el otro prepara datos para el siguiente ciclo; en el
siguiente acceso, se intercambian los papeles.
Los mdulos habituales que se encuentran en el mercado, tienen unos
tiempos de acceso de 60 y 70 ns (aquellos de tiempos superiores deben ser
desechados por lentos).
Es conveniente que todos los bancos de memoria estn constituidos por
mdulos con el mismo tiempo de acceso y a ser posible de 60 ns.
2.5.1 Tipos de memoria RAM
La memoria de acceso aleatorio (RAM) es la memoria primaria de la

computadora, en la que se puede leer y escribir informacin en todo
momento, pero que pierde informacin sino tiene alimentacin
elctrica.
Extended Data Out Random Access Memory, llamada memoria

de acceso aleatorio con salida de datos extendida. Es tecnologa
opcional en las memorias RAM utilizadas en servidores. Permite
acortar el camino de la transferencia de datos entre la memoria y el
microprocesador.
Burts EDO Random Access Memory, denominada memoria de

acceso aleatorio con salida de datos extendida y acceso Burst. Es
tecnologa opcional. Es una memoria como la anterior que mejora su
velocidad gracias a acceder a direcciones inmediatas de memoria sin
latencias.
Dinamic Random Access Memory, designada memoria dinmica

de acceso aleatorio. Es la memoria ms comn y econmica. Est
constituida por capacitores, esto hace que necesiten refrescar el dato
que tengan almacenado, haciendo el proceso en parte lento.
Synchronous Dinamic Random Access Memory, nombrada

memoria dinmica de acceso aleatorio. Es tecnologa DRAM que
utiliza un reloj para sincronizar con el microprocesador la entrada y
salida de datos en la memoria de un chip.
Fast Page Mode Dinamic Random Access Memory, llamada

memoria dinmica de paginacin de acceso aleatorio. Es tecnologa
opcional en las memorias RAM utilizadas en servidores, que permite
aumentar el rendimiento a las direcciones mediante pginas.
Rambus DRAM denominada memoria dinmica de acceso aleatorio

para tecnologa Rambus. Es una memoria DRAM de alta velocidad
que se desarrolla pro procesadores con velocidad superior a 1 GHZ.
Static Random Access Memory designada memoria esttica de

acceso aleatorio. Es una memoria muy veloz. Se construye con
transistores que no necesitan proceso de refresco de datos.
Actualmente se encuentra integrada dentro de microprocesadores y
discos
duros
para
hacerlos
ms
eficientes.
2.6 Open hardware

2.6.1 Fundamento terico
En la Informtica, se denomina hardware o soporte fsico al conjunto
de elementos materiales que componen un computador. Hardware
tambin son los componentes fsicos de una computadora tales como
el disco duro, dispositivo de CD-ROM, disquetera, etc. El hardware se
refiere a lo que es tangible, es decir todos los componentes fsicos
(que se pueden tocar) de la computadora. El software libre y cdigo
abierto ofrece al usuario libertades. Existen licencias que las
garantizan y que dan una cobertura legal, como por ejemplo la GNU
GPL. El hardware abierto o libre toma estas mismas ideas del
software libre y cdigo abierto para aplicarlas en su campo.
2.6.2 Concepto de Hardware Libre

A la sombra del crecimiento del software libre, ha aparecido en los
ltimos aos el llamado hardware libre. Su objetivo es crear diseos
de aparatos informticos de forma abierta, de manera que todas las
personas puedan acceder, como mnimo, a los planos de construccin
de los dispositivos. Lejos de ser una novedad, esta corriente enlaza
directamente con dcada de los aos 70, cuando los primeros
aficionados a los ordenadores construan sus propios equipos en los
garajes con piezas compradas a diferentes fabricantes y creaban sus
propias implementaciones.
Por Antonio Delgado en Pgina Digital
HA (Hardware Abierto) Segn www.microbotica.es
El asentamiento de los Lenguajes de Descripcin Hardware (HDL)

como VHDL (Very high speed integrated circuit Hardware Description
Language) o Verilog HDL, ha impulsado la idea de realizar diseos
abiertos de la misma manera que el movimiento Open Source. La
reutilizacin de diseos (cores) o la adaptacin de los ya existentes
est haciendo mucho ms fcil la vida de los ingenieros de hardware,
disminuyendo considerablemente los tiempos y costes de diseo
2.6.3 Clasificacin del Hardware
Dada su diferente naturaleza, al hablar de hardware abierto o libre hay

que especificar de qu tipo de hardware se est hablando. A
continuacin se describen cada uno de los diferentes hardware segn
su naturaleza:
2.6.3.1 Hardware esttico
Entendemos por hardware esttico el conjunto de elementos materiales
de un sistema electrnico no reconfigurable. Este tipo de hardware se
caracteriza por ser fsicamente nico, es decir, o poseemos el circuito o
no. Se caracteriza por estar limitado por su propia existencia fsica. No
podemos copiarlo con facilidad ni distribuirlo abierto. Sin embargo, lo
que s se puede hacer es distribuir sus planos de fabricacin, o bien a
nivel de circuito impreso (PCB) o bien a nivel de fichero de fabricacin
(GERBER). Cualquiera de estas dos informaciones es suficiente para
permitir a terceros la fabricacin del circuito como su modificacin y
posible mejora.
2.6.3.2 Planos en electrnica
Existen tres tipos de planos, o de ficheros, que describen nuestro

diseo:
Esquemtico: Indica los componentes lgicos y las seales que se

conectan entre ellos, pero no nos dice nada de cmo es fsicamente la
placa.
Circuito Impreso (PCB, Printed Circuit Board). Indica el lugar fsico en
el que situar los componentes, sus dimensiones, encapsulados y qu
caminos siguen las pistas para unir sus pines. Nos describe con detalle
cmo es fsicamente la placa y las dimensiones que tiene.
Fichero de fabricacin (GERBER). Contiene toda la informacin
necesaria para que se puedan fabricar los PCBs en la industria. Este es
un fichero para las mquinas. (Sera algo similar a lo que es el formato
Postcript para las impresoras). Para disear la placa usamos los
esquemticos y el PCB. El fichero GERBER es el que obtenemos como
resultado y nos permite realizar una fabricacin industrial de nuestro
PCB. Este fichero puede no haberlo generado el diseador. A veces es
el propio fabricante el que lo genera, a partir de la informacin que hay
en el PCB.
Propuesta de definicin
Teniendo en cuenta los tres planos que necesitamos en electrnica,
podemos definir el hardware abierto de la siguiente manera:
Un diseo se considera hardware abierto si ofrece las 4 libertades del
software libre en el esquemtico, PCB y fichero para la fabricacin (este
ltimo puede no estar disponible).
2.6.3.3 Hardware reconfigurable
El hardware reconfigurable es aqul que viene descrito mediante un
lenguaje HDL (Hardware Description Language). Su naturaleza es
completamente diferente a la del hardware esttico. Se desarrolla de
una manera muy similar a como se hace con el software. Ahora los
diseos son ficheros de texto, que contienen el ``cdigo fuente''. Se les
puede aplicar directamente una licencia libre, como la GPL.
Lenguaje de descripcin de hardware
Un lenguaje de descripcin de hardware (HDL, Hardware Description
Language) permite documentar las interconexiones y el comportamiento
de un circuito electrnico, sin utilizar diagramas esquemticos.
El flujo de diseo suele ser tpico:
a- Definir la tarea o tareas que tiene que hacer el circuito.

b- Escribir el programa usando un lenguaje HDL. Tambin existen
programas de captura de esquemas que pueden hacer esto, pero no
son tiles para diseos complicados.
c- Comprobacin de la sintaxis y simulacin del programa.
d- Programacin del dispositivo y comprobacin del funcionamiento.

Un rasgo comn a estos lenguajes suele ser la independencia del
hardware y la modularidad o jerarqua, es decir, una vez hecho un
diseo ste puede ser usado dentro de otro diseo ms complicado y
con otro dispositivo compatible. Uno de los lenguajes utilzados es VHDL
y otro que GNU es GHDL.
2.6.3.4 Hardware reconfigurable libre
El hardware reconfigurable se puede compartir exactamente igual que
el software. Las caractersticas que tiene son:
Se pueden ofrecer las 4 mismas libertades del software libre a los
ficheros en HDL. Por ejemplo distribuyndolos bajo licencia GPL.
Aparecen comunidades hardware que comparten informacin, como
OpenCores y OpenCollector Se pueden crear repositorios hardware, lo
que permite que muchas personas puedan participar en el desarrollo.
Pueden aparecer distribuciones que recopilen todo el hardware libre
existente.
De igual forma que para ejecutar el software necesitamos un mquina
que tenga un procesador, para probar nuestro hardware necesitamos
una plataforma con una FPGA en la que ``descargar'' los diseos (un
hardware esttico).
Ejemplos de open hardware
USRP
Tambin conocido como Universal Software Radio Peripheral, es una
placa diseada especficamente para fabricar sistemas de radio
basados en software. Por su naturaleza abierta y libre, tanto los
esquemas como el software necesario para su funcionamiento estn
disponibles, pero un punto extra a favor del USRP es su enorme nivel
de flexibilidad. Los desarrolladores pueden incluso crear sus propias
placas de extensin para el USRP, alterando sus propiedades o
agregando funciones especficas que no estn contempladas en el
diseo original. El USRP tiene dos versiones, pero ambas son
desarrolladas en paralelo. Este es un buen ejemplo de hardware abierto
y con venta al pblico.
Openmoko
Ha sido un poco ms meditico que otros proyectos debido a su
objetivo de crear telfonos mviles de cdigo abierto, lo cual
obviamente incluye tanto el hardware (a pesar de las restricciones en
algunos pases, en relacin con la telefona mvil), como el sistema
operativo. Se planearon varios diseos, pero el nico que realmente
vio la luz fue el Neo FreeRunner en junio de 2008. En 2009 se
anunci la cancelacin de todos los mviles futuros, pero cabe
destacar que Openmoko ofrece un nivel de flexibilidad que an hoy
no ha sido igualado por ningn fabricante: Hablamos de cambiar por
completo el sistema operativo a un mvil. Ya existen versiones
modificadas de Android para su instalacin en el Neo FreeRunner, y
se espera que Openmoko siga involucrado con los telfonos mviles.
El FreeRunner tiene un precio de mercado de 260 , y todava hay
unidades disponibles.
Raspberry Pi
Placa de bajo coste diseada en Reino Unido para la enseanza de
sistemas de computacin en las escuelas. Basado en una CPU de la
familia ARM11. Desde su lanzamiento en el 2012 ha recibido cientos
de miles de peticiones. Soporta como sistema operativo
distribuciones basadas en Linux.
BeagleBoard
Basada en una CPU de la familia ARM8, producida por Texas
Instruments en asociacin con el distribuidor de componentes
americano Digi-key. Como sistema operativo puede utilizar Linux,
Symbian, Risc OS e incluso Android.
2.6.4 Desventajas y Problemas del hardware abierto
Un diseo fsico es nico. Si yo construyo una placa, es nica. Para que

otra persona la pueda usar, bien le dejo la ma o bien se tiene que
construir una igual. La comparticin tal cual la conocemos en el mundo
del software NO ES POSIBLE.
El Compartir tiene asociado un coste. La persona que quiera utilizar el
hardware que yo he diseado, primero lo tiene que fabricar, para lo cual
tendr que comprobar los componentes necesarios, construir el diseo
y verificar que se ha hecho correctamente. Todos esto tiene un coste.
Disponibilidad de los componentes. Estn disponibles los chips?. Al

intentar fabricar un diseo nos podemos encontrar con el problema de
la falta de material. En un pas puede no haber problema, pero en otro
puede que no se encuentran.
2.7 CPU
Central Proccessing Unit(unidad de proceso central) .Es la parte central de
toda computadora ya que es la que cumple la tarea de procesamiento de
todas las funciones as como tambin almacenamiento de informacin. Es
un circuito electrnico que ah existido desde siempre en las computadoras
ya sea de cualquier marca de ah que es uno de los elementos bsicos de
las computadoras. La CPU se ocupa del control y el proceso de datos en
los ordenadores.
Es denominado el cerebro de todo sistema informtico. Toda accin
realizada por la computadora en algn momento pasa por la CPU.
Actualidad: El microprocesador. En este trabajo no ahondaremos mucho
sobre los procesadores ya que en un trabajo hablamos ampliamente sobre
ellos.
2.6.1 MICROPROCESADORES
Es un circuito integrado a muy gran escala de integracin que contiene
muchos circuitos digitales que realizan funciones aritmticas, lgicas,
de comunicacin y control.
Fig.1 Diagrama de bloques

Los microprocesadores son dispositivos digitales diseados para
manipular informacin y tiene de 3 buses como muestra la figura 1.
Bus de datos: Contiene el flujo de informacin

Bus de direcciones: Controla la posicin actual en memoria.
Bus de Control: Regula el flujo de informacin.
2.6.2 PARTES:
2.6.2.1 UNIDAD LGICA ARITMTICA (ALU)
Formada por una serie de circuitos electrnicos que son capaces de
efectuar operaciones aritmticas, lgicas y de corrimiento.
2.6.2.2 UNIDAD DE CONTROL (UC)
Para efectuar una tarea la UC necesita conocer instrucciones e
informaciones adicionales que deberan tener en cuenta para coordinar
la ejecucin de las instrucciones. La unidad de control esta formada por
un elemento que interpreta las instrucciones (Decodificacin) y varios
elementos denominados registros.
2.6.2.3 REGISTROS
Contiene los indicadores de estado que son una serie de bits que se
modifican segn el resultado de las operaciones aritmticas o lgicas, y
se guardan en un registro, para posteriormente la UC las considere
para tomar una decisin.
2.6.3 PRINCIPALES EMPRESAS QUE APORTAN A ESTA TECNOLOGA

Las principales son Intel, AMD, Motorola, etc. una rivalidad entre ellos
que surge desde hace un poco ms de 40 aos con el primer
microprocesador diseado por Intel.
2.6.3.1 Intel
Es una corporacin fundada en 1968, diseo el primer microprocesador
para computador en 1971 y se ha mantenido a la vanguardia en el
desarrollo de las tecnologas que habilitan el mundo en el que vivimos.
Fig.2
A continuacin la evolucin del microprocesador Intel
Procesadores de oficina
Revolucionan la experiencia informtica. Las PC ofrecen un
desempeo asombroso para la mayor parte de las interacciones
inmersitas y elegantes con nuevos diseos para una informtica de
escritorio en cualquier lugar. En el trabajo o en el hogar, algunas
experiencias son sencillamente mejores en un equipo de escritorio.
Un ejemplo de ello son los procesadores de la lnea core i3,i5,i7.
Procesadores de tercera generacin con chipsets Intel

Fabricados con la tecnologa de procesos de 22 nanmetros lder de
la industria con transistores 3-D Tri-gate, los procesadores Intel
Core de tercera generacin ofrecen un mejor rendimiento de
cmputo, de medios integrados y grficos que la generacin anterior,
con compatibilidad para las tecnologas de E/S de la prxima
generacin
Procesador Intel Core i3

Cuenta con tecnologa ECC, tecnologa Intel SpeedStep mejorada,
tecnologa Intel HT, IA-64, bit de desactivacin de ejecucin, tiene
una velocidad de reloj de cache de 3 MB, 3.30 GHz, consume unos
55W, compatible con memorias DDR3

Al igual que el core i3 este cuenta con Intel AES-NI, tecnologa Intel
SpeedStep mejorada, IA-64, tecnologa Intel Turbo Boost, Intel TXT,
tecnologa Intel vPro, Intel VT-d, bit de desactivacin de ejecucin,
cuenta con una velocidad de reloj y cache de 6 MB, hasta 3,70 GHz
consume unos 65w, compatible con DDR3.
Cuenta con nuevas instrucciones de Intel AES, tecnologa Intel
SpeedStep mejorada, tecnologa Hyper-Threading Intel, IA-64,
tecnologa Intel Turbo Boost, tecnologa Intel Trusted Execution,
Intel vPro, tecnologa de virtualizacin Intel para E/S dirigida, bit
de desactivacin de ejecucin, cuenta con una velocidad de reloj y
cache de 8 MB, hasta 3,09 GHz consume unos 77w, compatible con
DDR3.
PROCESADORES EMPRESARIALES
Las empresas se enfrentan hoy a mltiples desafos cada da. Y la
tecnologa se ha transformado en un socio estratgico que las
compaas deben alinear con sus necesidades y encontrar en ellas el
apoyo indudable y fundamental que estas aportan. La nueva familia de
procesadores da tiene que tener un gran desempeo, seguridad y
control, tres factores vitales que las empresas deben saber gestionar a
todo nivel y no pueden permitirse dejar al azar. Algunos procesadores
empresariales son:
Xenon:
Su finalidad principal es, segn Intel, ser utilizados en servidores de
pequeas empresas que no tengan una enorme carga de trabajo que
soportar. Son sencillos y cuentan con algunas caractersticas de los
ms mayores, como por ejemplo soporte para memorias ECC, sistemas
de seguridad y redundancia en los datos o buen rendimiento en tareas
de virtualizacin. En todos los casos incluyen GPU algunas
caractersticas son:
Cuentan entre 2 a 8 ncleos (varia en el modelo a escoger)
Tinen un tdp que varia en los modelos basicoa 55w a los modelos de 8
nucleos con 135w
Tamao de memoria mximo (depende del tipo de memoria) 843 gb
Versin de la tecnologa Intel Turbo Boost

2.0, Tecnologa Intel
vPro, Tecnologa Hyper-Threading Intel, Tecnologa de virtualizacin
Intel, Tecnologa de virtualizacin Intel para E/S dirigida (VT-d), Intel
VT-x con tablas de pginas extendidas (EPT), Tecnologa Intel
SpeedStep mejorada, Tecnologas de monitoreo trmic, Tecnologa
Intel Identity Protection
2.6.3.2 Procesadores AMD

AMD es un proveedor mundial de circuitos integrados para
computadores personales y de redes y para los mercados de las
comunicaciones. AMD produce procesadores, memorias relmpago,
dispositivos de lgica programable, y productos para comunicaciones y
aplicaciones de redes. Fundada en 1969 y localizada en Sunnyvale,
California,
Opteron
Cuando las cargas de trabajo exigen ampliar los lmites de tu centro de
datos, suprelas con los procesadores AMD Opteron serie 6300
creados para brindar el rendimiento que necesita y por el precio que
desea.
Caractersticas:
Mayor rendimiento y mayor rendimiento watt que la generacin anterior

Mismas bandas de potencia y caractersticas de ahorro de energa
Compatible con ranura
Hasta 16 ncleos dentro del mismo paquete, 1MB de cach L2 por
ncleo (con hasta 16MB de cach L2 por ranura) y cach L3 compartido
de 16MB por ranura
Tecnologa Turbo CORE de AMD
2.6.3.3 Comparativa de Marcas
AMD vs Intel
INTEL: A nivel econmico este resulta ser ms costoso pero de muy
buena calidad, sus dos procesadores son matemticos, por lo cual para
navegar o trabajar con el PC es ms rpido. La tecnologa INTEL se
basa ms que todo en el rendimiento de programas y capacidades
empresariales para poder manejar gran cantidad de datos y

procesarlos.
AMD: Resulta ser ms econmico, tiene varias versiones o series

distintas, tiene un procesador matemtico y uno grfico, por lo cual es
mejor para jugar, programas de diseo grfico (arquitectos, etc.). No es
la misma calidad que el Intel, pero es muy difcil que te vaya a fallar
Intel es un buen procesador, usualmente es bastante rpido y
poderoso.
AMD tambin es un buen procesador, la diferencia es que el AMD es
ms fcil de acelerar (hacerlo correr ms rpido de lo que debera
Ventajas de usar AMD
Son procesadores muy baratos, con un muy buen rendimiento

Son los mejores para gamers.
Tienen mejor manejo en grficos.
2.7 Unidad de coma flotante (FPU).

Una unidad de coma flotante o tambin conocido como co-procesador
matemtico, es un componente de la unidad central de procesamiento
especializado en el clculo de operaciones en coma flotante. Las
operaciones bsicas que toda FPU puede realizar son la suma y
multiplicacin usuales, si bien algunos sistemas ms complejos son capaces
tambin de realizar clculos trigonomtricos o exponenciales.
No todas las unidades centrales de procesamiento tienen una FPU dedicada.

En ausencia de FPU, la CPU puede utilizar programas en micro cdigo para
emular una funcin en coma flotante a travs de la unidad aritmtica lgica
(ALU), la cual reduce el coste del hardware a cambio de una sensible prdida
de velocidad.
En algunas arquitecturas, las operaciones en coma flotante se tratan de
forma completamente distinta a las operaciones enteras, con registros
dedicados y tiempo de ciclo diferentes. Incluso para operaciones complejas,
como la divisin, podran tener un circuito dedicado a dicha operacin.
Hasta mediados de la dcada de 1990, era comn que las CPU no
incorporasen una FPU en los ordenadores domsticos, sino que eran un
elemento opcional conocido como co-procesador.
El hardware de punto flotante se populariz al comenzar a ser de utilidad
hacia 1957 en el que en 1976 John F. Palmer en Intel comienza el desarrollo
de una aritmtica de punto flotante para toda la lnea de productos de Intel.
La aparicin del 8086 era inminente, y se estaba contemplando la opcin de
incorporar un coprocesador de punto flotante, el 8087, para el 8086. El
coprocesador era un chip adicional que aceleraba una parte del trabajo del
procesador, en este caso los clculos en punto flotantes
2.8 GPU
Se puede definir de manera sencilla como un coprocesador; un componente
muy parecido al CPU, solo que se dedica al tipo de procesamiento de
grficos y de esta manera aligera la carga de informacin que debe ser
procesada en la unidad central, para que haga su trabajo de manera ms
eficiente.
Las GPU son construidas para ser muy eficientes en el clculo de
informacin grfica.
2.8.1 TIPOS
Se distinguen 3 tipos de unidades de procesamiento grfico:
Tarjetas dedicadas: Son las que proporcionan mayor potencia. Es

aquella que se integra a la placa madre mediante un puerto aparte. Su
principal caracterstica es que tiene una RAW independiente que solo
es utilizada por el GPU.
Integrados grficos: Utilizan la memoria del sistema para realizar sus

funciones; es muy comn usar esto en los ordenadores modernos.
Tanto Intel como AMD las integran en sus procesadores.
Hibridas: Diseadas para precios bajos y niveles de potencias
adecuados. Tambin comparten la memoria del sistema, pero integran
una cantidad limitada de memoria propia que se encarga de las
labores inmediatas. Suelen estar en ordenadores porttiles.
Una de las primeras tarjetas grficas fue el iSBX 275 de Intel, que
lleg al mercado en 1983, y se basaba en el controlador 82720 GDC
de la firma. Y sera la mtica Commodore Amiga uno de los primeros
ordenadores en contar con su propia GPU, en 1985. Ya para 1986
Texas Instruments haba logrado desarrollar un procesador con
capacidades de procesamiento grfico incluidas, un precursor de los
SoC que actualmente se usan en la industria.
Durante los aos 90, las funciones cumplidas por las GPU se
incrementaron al ritmo en que crecan sus capacidades, as fue como
al principio las grficas se encargaron del renderizado de grficos 2D,
y posteriormente adquirieron una funcin fundamental con el auge de
los grficos 3D. Fue por esta poca cuando las GPU comenzaron a
ser vistas como un componente obligatorio de las consolas,
especialmente despus de lo que supusieron para los grficos de la
PlayStation original y la Nintendo 64.
2.8.2 Arquitectura moderna de GPU
La Figura se muestra la arquitectura tpica de una GPU actual. Est
compuesta por un nmero escalable de multiprocesadores paralelos
(SMs). Estos multiprocesadores se agrupan de tres en tres (o de dos
en dos en arquitecturas ms antiguas) en lo que se llama Cluster de
Procesado de Hilos (TPC). El nmero de SMs vara desde las

arquitecturas ms antiguas (1), hasta las ms modernas y de mayor
gama (30)
Figura: Arquitectura GPU moderna

El diseo interno de cada SM es similar para todas las versiones, cada
SM cuenta con 8 procesadores escalares (SPs), lo que hace un total
de 240 (30*8) procesadores en las tarjetas ms modernas; 2 Unidades
Especiales de Funcin (SFUs), capaces de realizar operaciones en
punto flotante como SQRT y RCP SQRT, asi como otras operaciones
importantes. Tambin cuenta con una unidad de multiplicacin y suma
(MAD) y una unidad adicional de multiplicacin (MUL). Los ocho
procesadores de un multiprocesador comparten la unidad de
bsqueda y lanzamiento de instrucciones de forma que se ejecuta la
misma instruccin al mismo tiempo en los ocho procesadores. Todas
estas unidades funcionan a 135 gigahercios (GHz), esto son 933
GFLOPS de pico de computo.
A nivel global, la tarjeta grafica cuenta hasta con 4 gigabytes (GB) de
memoria DRAM off-chip. En las aplicaciones graficas, esta memoria
almacena imgenes de video, texturas para renderizados 3D, etc.
Pero como procesador de propsito general, se comporta como una
cache off-chip con un elevado ancho de banda (hasta 141 GB/s),
aunque con una latencia superior a la cache convencional o el sistema
de memoria. Si el chip se programa de forma adecuada, el elevado
ancho de banda compensa esta mayor latencia en los accesos.
Actualmente la comunicacin de la GPU con la CPU se realiza a

travs de un bus PCI-Express. Dicho bus consta de dos vas (una de
envo y otra de recepcin). El ancho de banda de cada via es de 128
GB/s, lo que suma un total terico de 255 GB/s para la comunicacin
con la CPU. Combinando el ancho de ambas vas se obtienen los 255
GB/s, pero en la practica no se envan y reciben datos al mismo
tiempo. Esta diferencia de ancho de banda entre la GPU-memoria
GPU (141 GB/s) y GPU-memoria principal (128 GB/s) puede parecer
una limitacin, pero el ancho de banda PCI-Express es comparable al
ancho de banda del Front-Side Bus (FSB) entre la CPU y el sistema
de memoria principal, as que en realidad no es tal limitacin.
2.8.3 Comparativa entre fabricantes:
Tarjetas de grficos AMD La serie Radeon es una familia de tarjetas
grficas del fabricante de hardware AMD. Previstas para salir al
mercado en el primer trimestre de 2012 incorporan una serie de nuevas
tecnologas con respecto a las anteriores generaciones de tarjetas
grficas que las hacen muy interesantes.
2.8.3.4
Ati Radeon
ATI Technologies Inc. fue una de las super empresas de hardware que
diseaba GPU y tarjetas grficas, fue comprada por AMD en el ao
2006 pero mantuvo su nombre para algunos productos hasta la salida
de la serie Radeon HD 6000 en el 2010. Su mercado acapar todo tipo
de productos para el procesamiento grfico y multimedia, tanto para
computadoras personales, como para dispositivos porttiles,
videoconsolas, telfonos mviles y televisin digital. Su fundacin data
del 20 de agosto de 1985 (ATI). A la empresa se le ha conocido por
varios nombres. Se fund llamndose Array Technology Inc., pero
durante los primeros 5 meses se le cambi a Array Technologies Inc., el
18 de diciembre de 1985 pas a llamarse ATI Technologies Inc., y
definitivamente pas a ser parte de AMD el 25 de octubre de 2006.
Algunas caractersticas que ofrece Ati
Arquitectura GCN
Diseada para permitir un rendimiento sorprendente y una calidad de

imagen superior, convirtindose en la eleccin principal de los
jugadores que esperan lo mejor.
Memoria de ancho de banda alto (HBM)

El rendimiento revolucionario requiere un ancho de banda alto. La
ltima innovacin de AMD ofrece ms de tres veces el ancho de banda
por vatio en comparacin con GDDR5 junto con una interfaz de
memoria de 4096 bits para nuevos avances increbles en potencia y
eficiencia.
Juegos extremos con resolucin de 4K

Deja atrs la alta definicin y optimiza la configuracin del juego a
1440p, o pasa directamente a ultra-HD 4K para juegos extremos.
Virtual Super Resolution (VSR)

Obtn una calidad que compite con 4K, incluso en una pantalla de
1080p mientras juegas tus juegos favoritos AAA o en lnea gracias a
VSR de AMD.
Tecnologa AMD FreeSync

La tecnologa AMD FreeSync termina con el juego fragmentado y los
cuadros interrumpidos con un rendimiento fluido, libre de artefactos, a
cualquier velocidad de cuadros prcticamente.5
API DirectX 12, Vulkan y OpenGL 4.5

Lista para el combate con un rendimiento optimizado para las API de
ltima generacin (DirectX 12, Vulkan, OpenGL 4.5, Mantle) y
diseada desde el comienzo para brindarte todo lo que necesitas para
disfrutar los ltimos juegos, hoy y maana.6,7,8
Tecnologa LiquidVR de AMD

Escapa a un reino similar a la realidad de presencia ultra inmersiva de
realidad virtual y experimenta el rendimiento visual sin interrupciones,
altas velocidades de cuadro y latencia y retraso reducidos de la
tecnologa AMD LiquidVR con la GPU mltiple Affinity.
Tecnologa AMD Eyefinity
Disfruta una excelente experiencia inmersiva de juegos con las

innovadoras capacidades de multipantalla "envolvente".
Control objetivo de la velocidad de cuadros (FRTC)

Ajusta tus grficos con un control de la velocidad de cuadros en tiempo
real limitando la velocidad de cuadros objetivo durante el juego,
reduciendo as el consumo de energa de la GPU.
Tecnologa AMD CrossFire

Con un escalamiento sorprendente en el rendimiento, un sistema
equipado con la tecnologa AMD CrossFire te mantiene en el
combate en lugar de necesitar una actualizacin.
Tecnologas para la administracin de eficiencia energtica en piloto

automtico.
Equipado con las tecnologas AMD PowerTune y AMD ZeroCore Power
para aumentar el rendimiento cuando lo necesitas, y ahorros de energa
el resto del tiempo.
Tecnologa AMD TrueAudio

Con el brillante sonido de la tecnologa AMD TrueAudio, tus juegos
ahora suenan tan bien como se ven.15
2.8.3.5 Nvidia
Nvidia Corporation fabrica unidades de procesamiento grfico (GPU),
as como del sistema en un chip de unidades (SOC) para la
computacin mvil mercado. Lnea de productos GPU primaria de
Nvidia, la etiqueta "GeForce", est en competencia directa con
Advanced Micro Devices '(AMD) "Radeon productos". Nvidia tambin se
uni a la industria del juego con su mano Escudo porttil y Escudo de la
tableta, as como el mercado de las tabletas con la Nota Tegra 7.
Adems de la fabricacin de la GPU, NVIDIA ofrece procesamiento

paralelo capacidades a los investigadores y cientficos que permiten
que se ejecuten de manera eficiente aplicaciones de alto rendimiento.
Nvidia ha trasladado a la informtica mvil de mercado, donde produce
Tegra procesadores mviles para telfonos inteligentes y tabletas, as
como navegacin de vehculos y sistemas de entretenimiento.
Algunas caractersticas que ofrece nvidia
Arquitectura unificada NVIDIA

Primera arquitectura unificada de la industria, diseada para asignar
recursos de procesamiento de la geometra, los pxeles y los
sombreados de forma dinmica a fin de optimizar el rendimiento de la
GPU.
Tecnologa de procesamiento NVIDIA CUDA GPU

Innovadora combinacin de funciones de clculo de la GPU que puede
implementarse a travs de una interfaz de lenguaje C estndar.
Aprovecha la capacidad del procesador grfico para ejecutar complejas
operaciones y aplicaciones que requieren grandes potencias de
procesamiento.
Rpido procesamiento de las texturas 3D

La alta velocidad de transferencia y tratamiento de las texturas 3D da
como resultado una visualizacin ms interactiva de los grandes
conjuntos de datos volumtricos.
Procesamiento de texturas Jumbo de 8 K

Procesamiento ms rpido de texturas de gran tamao que proporciona
mayor rendimiento al ampliar o recorrer vistas panormicas de
imgenes en alta resolucin.
Tecnologa NVIDIA PureVideo HD
Combinacin de funciones de descodificacin y pos procesamiento de

vdeo en alta definicin, sistema de circuitos HDCP e integracin con
reproductores de vdeo HD que proporciona la mejor experiencia de
visualizacin de pelculas HD disponible en un PC. PureVideo HD
proporciona una calidad de imagen asombrosa con todos los formatos
de vdeo, incluidos HD DVD y Blu-ray, con baja utilizacin de la CPU y
bajo consumo de energa.
Tecnologa NVIDIA SLI

La tecnologa NVIDIA SLI facilita a los usuarios profesionales el
desarrollo de grficos escalables y dinmicos, mejora la calidad de la
imagen y amplia el estado real de la pantalla.
Bfer estreo cudruple

Proporciona una extraordinaria calidad de imagen para aplicaciones
profesionales que requieren capacidades de visualizacin
esteroscpica.
2.8.3.4 Comparativa entre fabricantes

Las empresas fabricantes con el mayor control de estas GPU son
nVidia y ATI/AMD, definitivamente la empresa nVidia se ha preocupado
ms por la calidad que ofrece en las imgenes, pero la empresa AMD
fue por el lado de mayor cantidad de procesos que puede realizar
obteniendo calidad media en comparacin con la nVidia, pero que en
resultado final visible es mucho mejor que la otra empresa californiana.
Adems que la empresa nVidia trabaja con una mayor frecuencia de
reloj, puede que al final dure menos que la AMD, teniendo que
reemplazarla
2.8.4 Aplicaciones de la gpu:
Conociendo el gran potencial que tienen las GPUs en el procesamiento
de datos, estas estn teniendo aplicaciones en diversos campos de la
industria, medicina, etc.
Por ejemplo: en la bioinformtica, en el clculo financiero, dinmica de
fluidos computacionales, en la qumica cuntica, mecnica estructural
computacional, modelos meteorolgicos y climticos, entre otras reas.
Apu
Las soluciones de AMD te permiten interactuar con la tecnologa a tu
manera
AMD tiene claro que procesadores quiere fabricar en un futuro. Apuesta
por un mayor nmero de ncleos y por la integracin total entre el
propio micro y la tarjeta grfica.
Es el primer fabricante que utiliza el concepto de APU en vez del de
CPU. Es decir, es el primero que piensa en integrar la tarjeta grfica en
la misma tarjeta del chip. Con esto quiere ofrecernos una unidad de
procesamiento capaz de trabajar con datos complejos de forma verstil.
La computacin que puede llevar a cabo un procesador normal, es decir
una CPU, es diferente a los clculos que es capaz de realizar una
tarjeta grfica. De forma sencilla, podemos decir que la CPU est
pensada para realizar operaciones una detrs de otra y la tarjeta grfica
est pensada para trabajar con datos en paralelo. Esto lleva a que
cierto tipo de aplicaciones se puedan beneficiar de una mayor
integracin del micro y la tarjeta grfica.
Por ejemplo, la generacin de imgenes tridimensionales, procesado de
imagen fotogrfica, etc. se pueden realizar en menor tiempo gracias a
este nuevo diseo
Fusion es la tecnologa por la que est apostando AMD, consiste en la

combinacin de unprocesador x86, una unidad de procesamiento
grfico, un procesador de vdeo y otros coprocesadores en un solo
dado de silicio. Este dispositivo se denomina Acelerate Processing Unit,
APU.
Los elementos importantes del sistema (ncleos x86, motores de vector

(SIMD) y el decodificador de vdeo unificado (UVD)) se conectan
directamente al mismo bus de alta velocidad, evitando as conectarse a
los buses tpicos (PCI-Express). Este concepto de diseo elimina una
de las limitaciones fundamentales del rendimiento: la latencia, y por
consiguiente, el consumo de energa. Adems, la GPU usar unas
partes de la memoria central y la CPU otras, de manera que las
transferencias entre ambas son muy rpidas.
APU no solo ofrece un nuevo horizonte en el diseo hardware, sino que
tambin le permitir a los desarrolladores poder crear algoritmos de
vectores de alto nivel, que antes estaban limitados por la reducida
capacidad de cmputo.
Debido a que los sistemas operativos y las aplicaciones ms bsicas
tienen requisitos muy bajos comparados con las especificaciones
tcnicas de una mquina, permitir a los fabricantes de hardware
mantener un cierto rendimiento y a la vez reducir el tamao de cada
componente. AMD Fusion busca un menor consumo energtico
manteniendo un potencial suficiente para prcticamente cualquier
usuario.
3. CONCLUSIN
El paralelismo a nivel de instrucciones, nos permite reducir el tiempo de
ejecucin del programa, no es el nico ya que existen otras formas como
paralelismo a nivel de datos, de tareas Etc.
La unidad de procesamiento acelerado APU, permiten tener experiencias

visuales ntidas de alta definicin y realizar mltiples tareas simultneamente
sin tener que recurrir a una GPU dedicada ya que APU de AMD combina una
CPU multinucleo y una GPU en un solo procesador y lo mejor es que los
costos de adquisicin son menores. Con esto APU sera la mejor opcin para
el entretenimiento digital de alta calidad y de manera econmica.
4. REFERENCIAS
https://acisc2012.files.wordpress.com/2012/12/fina-arqui.pdf
https://robert2208.wordpress.com/2012/10/15/unidad-3-paralelismo/
http://www.exa.unicen.edu.ar/catedras/arqui2/arqui2/filminas/Introduccion%20
a%20las%20arquitecturas%20Paralelas.pdfhttp://www.fdi.ucm.es/profesor/jjruz
/WEB2/Temas/EC6.pdf Estructura de Computadores, Facultad de Informtica,
UCM, Curso 11-12
http://ingeniatic.euitt.upm.es/index.php/tecnologias/item/511-memoriahttp://diagramas.diagramasde.com/otros/Memorias%20Flash.pdf
http://quees.la/memoria-ram/
http://www.dynamics.unam.edu/users/joreste/memorias.pdf
http://www.intel.la/content/dam/www/public/lar/xl/es/documents/40_aniversario
_del_procesador.pdf
http://arquitecturaunisangi.foro-colombia.net/t2-comparacion-entreprocesadores-intel-y-amd)
http://deeea.urv.cat/public/PROPOSTES/pub/pdf/1464res.pdf
http://www.uv.es/varnau/AEC_520.pdf
http://eprints.ucm.es/11384/1/proyecto_master.pdf
http://versus.com/es/nvidia-geforce-gtx-770-vs-amd-radeon-r9-290
http://www.amd.com/es-xl/products/graphics/desktop/R9
http://www.amd.com/Documents/The-AMD-Story-Spanish-LatinAmerican.pdf
http://www.paginadigital.com.ar/articulos/2007/2007prim/tecnologia41/hardwar
e-mi-211107.asp

Paralelismoa A Nivel de Instrucciones PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Paralelismoa A Nivel de Instrucciones PDF

Transféré par

Droits d'auteur :

Formats disponibles

INFORME GRUPO 1

PARALELISMO A NIVEL DE INSTRUCCIONES, MEMORIA CACHE, MEMORIA FLASH

primero debe adicionar los 8 bits de orden inferior de cada nmero

2.2.4 Paralelismo de tareas

2.2.5 Paralelismo a nivel de instrucciones

2.2 PARALELISMO A NIVEL DE INSTRUCCIONES

Ejecuta ms de una instruccin por ciclo de reloj. Para ello se usan

La incorporacin de cache como un elemento ms del diagrama de

Tiene la capacidad de procesar instrucciones en paralelo. Viene

El compilador tiene mucho ms tiempo para determinar las posibles

inicialmente la ALU y el banco de registros solitario, pero enseguida se

2.2.5.3 SUPERSEGMENTADOS (superpipeline).

Figura 1.5 Condiciones de paralelismo

Todo proceso Pi requiere de parmetros de entrada, cuyo conjunto

Ejecucin secuencial y ejecucin paralela de instrucciones

Blinda a las empresas, instituciones y usuarios en general el

Requieren de un gran nmero de ciclos de procesamiento o

Desperdicio de espacio de memoria por instrucciones VLIW

2.3 MEMORIA CACHE

Los programas manifiestan una propiedad que se explota en el diseo

Las palabras de memoria accedidas recientemente tienen una alta

Las palabras prximas en el espacio de memoria a las recientemente

en el futuro cercano. Es decir, que las palabras prximas en memoria

Para implementar el mecanismo de actualizacin de la cach con los

El funcionamiento de la memoria cach se puede resumir en el diagrama

2.3.4 tipos de cache

A parte de la cach con respecto a la memoria RAM, en un PC existen

Memoria RAM como cach: Las unidades de almacenamiento

Disco duro como cach: Se emplea al disco duro como cach a

Los navegadores Web utilizan el disco duro como cach, al solicitar

2.3.5 NIVELES DE CACHE

Nivel 1 (L1): Conocido como cach interno, es el nivel ms cercano

Nivel 2 (L2): Conocido como cach externo, inicialmente se

Nivel 3 (L3): Se encuentra en algunas placas base, procesadores y

Nivel 4 (L4): Se encuentra ubicado en los perifricos y en algunos

2.3.6 Elementos de diseo.

A la hora de disear un sistema de memoria cach hay que elegir

bloque de la memoria principal que ha sido referenciado por el

2.4 MEMORIA FLASH

La memoria flash es una manera desarrollada de la memoria EEPROM que

Multimedia Card o MMC: Son ligeras y pequeas y su nica

2.4.1.2 Pen drive:

Unas breves caractersticas de comparacin:

comandos, mientras que NAND

En cuanto a la arquitectura, NAND puede almacenar ms datos en

Fabricada con puertas lgicas NOR y NAND para almacenar los 0s y

Los sistemas de archivos estn en desarrollo, aunque en la prctica

Para comparar estos tipos de memoria se consideran los diferentes

La densidad de almacenamiento de los chips es actualmente bastante

2.4.4 Memorias flash en la actualidad

energtico, son ms robustas y en un tamao ms reducido

2.5 Memoria RAM

Cuando las aplicaciones se ejecutan, primeramente deben ser cargadas en

Es preciso considerar que a cada bit de la memoria le corresponde un

2.5.1 Tipos de memoria RAM

La memoria de acceso aleatorio (RAM) es la memoria primaria de la

Extended Data Out Random Access Memory, llamada memoria

Burts EDO Random Access Memory, denominada memoria de

Dinamic Random Access Memory, designada memoria dinmica

Synchronous Dinamic Random Access Memory, nombrada

Fast Page Mode Dinamic Random Access Memory, llamada

Rambus DRAM denominada memoria dinmica de acceso aleatorio

Static Random Access Memory designada memoria esttica de