Vous êtes sur la page 1sur 2

Compresi�n de datos

Ir a la navegaci�n
Ir a la b�squeda

En ciencias de la computaci�n, la compresi�n de datos es la reducci�n del volumen


de datos tratables para representar una determinada informaci�n empleando una menor
cantidad de espacio. Al acto de compresi�n de datos se denomina �compresi�n�, y al
contrario �descompresi�n�.

El espacio que ocupa una informaci�n codificada (datos, se�al digital, etc.) sin
compresi�n es el producto entre la frecuencia de muestreo y la resoluci�n. Por
tanto, cuantos m�s bits se empleen mayor ser� el tama�o del archivo. No obstante,
la resoluci�n viene impuesta por el sistema digital con que se trabaja y no se
puede alterar el n�mero de bits a voluntad; por ello, se utiliza la compresi�n,
para transmitir la misma cantidad de informaci�n que ocupar�a una gran resoluci�n
en un n�mero inferior de bits.

La compresi�n es un caso particular de la codificaci�n, cuya caracter�stica


principal es que el c�digo resultante tiene menor tama�o que el original.

La compresi�n de datos se basa fundamentalmente en buscar repeticiones en series de


datos para despu�s almacenar solo el dato junto al n�mero de veces que se repite.
As�, por ejemplo, si en un fichero aparece una secuencia como "AAAAAA", ocupando 6
bytes se podr�a almacenar simplemente "6A" que ocupa solo 2 bytes, en algoritmo
RLE.

En realidad, el proceso es mucho m�s complejo, ya que raramente se consigue


encontrar patrones de repetici�n tan exactos (salvo en algunas im�genes). Se
utilizan algoritmos de compresi�n:

Por un lado, algunos buscan series largas que luego codifican en formas m�s
breves.
Por otro lado, algunos algoritmos, como el algoritmo de Huffman, examinan los
caracteres m�s repetidos para luego codificar de forma m�s corta los que m�s se
repiten.
Otros, como el LZW, construyen un diccionario con los patrones encontrados, a
los cuales se hace referencia de manera posterior.
La codificaci�n de bytes pares es otro sencillo algoritmo de compresi�n muy
f�cil de entender.

A la hora de hablar de compresi�n hay que tener presentes dos conceptos:

Redundancia: Datos que son repetitivos o previsibles.


Entrop�a: La informaci�n nueva o esencial que se define como la diferencia
entre la cantidad total de datos de un mensaje y su redundancia.

La informaci�n que transmiten los datos puede ser de tres tipos:

Redundante: informaci�n repetitiva o predecible.


Irrelevante: informaci�n que no podemos apreciar y cuya eliminaci�n por tanto
no afecta al contenido del mensaje. Por ejemplo, si las frecuencias que es capaz de
captar el o�do humano est�n entre 16/20 Hz y 16 000/20 000 Hz, ser�an irrelevantes
aquellas frecuencias que estuvieran por debajo o por encima de estos valores.
B�sica: la relevante. La que no es ni redundante ni irrelevante. La que debe
ser transmitida para que se pueda reconstruir la se�al.

Teniendo en cuenta estos tres tipos de informaci�n, se establecen tres tipolog�as


de compresi�n de la informaci�n:
Sin p�rdidas reales: es decir, transmitiendo toda la entrop�a del mensaje (toda
la informaci�n b�sica e irrelevante, pero eliminando la redundante).
Subjetivamente sin p�rdidas: es decir, adem�s de eliminar la informaci�n
redundante se elimina tambi�n la irrelevante.
Subjetivamente con p�rdidas: se elimina cierta cantidad de informaci�n b�sica,
por lo que el mensaje se reconstruir� con errores perceptibles pero tolerables (por
ejemplo: la videoconferencia).

Diferencias entre compresi�n con p�rdida y sin ella

El objetivo de la compresi�n es siempre reducir el tama�o de la informaci�n,


intentando que esta reducci�n de tama�o no afecte al contenido. No obstante, la
reducci�n de datos puede afectar o no a la calidad de la informaci�n:

Compresi�n sin p�rdida: los datos antes y despu�s de comprimirlos son exactos
en la compresi�n sin p�rdida. En el caso de la compresi�n sin p�rdida una mayor
compresi�n solo implica m�s tiempo de proceso. La tasa de bits siempre es variable
en la compresi�n sin p�rdida. Se utiliza principalmente en la compresi�n de texto.
Un algoritmo de compresi�n con p�rdida puede eliminar datos para disminuir a�n
m�s el tama�o, con lo que reduce la calidad. En la compresi�n con p�rdida, la tasa
de bits puede ser constante o variable. Una vez realizada la compresi�n, no se
puede obtener la se�al original, aunque s� una aproximaci�n cuya semejanza con la
original depender� del tipo de compresi�n. Este tipo de compresi�n se da
principalmente en im�genes, v�deos y sonidos. Adem�s de estas funciones la
compresi�n permite que los algoritmos usados para reducir las cadenas del c�digo
desechen informaci�n redundante de la imagen. Uno de los formatos que permite
compensar esta perdida es el JPG, que emplea t�cnicas que suavizan los bordes y
�reas que tienen un color similar permitiendo que la falta de informaci�n sea
invisible a simple vista. Este m�todo permite un alto grado de compresi�n con
p�rdidas en la imagen que, muchas veces, solo es visible mediante el zoom.

Vous aimerez peut-être aussi