Vous êtes sur la page 1sur 2

COMPRESIN

El programa tar, es usado para almacenar archivos y directorios en un solo archivo sin perder sus permisos ni la estructura en el
sistema de archivos. El formato fue diseado para almacenar archivos de una forma conveniente en cintas magnticas y de all
proviene su nombre, que proviene de "Tape ARchiver" (en ingls: archivador en cinta).

Compresor Comando utilizado Multiproceso (SMP)


Bzip2 bzip2 -zc9 entrada > salida No
PBzip2 pbzip2 -zc9 entrada > salida Si
Gzip gzip -9c entrada > salida No
P7z (7z) 7za a -t7z salida entrada Si
P7z (zip) 7z a -tzip salida entrada Si
Rar rar a -m5 salida entrada No

El hecho de que soporten multiproceso, favorece a los ordenadores de doble ncleo y/o procesador.
Los distintos algoritmos de compresin, pueden funcionar mejor o peor segn el tipo de datos que estemos comprimiendo. Por ejemplo, no es lo mismo comprimir 100MB de
texto (donde las repeticiones son numerosas) que un binario o un archivo de audio. La siguiente tabla muestra los tipos de archivo que se han utilizado.

Tipo Tamao (KB) Descripcin


Cdigo Fuente 278276 El cdigo fuente de Linux empaquetado: linux-2.6.25.4.tar
Audio 320796 Un archivo de audio no comprimido: musica.wav
Binario 203736 Binario generado con: "cat /usr/bin/* > binario.bin [CTRL+C]"
ISO (comprimido) 163556 Archivo ISO de Debian: debian-40r3-i386-netinst.iso (generalmente comprimido)
Texto de zeros 2045432 Archivo de texto con solo zeros: "cat /dev/zeros > zeros [CTRL+C]"
Imagen 20688 Imagen sin comprimir: imagen.bmp

bzip2 pbzip2 gzip 7z (7z) 7z (zip) rar


Cdigo 51,74 29,47 39,02 198,3 67,28 89,76
Audio 23,43 13,72 10,61 48,06 26,02 54,04
Binario 41,2 24,09 88,95 86,33 43,62 54,04
Tiempo que ha tardado la compresin en segundos.
ISO 48,46 34,32 10,98 60,55 14,25 133,64
Zeros 51,78 46,58 21,76 224,49 207,9 211,86
Imagen 4,23 2,73 1,97 12,58 4,07 4,81

Tiempo de compresin para cada compresor, donde cuanto menor es, mejor es. Como podemos ver, el compresor ms rpido es pbzip2 seguido muy de cerca por gzip. Hay
que tener en cuenta que pbzip2 tiene soporte SMP, mientras que gzip no. Esto hace pensar que una versin de gzip con soporte multiproceso, se llevara la palma.
El ms lento, es claramente 7z con su propia compresin 7z. Donde da peor resultado es en la compresin de texto (cdigo y zeros).
El archivo de zeros es en general, el que ms tiempo requiere. Aunque hay que tener en cuenta la cantidad de los datos (2GB) y el enorme ratio de compresin que se
consigue. No obstante, esta grfica no sirve para comparar el tiempo de los distintos archivos, ya que cada uno tiene un tamao distinto.
Ratio de compresin sobre 100: 100-(Tamao comprimido/Tamao original)*100.Ratio = "se ha reducido un X% del tamao original".
Por ejemplo, se ha reducido un 80% del tamao original: 300*80/100=240. El nuevo archivo ocupa 60.

bzip2 pbzip2 gzip 7z (7z) 7z (zip) rar


Cdigo 82,93 82,85 78,39 85,4 79,05 85,6
Audio 86,71 86,7 86,77 87,39 86,74 88,61
Binario 63,04 62,86 59,53 59,53 60,56 75,57
ISO 2,88 2,88 3,24 3,99 3,22 4,18
Imagen 48,88 48,86 33,49 49,52 37,43 60,83

Nota: en el estudio del ratio se ha decidido prescindir del archivo "zeros", ya que todos los ratios superan el 99,99%. Seguidamente se muestra el tamao del archivo zeros
comprimido con los diferentes compresores teniendo en cuenta que el tamao original de zeros: 2045432KB = 2GB.

Pgina 1 de 2
Compresor Tamao comprimido (KB)
bzip 4
pbzip 4
gzip 1988
7z (7z) 296
7z (zip) 2404
rar 144

Ratio de compresin para cada compresor, donde cuanto mayor es, mejor es.

En el ratio de compresin, rar es quien obtiene mejores resultados. Sobretodo para el binario y la imagen, en relacin al resto. Mientras que gzip se queda levemente en
ltima posicin, siguiendo muy de cerca a zip.
Sorprendentemente el tipo de archivo que obtiene ms compresin es el de audio, y en segundo lugar, como es de esperar el cdigo fuente.
La imagen ISO es la que ofrece peor ratio, ya que generalmente es un archivo comprimido.
Estas grficas representan la relacin del tiempo con el ratio de compresin. De esta manera puede verse cual es el mejor compresor ratio/tiempo donde cuanto mayor es,
mejor es.

En las dos primeras posiciones encontramos pbzip2 y gzip. Como podemos observar en las grficas anteriores, superan al resto en tiempo, mientras que en el ratio no son los
mejores pero se mantienen.
El peor es claramente 7z, aunque ofrece ratios bastante buenos demora excesivo tiempo.
Esta grfica no nos sirve para comparar los parmetros ratio/tiempo entre los distintos tipos de archivos, ya que cada uno de ellos tiene un tamao distinto, y por lo tanto el
tiempo no es comparable.
Para finalizar, un pequeo grfico donde se observa que tipo de archivo ofrece un mejor ratio de compresin. Se ha
calculado la media donde cuanto mayor es, mejor es.
Realmente todos, menos la ISO, ofrecen un buen ratio de compresin. Sobretodo el audio (86%) y el cdigo
fuente (83%).
Como conclusin se puede decir que este estudio puede ofrecer una idea de los ratios y tiempos, pero lo ideal
sera hacerlo con varios archivos del mismo tipo. Ya que estamos generalizando todos los archivos de audio (por
ejemplo) en uno solo. Y no todos son iguales.
A la pregunta: "segn esto, cul es el mejor compresor?", la respuesta es depende!. Si lo que buscamos es
velocidad cosa que puede ser til en, por ejemplo, un juego que necesita constantemente descomprimir texturas
lo ms rpido posible: pbzip2 o gzip.
Si lo que buscamos es ratio de compresin para, por ejemplo, enviar un archivo va internet, rar. El ratio tambin
depende del tipo de archivo, segn los datos con que hemos hecho el estudio, para binarios, imgenes y audio el
mejor es rar, mientras que para cdigo fuente 7z. Si tenemos que decir cual es el mejor en la relacin
tiempo/compresin, gzip lo es. Teniendo en cuenta que es monoproceso, ofrece una velocidad ms que excelente,
adems de buenos ratios (no los mejores, pero se mantiene cerca de la media). Adems existe ya un proyecto para
aadirle soporte SMP llamado pigz. Y el peor es zip aunque, en general, no se queda excesivamente atrs.

La compresin y descompresin de ficheros a travs de gzip se vio superada algn tiempo despus por bzip2, una herramienta ms potente y veloz. Sin embargo, hay un
problema con bzip2 ya que solo aprovecha un ncleo a la hora de descomprimir, lo cual no potencia del todo la capacidad del mismo. Para solventar el problema ha
aparecido pbzip2 (Parallel bzip2), una herramienta que permite sacar partido a todos los ncleos de la CPU cuando lo utilicemos tanto para comprimir como para
descomprimir.

Pgina 2 de 2

Vous aimerez peut-être aussi