Vous êtes sur la page 1sur 3

ANÁLISE DE DESEMPENHO DE

COMPACTADORES DE ARQUIVOS

Lucas da Silva Tavares Luís Fabrício Wanderley Góes


PUC - Minas PUC - Minas
Rua Rio Cumprido, nº: 4580, Bairro: Rua Rio Cumprido, nº: 4580, Bairro:
Cinco, Cep: 32010-025, Contagem-MG Cinco, Cep: 32010-025, Contagem-MG
tavares.puc@hotmail.com lfwgoes@pucminas.br

ABSTRACT
OBJETIVO
Data compression allows large amounts of data to be stored
efficiently. The storage and manipulation of data is a matter O objetivo deste trabalho é realizar uma análise de
of paramount importance for human development and desempenho de compactadores de arquivos. Como principal
technological needs to be studied in order to find answers contribuição, foi proposta uma árvore de decisão foi
and precise patterns on the best ways to compress the proposta para escolha do melhor compactador de arquivo de
various types of existing files. This paper presents a acordo com a métrica, tamanho e formato dos arquivos.
performance analysis of file compressors. The main Dentre estes formatos de arquivos, podemos destacar
contribution of this work is the proposal of a decision tree Bitmap, Psd, Aiff, Avi, Wave, Doc, Txt, e Xls, que são
for to choose the best file compressor according to the extensões de imagem, vídeo, áudio e texto.
metric, size and format of the files. Experimental result
show that the decision tree is able to select the best file JUSTIFICATIVA
compressor among free and commercial ones for different
Os compactadores de arquivos são ferramentas utilizadas
file formats and sizes.
por vários sistemas informatizados e por pessoas para as
Palavras-Chave mais variadas tarefas de empresas, organizações e até
Compactadores de arquivos; Árvore de Decisão; Análise de mesmo tarefas comuns do dia-a-dia de muitos usuários de
Desempenho. computadores. Devido à demanda de transferência e
armazenamento de dados pelos mais variados sistemas de
INTRODUÇÃO informação e dispositivos eletrônicos em geral, a
O armazenamento de dados nos dias atuais vem sofrendo compactação de arquivos se tornou o grande aliado de
uma queda considerável em seus custos. A manipulação de várias funções dessas áreas e dispositivos [3,4].
grandes volumes de dados ainda é um grande desafio e a As imagens JPEG são um grande exemplo de como
compactação de dados é uma das formas de reduzir custos e dispositivos e a própria web dependem da compactação de
garantir um desempenho cada vez melhor nessa tarefa. O dados, este é um padrão de compactação com perdas
uso de ferramentas para a compactação de dados propicia proporcionais ao resultado de compactação desejado, que
benefícios para várias áreas que necessitam de são amplamente utilizadas. Um exemplo de compactação
armazenamento e transmissão de grandes quantidades de sem perda muito utilizado também são os arquivos .rar
dados [4]. gerados pelo software de compactação WinRar, que ao
Os dispositivos atuais de multimídia (smartphones, tablets, contrário do JPEG, não perdem nenhum dado após serem
etc.), não seriam capazes de realizar as tarefas como compactados [3].
chamadas de vídeo, se não fosse pela compactação de Portanto a análise de desempenho de compactadores é
dados. Segundo [3] “a compactação de dados é a arte ou importante para indicar qual compactador de arquivo é o
ciência de representar informações de forma compactada” mais indicado para o armazenamento de cada tipo de
[3]. arquivo e tamanho [3,4].
Neste cenário, é importante analisar qual compactador de
COMPACTAÇÃO DE ARQUIVOS
arquivos é o melhor para cada tipo de dado e tarefa, pois
pode gerar redução de tempo e custo para varias áreas que A compactação de dados torna possível à utilização de
necessitam da manipulação de várias quantidades de dados vários recursos em dispositivos multimídia como TV
[3,4]. digital, Smartphones, DVDs, Mp3 players e vários outros.
Portanto, ela faz com que o desenvolvimento dessas áreas
se torne uma tarefa menos complicada. Sem a compactação Bzip2 que é baseado na compactação sem perdas e no
de dados seria muito caro e demorado fazer, por exemplo, código de Huffman [1,3].
uma chamada de vídeo entre dois smartphones. A
compactação de dados consiste-se em duas tarefas: receber
dados em um tamanho e devolvê-los em um tamanho ÁRVORE DE DECISÃO
menor sem fazer com que esses dados se tornem
inutilizados [3,5]. As árvores de decisão nos auxiliam nas tomadas de decisão.
São muito utilizadas em problemas de classificação.
A compactação se divide em dois grandes grupos: a Basicamente, elas tem capacidade de aprender através de
compactação com perdas (lossy data compression) e a sem experiências e resultados anteriores [1,3].
perdas (lossless compression). No primeiro, os arquivos As execuções de vários testes fazem com que a árvore de
sofrem uma perda insignificante de dados, mas que decisão chegue a uma decisão. Está decisão é tomada
resultam em uma grande diferença no tamanho final do inicialmente por uma situação descrita por vários atributos.
arquivo que foi compactado. Como consequência, estes O algoritmo utilizado em nosso trabalho foi o ID3. Baseado
arquivos não podem mais voltar ao seu estado anterior, ou no cálculo da entropia, ele escolhe os atributos iniciais de
seja, exatamente como eles eram antes de serem forma a diminuir a desordem das hipóteses de cada questão
compactados. Por exemplo, no caso de arquivos de áudio, [1,3].
as perdas que eles sofrem, devido à compactação, podem
ser insignificantes ao ouvido humano. Já na compactação
sem perdas, os dados não perdem seu formato original, METODOLOGIA
sendo que mesmo depois de compactados e Esta pesquisa é quantitativa e experimental. São realizados
descompactados, os dados mantém suas características testes com arquivos de diversos formatos e compactadores
originais. Essa segunda técnica geralmente é usada quando de arquivos. O computador utilizado para realizar os testes
não se pode perder de forma alguma nenhum dado do possui a seguinte configuração: Processador Core i3 2.13
arquivo, como por exemplo, em arquivos texto e programas GHz, Memória RAM de 4GB e Sistema Operacional
de computadores utilizados para medicina. Na segunda Windows Seven Professional. Os tipos de arquivos
técnica, o tamanho do arquivo compactado é geralmente utilizados são: Wave, Aiff, Avi, Bitmap, Psd, Doc, Txt e Xls.
maior que o da compactação com perdas [1,2,3,4]. Para cada tipo de arquivo foram utilizados os seguintes
tamanhos: 50MB, 500MB e 1000MB. Por último, para cada
TÉCNICAS DE COMPACTAÇÃO DE ARQUIVOS combinação de compactador, tipo e tamanho de arquivo
Existem vários algoritmos que possuem como finalidade foram realizados três testes e calculada a média aritmética
compactar e descompactar arquivos de textos, programas de das execuções.
computadores, multimídia e etc. Na verdade, esses
algoritmos são apenas métodos que quando utilizados em RESULTADOS EXPERIMENTAIS
conjunto, são capazes de gerar um modelo de compactação
de dados bastante eficaz. Esses métodos tem a função de Nesta seção são apresentados alguns dos principais
transformar um conjunto de símbolos em um conjunto de resultados alcançados neste trabalho.
códigos que eles mesmos terão que ser capazes de
retransformar em símbolos [1,3]. Como exemplo, podemos
citar o código de Huffman, LZ e Shannon-Fano [3,5].

FERRAMENTAS DE COMPACTAÇÃO DE ARQUIVOS


No mercado atualmente existem várias ferramentas de
compactação de arquivos. Alguns exemplos são: WinRar,
WinZip, NanoZip, NHC expresso Zip, 7-Zip e IZarc.
Segundo [6], o melhor software disponível no mercado é o
NanoZip, já para [7] os melhores softwares são Winrar, Figura 1 - Tempo de Compactação para arquivos do tipo
WinZip. Alguns softwares já vêm nativos nos sistemas Bitmap.
operacionais. No Windows Seven, por exemplo, o software De acordo com os dados da figura 1, podemos constatar que
WinZip já vem instalado como o compactador e o 7-Zip e WinZip otimizado são os que gastam menor
descompactador de arquivos padrão. [6,7]. tempo para compactar arquivos Bitmap. Sendo que a
Alguns softwares possuem versões gratuitas e pagas como o grande diferença de tempo está para os arquivos de 500MB
WinRar, outros possuem versões apenas gratuitas e outros que com WinZip é 72% menor que o WinRar no modo
apenas versões pagas. [3,5]. normal, que possui o segundo melhor tempo.
Dentre os softwares livres, temos o 7-Zip que é baseado na
compactação sem perdas e nos algoritmos da família LZ e o
Na Figura 4, mostramos a árvore de decisão gerada pelo
software WEKA para escolha do melhor compactador de
acordo com o tamanho, extensão e métrica dos arquivos de
entrada.

CONCLUSÃO

Este trabalho comparou o desempenho de compactadores


de arquivos existentes no mercado atualmente. A principal
Figura 2 - Tempo de Descompactação para arquivos do tipo contribuição deste trabalho foi a proposta de uma árvore de
PSD. decisão para ajudar o usuário na seleção do melhor
compactador de arquivo de acordo com o tamanho, métrica
Nos testes de descompactação dos arquivos PSD da figura e extensão do arquivo. Como trabalhos futuros, é
2, o NanoZip é o que gasta mais tempo para compactar pretendido testar outros compactadores de arquivos, com
arquivos de 50MB, ficando com uma diferença de 50% para tamanhos de arquivos e extensões diferentes e
com todos os outros compactadores utilizados nos testes. computadores com configurações de hardware e software
Para os arquivos de 500MB, o FreeArc é 10% mais rápido diferentes. Além disso, pode também ser implementado um
que o WinRar e para arquivos de 1000MB o 7-Zip é 20% software para seleção automática do compactador de
mais rápido o que WinZip normal e otimizado. arquivos baseado no arquivo de entrada.

REFERÊNCIA BIBLIOGRÁFICA

1. PU, Ida Mengyi. Fundamental Data Compression,


Burlington, 2006.
2. ABERNETHY, Michael, Mineração de dados com
WEKA, Parte 1: Introdução e regressão. Disponível
em:
<http://www.ibm.com/developerworks/br/opensource/li
Figura 3 - Tamanho Compactado para arquivos do tipo AVI. brary/os-weka1/> Acesso em: 30 mai. 2013.
3. KHALID, Sayood. Introduction to data compression,
Na comparação de tamanho compactado feita com os três San Francisco, 2005.
tamanhos de arquivos do tipo avi, o NanoZip obteve os 4. NELSOM, Mark and GAILLY, Jean-loup. The Data
melhores resultados, sendo que ele é em 50MB, 23% menor Compression Book 2nd, 1995.
que o FreeArc, em 500MB, 24% menor e em 1000MB, 5. SALOMON, David. Data Compression The Complete
19% menor. Reference 4nd, Estado da Califórnia, 2007.
6. COMPRESSION RATINGS: Disponível
em:<http://compressionratings.com/>. Acesso em: 30
out. 2012.
7. 2012 BEST COMPRESSION SOFTWARE REVIEWS
AND COMPARISONS: Disponível em:<http://file-
compression-software-review.toptenreviews.com/>.
Acesso em: 30 out. 2012

Figura 4 - Arvore de Decisão.

Vous aimerez peut-être aussi