Vous êtes sur la page 1sur 4

Sysadmin

Backups

Se algo de errado acontecer com seus dados, seu chefe ir perguntar:

E a, tem becape?
credits of the images

Dados em computadores sempre tendem a se corromper exatamente quando mais precisamos, mas uma estratgia bem pensada de backup pode ajud-lo a colocar aqueles arquivos perdidos de volta em seus lugares num piscar de olhos.
por Marc Andr Selig

inmeras razes para a perda de dados. Por exemplo, um administrador distrado pode digitar um fatdico rm -rf * no diretrio errado, apagando centenas de arquivos importantssimos. H tambm os casos de perda total de dados, quando por exemplo o disco rgido decide partir desta para uma melhor. E h ainda os casos em que

no possvel, ou sensato, conar na integridade dos dados como logo aps uma invaso, por exemplo. Nenhuma dessas situaes deixa outra alternativa ao administrador de sistemas a no ser restaurar uma cpia de segurana (e bom que ela exista e seja convel), o popular "becape", que esteja comprovadamente livre de qualquer suspeita.

Como as causas e necessidades envolvendo perda de dados podem ser muito diferentes, diversas formas de lidar com o problema vieram tona ao longo dos anos. Todas elas possuem benefcios e desvantagens. Este ms, descreveremos algumas das ferramentas de backup disponveis e as tcnicas com as quais devem ser usadas.

Tabela 1: Escolha sua mdia


Fita magntica Aps restaurao ++ ++ ++ CD/DVD Aps restaurao + + ++ + MO Aps restaurao ++ + ++ + Disco rgido interno Imediatamente ("a quente") ++ Disco rgido externo/removvel Imediatamente aps a conexo ++ o ++: Ponto forte, +: Aplicvel, o: Parcialmente aplicvel, dependendo da mdia, -: No aplicvel * Armazenamento indica a possibilidade de armazenar as mdias em outro local geogracamente distante de seus servidores, dando mais segurana contra acidentes, desastres naturais e roubo. ** Disponibilidade indica quando os dados estaro disponveis caso se precise da cpia de segurana.

Vida til

Conabilidade

Armazenamento* Velocidade

Disponibilidade**

64

julho 2005

edio 10 www.linuxmagazine.com.br

Backups

Sysadmin

Escolhendo a mdia
A tabela 1 mostra uma breve comparao entre os tipos de meios de armazenamento disponveis. As tas magnticas j foram as estrelas solitrias do armazenamento de dados, desbancando os cartes perfurados na dcada de 60 e seguintes. Em tempos mais recentes, elas ainda brilhavam para as cpias de segurana dos frgeis e inecientes discos rgidos e, ainda hoje, so as vedetes dos CPDs e Data Centers que precisam trabalhar com quantidades monstruosas de dados. Fitas magnticas so muito baratas, mesmo considerando a quantidade fabulosa de dados que podem guardar, mas tm uma desvantagem gritante: a velocidade de acesso bastante baixa. No seria to mau se a outra desvantagem no fosse proibitiva: os drives de ta mesmo os mais baratos so esmagadoramente caros para a maioria das pequenas e mdias empresas em qualquer parte do mundo. Ainda assim, uma (ou vrias) unidades de ta conectadas com uma jukebox robotizada o que se tem de melhor ainda hoje para backups automatizados de alta capacidade. Para ns, reles mortais, os CDs e DVDs gravveis, as memrias ash e os discos rgidos (internos ou externos, removveis ou no) especiais para backup so as solues mais comuns e acessveis. Em empresas maiores, os administradores podem contar com um NAS (Network Attached Storage ou sistema de armazenamento ligado em rede) para aumentar a capacidade dos discos rgidos centrais. Assim como h diferentes mdias para backup, h tambm estratgias diferentes. Na maioria dos casos, os administradores optam pelo conhecido mtodo de backups incrementais, que armazenam apenas as mudanas que ocorreram desde o ltimo backup. Essa estratgia poupa bastante espao nas mdias de segurana, o que melhora a relao custo/benefcio do sistema de backups como

Backup completo
1
2
3
4
5

Backup diferencial

Backup incremental

Figura 1: Um backup completo guarda todos os arquivos. Um backup diferencial armazena as mudanas ocorridas desde o ltimo backup completo. Um backup incremental, por sua vez, armazena arquivos modicados desde o ltimo backup, seja ele completo ou diferencial. um todo. A maioria das ferramentas de backup existentes podem trabalhar com backups incrementais. A grande desvantagem dos backups incrementais que restaurar os dados perdidos d muito mais trabalho e toma muito mais tempo do que restaurar um backup completo. Os backups incrementais armazenam as diferenas desde o ltimo backup, mesmo que ele seja outro backup incremental. Alm disso, os administradores tm que car trocando as mdias de backup se no possurem oramento para uma jukebox robotizada. H uma terceira modalidade chamada backup diferencial, que sempre armazena as mudanas em relao ao ltimo backup completo, diminuindo um pouco o problema. A figura 1 ilustra os trs mtodos. numa ta jogada numa prateleira, o acesso ao arquivo vai precisar de interveno humana. Isso pode ser uma vantagem: anal, um invasor no conseguir, por mais que tente, comprometer uma ta que no est no drive. Entretanto, o ato de restaurar o arquivo precisar de tempo e de algum que o faa. Na outra extremidade do problema, h solues imediatas de backup em que os dados esto em uma mdia disponvel 24x7. Esse mtodo poupa tempo e possivelmente dinheiro mas passvel de outros tipos de falha. Uma delas que essa mdia pode ser comprometida por nossos amigos crackers. H sistemas que podem criar os chamados backups instantneos ou backups a quente (hot backups) a intervalos regulares ou mesmo de forma contnua. Entretanto, esse tipo de cpia de segurana protege apenas contra falhas no hardware. No h proteo contra erros dos usurios ou do administrador, que sero propagados para o backup no exato instante em que foram cometidos. Por essa razo,

Uma palavra sobre disponibilidade


A escolha do mtodo de backup depende das circunstncias em que os dados devem ser guardados. Se o arquivo de que o usurio desesperadamente precisa est

julho 2005 www.linuxmagazine.com.br

edio 10

65

Sysadmin

Backups

muitos administradores no conam nas tcnicas de backup instantneo e no querem nem ouvir falar de substituir as tcnicas tradicionais.

Formatos
Os administradores discordam entre si sobre os prs e os contras de se gravar cada arquivo e cada diretrio individualmente no backup basta simplesmente jogar os diretrios e arquivos na mdia e pronto. Alguns acham que esse o caminho, mas outros preferem criar um pacoto com estruturas mais complexas de controle, com dados informativos (metadados) e numeros de vericao de integridade (checksum). Backups em que cada arquivo individual gravado na mdia tendem a ser mais rpidos para guardar e restaurar. Alm disso, se a mdia tiver um pequeno defeito ("deu fungo no CD" ou "o cachorro comeu a ponta da ta" so bastante comuns...) apenas um punhado de arquivos se muito so afetados. Se o mesmo acontecer com um pacote de backup (ou seja, todos os arquivos empacotados e, possivelmente, compactados

dentro de um arquivo) uma quantidade bem maior de dados vai para o espao. Dependendo da gravidade, o backup todo ca comprometido. Entretanto, os pacotes ou contineres de arquivos oferecem benefcios que o mtodo de armazenar arquivos um a um no pode trazer. Por exemplo, possvel armazenar informaes como o proprietrio e o grupo dos dados, os privilgios de acesso e as datas de criao e alterao dos arquivos individuais. possvel inclusive fazer cpias de segurana de dispositivos inteiros do diretrio /dev. Alm disso, as tas magnticas no so exatamente o meio ideal para armazenar uma multido de pequenos arquivos. Muito pelo contrrio, esses dinossauros da tecnologia so campees no armazenamento de um s arquivo bem grande. Muitos programas, incluindo o tar e o cpio, tentam encontrar o equilbrio perfeito. Se um arquivo cpio estiver corrompido, o dano ca restrito aos arquivos armazenados no local da mdia em que a falha ocorreu. O programa resincroniza seus contadores internos com o prximo

As tas so muito populares e conhecidas. Raramente so vtimas de erros isolados de leitura e mesmo essas raras falhas podem ser evitadas com ferramentas de software mais sosticadas. O que torna as coisas piores o fato de muitos drivers para o kernel precisarem de blocos pr-formatados para dispositivos de ta. Em outras palavras, nem todas as unidades de ta do mercado so boas para se usar como dispositivo-alvo no comando tar cpf. A maneira mais fcil de usar unidades de ta empregar um software do tipo pronto-para-usar como o Amanda [2] , que pode coletar dados de um nmero praticamente ilimitado de mquinas na rede e grav-los em uma ta. O Amanda funciona com uma grande variedade de sistemas Unix e possui inclusive clientes para o Microsoft Windows [3]. O sistema baseado no modelo cliente/servidor. preciso instalar um programa cliente do Amanda em cada mquina que deve ter seus dados guardados em uma cpia de segurana. Como bvio e ululante, o cliente precisa ter acesso de leitura para qualquer dado que deva ser guardado no servidor Amanda. O servidor envia requisies peridicas aos clientes pelo protocolo UDP e eles respondem com os dados a serem guardados transportados via TCP. O Amanda pode usar tanto o comando dump como o tar para criar os pacotes de arquivos. O Amanda possui um sistema sosticado de agendamento de backups. O programa servidor consulta as unidades de ta para ver quais esto livres e verica na tabela de backups agendados quem est na vez e que tipo de cpia deve ser feita: completa ou incremental. Ou seja: cada mquina na rede tem seu backup feito sempre que possvel e, pelo menos, no intervalo congurado. O Amanda tambm sabe quanto espao h nas tas j usadas e guarda nelas os backups incrementais.

Quadro 1: Backup em ta

marcador de m de arquivo aps a falha, o que minimiza o prejuzo. Dessa forma, os arquivos que estiverem depois do local danicado podem ser restaurados. Se vamos entrar na discusso "pacoto nico contra arquivos individuais", tambm precisamos trazer baila os problemas da compactao e da criptograa dos dados. O esquema de ressincronizao do cpio funciona apenas para backups que no foram compactados. Se um erro de leitura impede que o arquivo seja descompactado, o cpio lhe ser de pouca utilidade. O popular gzip simplesmente aborta a descompactao quando encontra o primeiro erro no arquivo compactado. Evite o gzip para backups como o diabo foge da cruz: h inmeros relatos de administradores de sistema em desespero porque perderam vrios gigabytes de dados no-corrompidos porque o gzip simplesmente se recusa a continuar a descompactao a partir de um msero bit defeituoso o zcat pode, ao menos, recuperar parte dos dados at o ponto onde o erro ocorreu, mas nada alm disso. O formato alternativo, bzip2, compacta e descompacta os arquivos em blocos de 900 KBytes no mximo. Se um erro de leitura ocorrer, perde-se um pequeno bloco de dados mas os blocos seguintes a ele no so afetados. Novamente avisamos: no use o gzip. Os administradores so confrontados com um dilema semelhante quando precisam criptografar os dados. Muitos algoritmos de criptograa usados pelos programas de backup so to bons que os dados cam inacessveis em caso de falha na mdia. Uma possvel forma de contornar isso poderia ser comprimir cada arquivo sozinho antes de grav-lo no pacote. A ferramenta ao [1] um candidato a substituir o cpio nessa tarefa, pois tem sintaxe de opes semelhante e pode criptografar individualmente cada um dos arquivos.

66

julho 2005

edio 10 www.linuxmagazine.com.br

Backups

Sysadmin

Listagem 1: Script simples de backup


01 #!/bin/sh 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 [ `id -u` -eq 0 ] || ( echo ' preciso ser root para gravar os dados no CD/DVD!' && exit ) TODAY=`date +%Y%m%d.%H%M` MYKEY='0x598342d9' umask 022 mkdir -p /tmp/root/backup-$TODAY cd / tar cf - etc home usr/local | \ gpg -v --homedir $HOME/.gnupg -e -r $MYKEY | \ tee /tmp/root/backup-$TODAY/backup-$TODAY.tar.gpg | \ md5sum -b >/tmp/root/backup-$TODAY/backup-$TODAY.tar.gpg.md5 cd /tmp/root mkisofs -r -pad -o backup.iso backup-$TODAY cdrecord -v -eject -multi dev=0,0,0 -driveropts=burnproof -speed=24 -pad backup.iso rm -rf backup-$TODAY backup.iso

Backup em CD
O backup em ta, especialmente se controlado pelo Amanda (ver quadro 1), pode ser usado em ambientes mais modestos, mas sente-se bem mais vontade em grandes corporaes. Usurios domsticos e pequenas empresas talvez quem mais vontade com um sistema de backup mais simples, baseado em CDs ou DVDs. Em comparao com as tas magnticas, e considerando um volume pequeno de dados, os CDs e DVDs so extremamente baratos e possuem um ciclo de vida maior. A listagem 1 mostra um script de backup bem simples, que chama o utilitrio gpg para criptografar os dados e gera um arquivo MD5 para vericao de integridade. Se um CD se perder (e isso acontece com frequncia quando no se cuidadoso), voc no precisa, pelo menos, se preocupar com acesso no-autorizado a seus dados. Modique nosso script a seu gosto, fazendo-o usar cartes ash ou discos rgidos externos. Se sua distribuio Linux no usa emu-

lao SCSI para gravao de CDs (como acontece com muitas das distribuies recentes), consulte a documentao do cdrecord para saber como fazer e altere a penltima linha do script.

Faa a coisa certa


Um sistema de backups to bom quanto os dados gravados na mdia e nem sempre esses dados so o que o programa de backup teve a inteno de gravar. Portanto, a melhor prtica vericar periodicamente suas cpias de segurana para garantir que tudo pode ser lido, que o lido exatamente o que foi gravado, e que voc gravou os dados certos, pra comeo de conversa. Alm disso, preciso criar mecanismos que permitam que vrias pessoas ou mesmo o prprio usurio possam restaurar facilmente os dados em caso de emergncia. No h nada mais desesperador do que ter que restaurar um backup bem antigo e no ser capaz de faz-lo porque o administrador que o gerou no est mais disponvel e o pior, levou com ele a senha

Para os casos de perda total, h outras coisas a considerar. Como em muitos casos o sistema operacional (ou o hardware) do sistema principal podem estar bastante danicados, obrigatrio ter um computador reservado exclusivamente para a restaurao dos backups. Esse sistema de socorro deve iniciar a partir de um CD ou disco rgido externo e permitir que o administrador restaure completamente os dados em outras palavras, deve haver um servidor completo guardado no armrio para colocar no lugar do que "morreu". claro, esse tipo de soluo requer planejamento, traquejo e investimento.

Informaes
[1] Pgina ocial do Ao: directory.fsf.org/sysadmin/backup/afio.html [2] Pgina ocial do Amanda: www.amanda.org [3] Cliente do Amanda para Windows: sourceforge.net/projects/amanda-win32

julho 2005 www.linuxmagazine.com.br

edio 10

67

Vous aimerez peut-être aussi