Diferenças entre Backup e Archive

Olá a todos, o objetivo deste post é esclarecer as diferenças entre a realização de archives e backups.

Empresas de todos os tamanhos possuem uma coisa em comum: Elas criam e armazenam dados aos montes. São informações de clientes, especificações de produtos, planilhas financeiras e vários outros tipos de dados que você puder imaginar.

Generalizando, as empresas dobram sua quantidade de informações a cada ano, sendo que isso traz desafios para proteção contra simples exclusões acidentais, contra problemas em equipamentos ou catastrofes naturais, respeitando quesitos de legislação, quando for o caso, e retanções de longo prazo.

No passado, proteção e retenção eram realizadas apenas copiando ou movendo os dados para uma fita, porém com a melhora em relação ao custo de discos e a emergente necessidade de arquivamento incentivaram o surgimento de outras soluções.

Imagem representando backupBackup

Tecnologias de backup há muito tempo oferecem eficientes opções para recuperação de dados de sistemas sujeitos a falhas humanas, de hardware ou de desastres naturais. Elas foram idealizadas para que em um curto espaço de tempo fosse possível restaurar dados e sistemas afim de deixa-los operacionais novamente. No entanto, o backup é uma das grandes “dores de cabeça” para a área de TI, pois de acordo com o Gartner apenas 87% dos dados de uma empresa possuem backup com efetiva possibilidade de restauração.

Atualmente o tamanho da janela de backup está cada vez menor, ou seja, o tempo disponível para backup é cada vez mais escasso e a necessidade de rapidez para restauração é cada vez maior. Por isso, muitas empresas vem adotando estratégias de backup tanto em fita quanto em disco, melhorando o rendimento e a confiabilidade da infraestrutura para uma possível necessidade de restauração a um custo razoável.

No entanto, estas tecnologias serão apenas medidas paliativas, se o crescimento descontrolado da quantidade de dados que exigem backup não for cerceada. Isso se torna um perigo real quando a empresa trata de backup como uma solução única para  proteção de dados e retenção de dados.

Por exemplo, a maioria das organizações executam backups incrementais a noite e backups completos (full) semanalmente e os mantem por três meses para o caso de exclusões acidentais. Uma segunda cópia dos dados são enviadas para um local fora da organização para proteção contra desastres de maior porte. Se você possui necessidade de retenções para anos o aumento do overhead do backup é significante, logo, os custos também.

Uma empresa hipotética ABC que tem 10TB de dados em servidores de produção pode criar uma política de backup incremental em disco e semanalmente “sobe” um backup full para fita. Essas fitas são catalogadas e mantidas por três meses até que o ciclo de trocas entre elas se complete. Entretando se novas regras comerciais demandarem que a retenção da empresa seja agora de 5 anos e não mais de 3 meses, fará com que a empresa em questão tenha um conjunto de backup aproximado de 2.5 petabytes, ou seja, totalmente inviável se comparado com a quantidade de dados em produção.

Imagem representando archiveArchive

Como introdução para Archive, podemos dizer que as empresas podem aprimorar seus níveis de serviço para backup e recovery enquanto reduzem custos de backup. Um sistema de archive copia ou move os arquivos de acordo com o conteúdo real. Eles também localizam e retornam arquivos de acordo com seu conteúdo, incluíndo autor, data e outras tags customizadas.

Um sistema de archive deve conter as seguintes características:

» Ser Content-Aware. Por exemplo, ele deve indexar o conteúdo dos documentos, não apenas os metadados do sistema de arquivos.
» Preencher tags de metadados customizados extraindo informações do conteúdo dos arquivos.
» Arquivar um subconjunto de dados (definido pela política de archive) seletivamente para atender à conformidade regulamentar e regras de governança corporativa da informação.
» Proporcionar acesso rápido aos dados arquivados.

Exemplo: A empresa hipotética ABC reconhece uma possível crise em relação aos seus dados e resolve implantar um esquema de archive como complementação ao backup existente. O sistema de archive rastreou a rede inteira e criou metadados para cada arquivo. O sistema identificou que 70% dos dados não estruturados em produção estão “velhos” (não foram acessados nos últimos 90 dias) e que 5% dos dados não estruturados em produção estão relacionados a relatórios financeiros emitidos de quatro em quatro meses.

Conclusão

Sistemas de backup e archive possuem duas funções diferentes e complementares para uma empresa: Backup para cópias rápidas e restauração para minimizar o impacto em caso de falhas, erros humanos e desastres e Archive para efetivamente gerenciar dados para longos períodos de retenção e recuperação. Essas duas funções podem ser aplicadas juntas para otimizar os custos e melhorar a eficácia global da infraestrutura de armazenamento.


Este post é uma tradução livre de “Archive and backup: What’s the difference?” – http://www.computerworld.com/s/article/103645/Archive_and_backup_What_s_the_difference_?taxonomyId=83&pageNumber=1

[twitter-follow screen_name='eduardorizo' show_count='yes']

1 comentário em “Diferenças entre Backup e Archive”

Deixe um comentário para Pedro Henrique Cancelar resposta