Conhecendo as fases da recuperação de desastres

A recuperação de desastres ocorre nas seguintes fases sequenciais:

  1. Fase de ativação: nesta fase, os efeitos do desastre são avaliados e anunciados.
  2. Fase de execução: nesta fase, os procedimentos reais para recuperar cada um dos desastres afetados entidades são executadas. As operações comerciais são restauradas no sistema de recuperação.
  3. Fase de Reconstituição: Nesta fase o sistema original é restaurado e a fase de execução procedimentos são interrompidos.

Fase de Ativação

Uma interrupção ou emergência pode acontecer com ou sem aviso prévio. Um furacão afetando um área geográfica ou a propagação de um vírus esperada em uma determinada data são exemplos de desastres com aviso prévio. No entanto, pode não haver nenhum aviso do estouro de um cano de água ou de um ato criminoso.

A detecção rápida e precisa de um evento de desastre e ter um plano de comunicação adequado são a chave para reduzir os efeitos da emergência de entrada; em alguns casos, pode dar o suficiente tempo para permitir que o pessoal do sistema implemente as ações normalmente, reduzindo assim o impacto do desastre.

O Comitê de Recuperação de Desastres é responsável por lançar a fase de ativação. Deveria ser bem informado sobre os eventos geográficos, políticos, sociais e ambientais que podem representar ameaças às operações de negócios da empresa. Deve ter fontes de informação confiáveis no agências diferentes para evitar alarmes falsos ou reações exageradas a hoaxes.

A fase de ativação envolve:

  • Procedimentos de notificação
  • Avaliação de danos
  • Planejamento de ativação de recuperação de desastres

Procedimentos de Notificação

O procedimento de notificação define as principais medidas tomadas assim que uma interrupção ou emergência foi detectada ou definitivamente prevista. No final desta fase, a equipe de recuperação estará pronta para executar ações de contingência para restaurar as funções do sistema em uma base temporária. Os procedimentos devem conter o processo para alertar o pessoal de recuperação durante os negócios e horário não comercial. Após a detecção do desastre, uma notificação deve ser enviada para o dano equipe de avaliação, para que possam avaliar o dano real ocorrido e implementar ações.

A notificação pode ocorrer por telefone, pager, e-mail ou telefone celular. Uma política de notificação deve descrever os procedimentos a serem seguidos quando o pessoal específico não puder ser contatado. Notificação
dos procedimentos devem ser documentados claramente no plano de contingência.

Uma técnica de notificação geral é uma árvore de chamadas. A árvore de chamadas deve documentar e métodos de contato alternativos e deve incluir procedimentos a serem seguidos se um indivíduo não pode ser contatado.

A equipe a ser alertada deve ser identificada de maneira inequívoca na lista de contatos do plano. Esta lista deve classificar o pessoal por sua função, nome e informações de contato (casa, trabalho e números de pager, endereços de e-mail e endereços residenciais). Se os sistemas interrompidos tiverem interconexão com sistemas externos organizações, um ponto de contato deve ser identificado nessas organizações.

As informações de notificação podem conter o seguinte:

  • Natureza da emergência que ocorreu ou é iminente
  • Perda de vidas ou ferimentos
  • Estimativas de danos
  • Detalhes de resposta e recuperação
  • Onde e quando reunir para instruções ou outras instruções de resposta
  • Instruções para se preparar para realocação durante o período de tempo estimado
  • Instruções para concluir notificações usando a árvore de chamadas (se aplicável)

Avaliação de danos

Para estabelecer como o plano de contingência será executado após uma interrupção do serviço, é crucial para avaliar a natureza e o grau dos danos ao sistema. Esta avaliação de danos deve ser feito tão rapidamente quanto as condições permitem, com a segurança do pessoal dada a mais alta prioridade. Consequentemente, quando possível, a equipe de avaliação de danos é a primeira equipe notificada do incidente.

Vale a pena preparar diretrizes de avaliação de danos para investigar diferentes tipos de grandes alarmes que podem progredir para um desastre. Um exemplo pode ser uma queda repentina de energia observada em um instalação de data center que tem um backup de UPS. A investigação pode determinar se o poder pode ser restaurado antes que o sistema UPS fique sem bateria, caso em que ativando o plano de recuperação de desastre não é necessário, ou não, caso em que o plano pode ser ativado imediatamente.

Os procedimentos de avaliação de danos variam com cada emergência específica; no entanto, o seguinte pode ser considerado em geral:

  • Origem da emergência ou interrupção
  • Potencial para interrupções ou danos adicionais
  • Área afetada pela emergência
  • Status da infraestrutura física
  • Estoque e status funcional dos equipamentos mais importantes
  • Tipo de dano ao equipamento
  • Itens a serem substituídos
  • Tempo estimado para restaurar os serviços normais se os procedimentos de desastre não estiverem em vigor

Planejamento de Ativação

Embora seja benéfico detectar um desastre em seu estágio inicial, colocar um processo de recuperação de desastre em ação para um alarme falso pode paralisar as operações normais de negócios e resultar em custos indevidos. Consequentemente é muito importante que a recuperação de desastres seja ativada apenas quando uma avaliação de danos completa foi conduzido.

O plano de recuperação de desastres deve ter um ou mais critérios para ativação, que se tornam o entrada principal para avaliar se o plano deve ser ativado para cada sistema afetado. Também deve ser determinado se a ativação da resposta a desastres trará os sistemas de volta à linha mais rapidamente do que os procedimentos padrão.

Dependendo da extensão dos danos do desastre, todo o Comitê de Recuperação de Desastres ou uma parte do comitê pode fazer o planejamento de ativação do desastre. O resultado deste planejamento, no mínimo, deve ser:

  • Lista de sistemas e serviços que precisam ser restaurados
  • Suas interdependências e sequência de restauração
  • Estimativas de tempo para cada restauração (documentado no plano)
  • Instruções para relatar falhas aos líderes de equipe
  • Plano de comunicação entre as equipes

Assim que a ativação do desastre for planejada, os líderes de equipe apropriados notificarão a equipe e iniciarão suas respectivas atividades na sequência conforme foram instruídas.

Fase de Execução

As operações de recuperação começam logo após o plano de recuperação de desastre ter sido ativado, apropriado a equipe de operações foi notificada e as equipes apropriadas foram mobilizadas. As atividades de esta fase concentra-se em trazer o sistema de recuperação de desastres. Dependendo da recuperação estratégias definidas no plano, essas funções podem incluir processamento manual temporário, recuperação e operação em um sistema alternativo ou realocação e recuperação em um local alternativo.

Sequência de atividades de recuperação

O procedimento de recuperação reflete as prioridades previamente analisadas durante o planejamento de ativação fase. Por exemplo, se uma sala de servidor foi recuperada após uma interrupção, o mais crítico os servidores devem ser restaurados antes de outros servidores menos críticos. Os procedimentos também devem incluir instruções para coordenar com outras equipes quando certas situações ocorrem, tais como:

  • Uma ação não é realizada dentro do prazo estimado
  • Uma etapa fundamental foi concluída
  • Os itens devem ser adquiridos

Se um sistema deve ser recuperado em um local diferente, itens específicos relacionados a esse serviço devem ser transferidos ou obtidos. Os procedimentos de recuperação devem delegar uma equipe para gerenciar o envio de equipamentos, dados e registros vitais. Os procedimentos devem explicar os requisitos para embalagem, transporte, e comprar materiais necessários para recuperar o sistema.

Procedimentos de Recuperação

O plano de recuperação de desastres deve fornecer procedimentos detalhados para restaurar o sistema ou sistema componentes. Os procedimentos para danos ao serviço de TI devem abordar ações específicas, tais como:

  • Obtenha autorização para acessar instalações ou área geográfica danificadas
  • Notificar usuários associados ao sistema
  • Obtenha o material de escritório e o espaço de trabalho necessários
  • Obtenha e instale os componentes de hardware necessários
  • Obtenha e carregue a mídia de backup
  • Restaurar sistemas operacionais críticos e software de aplicativo
  • Restaurar dados do sistema
  • Teste a funcionalidade do sistema, incluindo controles de segurança
  • Conecte o sistema à rede ou outros sistemas externos

Para evitar confusão em uma situação de emergência, os procedimentos de recuperação devem ser documentados em um formato passo a passo simples, sem assumir ou omitir quaisquer etapas do procedimento.

Fase de Reconstituição

Na fase de reconstituição, as operações são transferidas de volta para a instalação original, uma vez que é gratuito dos efeitos posteriores do desastre e as atividades da fase de execução são posteriormente encerradas. Se o sistema ou instalação original é irrecuperável, esta fase também envolve reconstrução. Daí o a fase de reconstituição pode durar alguns dias a algumas semanas ou até meses, dependendo do gravidade da destruição e a adequação do local para restauração. Assim que a instalação, seja reparado ou substituído, é capaz de suportar suas operações normais, os serviços podem ser movidos para trás. A equipe de execução deve continuar engajada até que a restauração e o teste sejam concluídos.

As seguintes atividades principais ocorrem nesta fase:

Monitore continuamente a aptidão do local ou instalação para reocupação

  • Verifique se o site está livre de efeitos colaterais do desastre e se não há mais ameaças
  • Certifique-se de que todos os serviços de infraestrutura necessários, como energia, água, telecomunicações,
  • segurança, controles ambientais, equipamentos de escritório e suprimentos estão operacionais
  • Instale o hardware, software e firmware do sistema
  • Estabelecer conectividade entre sistemas internos e externos
  • Teste as operações do sistema para garantir a funcionalidade total
  • Desligue o sistema de contingência
  • Encerrar operações de contingência
  • Proteja, remova e realoque todos os materiais sensíveis no local de contingência
  • Providencie para que a equipe de operações retorne às instalações originais
WJ Sales
WJ Sales
Especialista em desenvolvimento de sites, lojas virtuais e sistemas. Faço parte da equipe que compõe a empresa Sales Publicidade. Atuamos em diversas áreas destinada ao Marketing. Faço publicações de artigos em blogs e nas redes sociais.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Enter Captcha Here : *

Reload Image