Como Ejecutar Un Plan de Recuperación de Desastres (DRP)

agosto 18, 2011 3 Comments

Recuperacion de Desastres y Continuidad del Negocio

El término «Recuperación de Desastres» nos trae a la mente una destrucción catastrófica, pero en realidad, una simple falla en la energía eléctrica puede causar un pequeño desastre en la empresa. Sin un Plan de Recuperación de Desastres (Disaster Recovery Plan) en forma, la pérdida de hasta un simple switch de red puede convertirse en un problema mayor, consumiendo tiempo valioso para la organización.

 

Fundamentos Para un Plan de Recuperación de Desastres

Los Administradores del área de T.I. deben comenzar por hacer un inventario completo y donde se encuentra localizado cada uno de los equipos al momento de hacer el Plan de Recuperación de Desastres. Este inventario debe incluir switches, controladores WLAN, Access Points, otros dispositivos de red que se encuentren conectados a esta.

Un inventario adecuado ayudará al administrador determinar cuales son las partes de repuesto que debemos tener a la mano en caso de problemas de hardware, o en eventos como caída de rayos o tuberías reventadas de agua sobre los racks.

Si el presupuesto lo permite, es conveniente, para el administrador de T.I., tener algunos equipos de comunicación de respaldo, como switches, ruteadores, etc. o cualquier otro equipo critico que pueda fallar.

Una vez que se tiene todo el inventario de equipo, los administradores deberán capturar los datos de configuración de cada uno de los equipos y resguardarlos en una locación alterna segura y de rápido acceso. Una NCCM (Network Change and Configuration Management) es una herramienta que nos permite automatizar el proceso de captura de datos.

 

Lista de Verificación Para Un Plan de Recuperación de Desastres

Cuando hablamos de ejecutar una Recuperación de Desastres de nuestra red o de la Continuidad del Negocio, el tiempo y la precisión son de alta importancia. Las metas de una recuperación de desastres y la continuidad del negocio son sensitivos en el tiempo y bastante críticos, por lo que el uso de una Lista de Verificación se convierte en una herramienta ideal cuando nos afrontamos a una situación en donde esos planes requeridos.

Las siguientes actividades definen una seria de acciones o actividades que deben entrar en juego cuando se requiere ejecutar una recuperación de desastres:

  • Detectar Una falla y efectos de desastres lo más rápido posible
  • Notificar a los responsables que deben tomar acción
  • Aislar los sistemas afectados para limitar el alcance de las fallas y daños
  • Reparar o reemplazar sistemas críticos, y trabajar hacia una continuidad en las operaciones normales, si es que las circunstancias lo permiten.

 

Que Incluir En Una Lista de Verificación de Un DRP

Cada Lista de Verificación comienza con el inventario de equipos de red y de sistemas, servicios y aplicaciones, en donde existe una lista de verificación separada para cada objeto. Cuando es para equipo de red, es muy importante incluir elementos clave de infraestructura, como ruteadores, switches y dispositivos de optimización de la WAN.

Es también muy importante modelar diferentes tipos de fallas para asegurarnos que los planes y listas de verificación se direccionen adecuadamente. Esto incluye accesos, equipos, medias y fallas de los sistemas.

En general, debes crear una receta paso por paso para cada tipo de falla por cada objeto del inventario. Las fallas mas obvias en los dispositivos deberán pasar por los siguientes pasos:

  • Ejecutar diagnósticos para establecer el estado del dispositivo. Esto incluye una serie de paso por paso de comandos y acciones GUI documentadas para soportar las operaciones necesarias.
  • Para las fallas mas obvias, crea un perfil de configuración de importación para repuestos. Muestra información de donde puedes encontrar repuestos, como revisar uno, que debes desconectar del dispositivo viejo y como conectar el nuevo.
  • Ejecutar diagnósticos en la unidad de reemplazo para asegurarnos que funciona adecuadamente. Esta es una serie de comandos paso por paso o acciones GUI como primer paso.
  • Quitar la unidad con el fallo y reemplazarla con la unidad nueva probada.
  • Probar la unidad nueva para asegurarnos que los servicios de prueba funcionen adecuadamente. Define una serie detallada de revisión de las operaciones, lo más ideal para esto es que sea por medio de scripts de prueba automatizados.
  • Si la unidad pasa las pruebas, repórtalo como reemplazo y restauración exitosa, si las pruebas fallan, regresa al primer paso.

Conforme todo el staff trabaje con estos planes de contingencia, estarán interactuando y compartiendo preguntas y dudas que te podrán ayudar para futuras auditorias, o para ajustar algunos pasos o listas de verificación que ya existan para ir mejorándolas, o para hacerlas relevantes y utilizables continuamente. Debemos encaminar a que el personal involucrado entienda la importancia de esta actividad.

 

Otros links:

Escogiendo la Mejor Herramienta Para Migrar a Windows 7

Métodos para Implementar una ITIL Exitosa

Complementos en Excel 2007 – Como se Agregan y Administran?

  

Sistemas y Calidad Total

 

Tags: , , , , , , , , , , , , , , , , , , , , , , , Tecnología de Información

Los 7 Principios de Gestión de la Calidad

Tweet A continuación se describen brevemente los 7 Principios de Gestión de la Calidad que debemos de tener en mente...

Como Evaluar Software

Tweet Antes de comenzar con este artículo, quisiera pedirles una disculpa a todos mis lectores por haberme desaparecido por...

Como Implementar un Análisis Modal de Fallos y Efectos (AMFE) y Planes de Control

Tweet Ya tiene más de un mes que no publicaba nada, he estado en algunos otros proyectos los cuales...

Como Mantener el Buen Desempeño del Sistema de Gestión de Calidad

Tweet Cuando un Sistema de Gestión de Calidad (SGC) dentro de una empresa no esta funcionando como realmente se...

5 Tips de Seguridad Para un Controlador de Dominio

Tweet   Un controlador de dominio (DC) es solo eso, un controlador. Ellos controlan la autenticación, posible autorización, algo...

Preparación de Listas de Verificación o Cuestionarios de Auditoria (Checklist de Auditoria de Calidad)

Tweet La actividad final de pre-auditoria debe completarse antes de que la auditoria interna sea emprendida con el fin...

Como Borrar Un Archivo Que No Se Deja Borrar en Windows 7

Tweet Algunas vez te ha sucedido que intentas borrar algún archivo o carpeta y te manda un mensaje diciendo...

La Pregunta Más Importante Que Un Gerente Puede Hacer

Tweet Hablando un poco de Calidad Laboral, cuando fue la última vez que les preguntaste a los individuos del...

Integrando la Seguridad de un Switch con el Control de Acceso a Red (NAC)

Tweet El acceso autenticado asegura que un usuario tenga que introducir sus datos de acceso o credenciales, para poder...

Cero No Conformidades en Auditoria Externa de ISO 9001… Un Gran Logro!

Tweet   En esta publicación no hablare de algún tema en especifico, solamente quisiera compartirles un gran logro que...

Acordando El Programa de Auditoria de ISO 9001

Tweet Me han preguntado en varias ocasiones como es que programo mis auditorias, y en esta breve publicación les...

Actividades de una Auditoria Interna de ISO 9001

Tweet Para llevar a cabo una buena auditoria interna de ISO 9001, la preparación es de suma importancia. Esta...

Como Ejecutar Un Plan de Recuperación de Desastres (DRP)

Tweet El término «Recuperación de Desastres» nos trae a la mente una destrucción catastrófica, pero en realidad, una simple...

Escogiendo la Mejor Herramienta Para Migrar a Windows 7

Tweet Los profesionales de T.I. minimizan mucho los problemas asociados con la migración a Windows 7 gracias a algunas...

Es Bueno Hablar de Más en una Auditoria Interna de ISO 9001?

Tweet Como auditores de ISO 9001, todos sabemos que algunas veces no es bueno dar más respuestas fuera de...