Disaster Recovery as a Service (DRaaS)
Actualmente, las empresas construyen cada vez más su infraestructura informática en entornos de nube distribuidos. Es práctico, pero ¿qué ocurre si algo va mal? Disaster Recovery es una parte importante de la gestión de continuidad de la empresa y desempeña un papel fundamental en el mantenimiento de los procesos empresariales. Con la DRaaS, Disaster Recovery as a Service, se externaliza la copia de seguridad de sistemas críticos a socios especializados.
Bajo la división Arsys Cloud Solutions, diseñamos Soluciones a tu medida.
¿Qué es la Disaster Recovery as a Service?
La Disaster Recovery as a Service (DRaaS) es un servicio de gestión informática. La DRaaS es un caso especial de Disaster Recovery, o recuperación ante desastres en español. Como entenderemos por el añadido “as a service”, esta tarea se transfiere a un tercero como servicio. El Disaster Recovery as a Service es uno de los servicios informáticos más populares y que más rápido crece del ámbito del Cloud-Computing.
La Disaster Recovery es una parte integral del Business Continuity Management (BCM), o la gestión de la continuidad del negocio. La BCM incluye planes y preparativos para la continuación de los procesos empresariales en caso de fallo parcial o total de sistemas críticos. La Disaster Recovery se encarga de recuperar el estado normal de funcionamiento según lo planeado. El Business Continuity Plan (BCP), que describe los elementos y procesos del BCM, es crucial. Echemos un vistazo a los tres elementos principales del BCP:
Elementos del BCP | Definición |
---|---|
High availability (HA) | Facilitar capacidades y procesos que permitan acceder a los datos y las aplicaciones de una empresa en caso de fallo de los sistemas locales. |
Continuous operations (CO) | Garantizar el mantenimiento de las operaciones durante perturbaciones y de los tiempos de espera planeados. |
Disaster Recovery (DR) | Tener preparados métodos para poder reconstruir todo un sistema informático en otro lugar en caso de avería. |
Actualmente, se utiliza cada vez más la Cloud Disaster Recovery (Cloud DR) en la estrategia de recuperación ante desastres. Con la Cloud DR, los datos necesarios para restaurar los sistemas afectados se almacenan en la nube, en vez de en una memoria física in situ. La Cloud Disaster Recovery ofrece muchas ventajas en comparación con los métodos de copia de seguridad tradicionales, y está previsto que acabe convirtiéndose en la norma.
¿Cuándo es necesaria la Disaster Recovery?
Una característica de la Disaster Recovery (DR) es que una empresa solo la necesita en caso de daños. Si se producen daños, es crucial que haya una recuperación íntegra, pero durante un funcionamiento normal, la Disaster Recovery pasa totalmente a segundo plano, por lo que existe un riesgo latente de prestarle poca atención; al fin y al cabo, nunca hace falta siempre que nada vaya catastróficamente mal.
Una Disaster Recovery poco planificada supone un gran peligro para las empresas, ya que el fallo de sistemas críticos puede acarrear altos costes. En el sector se estima que pueden oscilar entre 100 000 y 1 000 000 de dólares por hora de inactividad. Hay varios motivos que pueden provocar la caída de los sistemas o la pérdida de datos. Veamos los más comunes.
Las siguientes situaciones pueden provocar grandes interrupciones en las operaciones de funcionamiento que requieran la Disaster Recovery:
- Cortes de luz en las instalaciones
- Caída de hardware y de red
- Fallos en el software y sistema informático
- Caída del centro de datos propio
- Ataques contra la seguridad informática
Estas pueden tener distintas causas:
- Fallo humano
- Actos malintencionados
- Catástrofes naturales e incendios
- Robo de equipos informáticos y soportes de datos
- Hardware o software defectuoso
En todos estos casos se aplica esta regla: si no se han tomado las precauciones correctas, la empresa afectada hará frente rápidamente a consecuencias muy graves.
¿Cuáles son los conceptos DRaaS más importantes?
La regla más importante de la Business Continuity Management (BCM) y la Disaster Recovery es que debe estar bien planificada desde el principio. Si solo pensamos en ella cuando el daño ya está hecho, normalmente ya es demasiado tarde. Un sencillo ejemplo ilustrativo: imagina que tienes fotos con valor sentimental guardadas en el portátil. Si te roban el portátil, habrás perdido las fotos. Solo estarás protegido si haces copias de seguridad de manera preventiva y con regularidad en un soporte externo o en la nube.
Durante mucho tiempo, la regla 3-2-1 ha sido la norma en la creación de copias de seguridad. Según ella, deben conservarse tres versiones de cualquier archivo: el original, más dos copias. En otras palabras: doble redundancia. De esta manera, se guarda una copia en un soporte de datos aparte, pero en las mismas instalaciones que el original (on‑site backup). La segunda copia se guarda en un lugar físicamente lejano (off‑site backup).
Copia | Uso |
---|---|
Original | Para procesos empresariales corrientes |
On-site Backup | Al perderse o modificarse el original |
Off-site Backup | Al perderse simultáneamente el original y la copia on‑site |
La Disaster Recovery as a Service se centra en replicar continuamente los datos y sistemas de la empresa. Esto va más allá de simplemente crear copias de seguridad de los datos; incluye toda la infraestructura crítica, sistemas, aplicaciones y datos. El objetivo es poder volver al estado original lo antes posible en caso de fallos, ya que los fallos persistentes pueden conllevar costes elevados.
Se han establecido dos métricas para caracterizar los enfoques de DRaaS. El "Recovery Time Objective" (RTO) y el "Recovery Point Objective" (RPO) se definen en función de los requisitos de la empresa. Basándose en ellos, se pondrán en marcha las medidas adecuadas:
Métrica de Disaster Recovery | Definición |
---|---|
Recovery Time Objective (RTO) | Plazo de tiempo desde que sucede un daño hasta que se restauran completamente los procesos de la empresa |
Recovery Point Objective (RPO) | Plazo de tiempo que puede haber entre dos copias de seguridad, es decir, como mucho, cuántos datos pueden perderse entre la última copia de seguridad y la caída del sistema |
Para que el Recovery Time Objective sea lo menor posible, se utilizan los llamados failover sites. Se trata de réplicas completas de sistemas críticos que se interponen en caso de que fallen los originales. Esto garantiza la continuidad de las operaciones comerciales hasta la recuperación de las capacidades propias.
¿Cómo funcionan las soluciones DRaaS más populares?
Hoy día, muchos proveedores ofrecen Disaster Recovery as a Service. Independientemente del proveedor, las ofertas de DRaaS se dividen en tres grandes clases. Las ofertas DRaaS se diferencian principalmente en el grado de vinculación entre cliente y proveedor:
Modelo DRaaS | Definición | Ventajas | Inconvenientes |
---|---|---|---|
Self-Service DRaaS | El proveedor proporciona el software y aloja las copias de seguridad | Costes más bajos | El cliente ha de gestionar y planificar; debe comprobarse exhaustivamente la integración con el proveedor |
Assisted DRaaS | El proveedor proporciona la experiencia y los recursos para optimizar la DR | Útil cuando hay expertos internos | El cliente carga principalmente con la responsabilidad |
Managed DRaaS | El proveedor toma absolutamente la responsabilidad de la DR; proporciona todos los sistemas y recursos necesarios | No requiere experiencia por parte del cliente | Costes elevados; requiere una estrecha colaboración con el proveedor |
Lo que todas las ofertas de DRaaS tienen en común es que el proveedor proporciona herramientas especiales de Disaster Recovery. Su objetivo es reflejar entornos informáticos completos, incluidos todos los componentes. El ámbito de aplicación abarca desde datos y aplicaciones hasta redes y sistemas completos. Los servidores y dispositivos finales se almacenan más allá de los límites del sistema operativo, incluyendo archivos, bases de datos, máquinas virtuales y contenedores. Una vez duplicados, los componentes están disponibles en caso de fallo y sustituyen a los sistemas averiados.
Normalmente se utilizan varios destinos de copia de seguridad para asegurar los datos. Siguiendo la regla 3-2-1, al menos una de las copias de seguridad está en una ubicación geográficamente remota. Dependiendo del modelo de DRaaS utilizado, el destino de la copia de seguridad remota puede ser un centro de datos local o un medio de almacenamiento basado en la nube. También se pueden utilizar enfoques híbridos. Al igual que en el caso de las copias de seguridad, la recuperación de datos se basa en medios de almacenamiento físicos o virtualizados o basados en la nube, según la implantación. Los datos transferidos a través de la red se cifran para ser transportados.
Además de restaurar los datos y sistemas afectados, las ofertas profesionales de DRaaS suelen incluir otra función esencial para la continuidad del negocio. Con los "failover environments" basados en la nube, en caso de fallo del sistema, se activa un sistema sustituto. Esto permite a los usuarios seguir trabajando con una interrupción mínima.
Para supervisar los sistemas protegidos y controlar las copias de seguridad y los failover environments, la mayoría de las ofertas de DRaaS cuentan con consolas de gestión. Por lo general, se trata de aplicaciones basadas en la web a las que se accede a través del navegador. De esta manera, en caso de fallo, es posible seguir accediendo a la consola, que también funciona desde dispositivos móviles. Algunas ofertas de DRaaS también incluyen una función VPN para acceder a datos seguros y a failover environments.
Desde que se desarrollara la tecnología red y los servidores pudieron conectarse a redes públicas como en internet, han existido ataques a la infraestructura informática de las empresas. Los administradores y técnicos protegen normalmente a los sistemas frente a accesos no permitidos y ataques dos. En los últimos años, ha llegado otro tipo de ataque particularmente inquietante: los ciberdelincuentes infectan un dispositivo con un llamado ransomware, también conocido como “criptotroyano”. Este software anida en el dispositivo y encripta los datos que allí se encuentran. Una vez cifrados, los usuarios reales ya no pueden acceder a los archivos y se les pide que paguen un rescate.
Hoy en día, los criptotroyanos suponen una grave amenaza. Ni siquiera las copias de seguridad convencionales ofrecen ninguna protección, ya que están encriptadas y, por tanto, quedan inutilizadas en caso de emergencia.
En esta nueva situación amenazante, la protección contra el ransomware se ha establecido como una característica importante de las soluciones DRaaS, lo que implica que se utilice una copia adicional de todos los datos protegidos, marcada como "inmutable". Una vez escritos, los datos siempre pueden volverse a leer, pero no modificarse. Esto también se conoce como el modelo "Write Once, Read Many" o WORM.
¿Cuáles son las ventajas e inconvenientes de la DRaaS frente a las copias de seguridad tradicionales?
Antes de que llegara la DRaaS, ya existían soluciones de Backup as a Service (BaaS). Sin embargo, la copia de seguridad única de los datos hoy en día ya no basta. Es necesario duplicar continuamente los datos y los sistemas para que estén inmediatamente listos para ser utilizados en caso de que se interrumpa la actividad. Como todos los desarrollos tecnológicos, la DRaaS también tiene ventajas y desventajas. Las examinamos haciendo especial referencia a las soluciones tradicionales de copia de seguridad. Veamos primero las ventajas de la Disaster Recovery as a Service.
La Disaster Recovery as a Service tiene un enfoque centralizado. Todos los datos y sistemas se guardan continuamente. Como bien es sabido, la gran mayoría de los datos de una empresa son dark data que se olvidan fácilmente. Hacer una copia de seguridad de todos los datos utilizando métodos coherentes reduce el riesgo de que los datos se pasen por alto al hacer una copia de seguridad y restauración y se pierdan en caso de fallo. Dado que normalmente se conservas múltiples versiones de datos de los backups, el DRaaS también es un paso importante para archivar documentos a prueba de auditorías.
Siguiendo la regla del 3-2-1, deben conservarse al menos tres copias de cualquier archivo, una de las cuales debe ser una copia de seguridad off‑site. Utilizar DRaaS con la nube como destino de las copias de seguridad externas conlleva un Recovery Point Objective (RPO) más corto. Como recordatorio, el RPO define el período de tiempo entre dos copias de seguridad de los mismos datos. Utilizar sistemas failover basados en la nube en el contexto de DRaaS supone un importante ahorro de costes. Esto se debe a que, para proporcionar una capacidad comparable, tradicionalmente había que mantener recursos de hardware redundantes como sustituto en caso de catástrofe.
A diferencia de la Backup as a Service, la Disaster Recovery as a Service no solo incluye la copia de seguridad de los datos, sino la duplicación de sistemas completos. En particular, esto incluye también la copia de seguridad de las máquinas virtuales y los contenedores de aplicaciones, que son los elementos básicos de las arquitecturas informáticas modernas. En la restauración, el sistema completo se ensambla a partir de estas piezas individuales. Para resolver correctamente las interdependencias de los componentes individuales, las soluciones DRaaS permiten definir la secuencia de los pasos individuales de recuperación. Esto es particularmente esencial para la ampliamente extendida arquitectura de microservicios.
Ahora nos adentramos en los inconvenientes de la Disaster Recovery as a Service. En primer lugar, vemos que el DRaaS suele incurrir en costes más elevados que la Backup as a Service, pero las soluciones DRaaS también ofrecen mucho más, lo que significa que la comparación de precios no es exacta. Como en todos los servicios “X as a service”, en el DRaaS también existe la amenaza del vendor lock-In, porque cedes el control al proveedor y te haces dependiente de él. Otra posible desventaja de las soluciones DRaaS que cabe mencionar es la pérdida de data sovereignty, en lo que la sede social del proveedor DRaaS desempeña un papel determinante.
¿Cómo encontramos el proveedor DRaaS adecuado?
La Disaster Recovery as a Service está disponible en muchos proveedores de servicios en la nube. Además, hay proveedores establecidos que se especializan en soluciones de Disaster Recovery y Backup. Tradicionalmente, los Managed Service Provider también ofrecían Backup as a Service y en casos especiales los system houses lo implementaban.
Para encontrar al proveedor DRaaS adecuado, debemos seguir el siguiente esquema:
- El primer paso es hacer un inventario. Debemos determinar el estado de las cosas y el alcance de los datos y sistemas de los que hay que hacer una copia de seguridad.
- El siguiente paso es definir nuestros requisitos y objetivos. En particular, los Recovery Time Objective (RTO) y los Recovery Point Objective (RPO) para los datos, las aplicaciones y los servicios implicados.
- Cuando sepamos cómo está configurada nuestra infraestructura y conozcamos nuestros requisitos y objetivos, podremos empezar a seleccionar los candidatos a proveedores. Además de las capacidades técnicas, también son de especial importancia en este caso el cumplimiento de las especificaciones establecidas por parte de los proveedores, así como una estructura de precios justa y comprensible.
- Ahora hay que seleccionar al proveedor adecuado entre los candidatos identificados. A más tardar en este momento, deberían realizarse pruebas para comprobar las capacidades técnicas de los proveedores.
Echemos un vistazo a los puntos más importantes que debe reunir un proveedor de DRaaS profesional.
La copia de seguridad automática y continua de los datos y sistemas críticos es fundamental para una solución DRaaS. La copia de seguridad debe funcionar en todos los sistemas operativos y cubrir todos los tipos de datos importantes. Esto incluye archivos, bases de datos, entornos de servidor y dispositivos de usuario final, así como entornos virtualizados en máquinas virtuales y contenedores. La Continuous Data Protection (CDP) realiza copias de seguridad del estado de todo un centro de datos con una granularidad de hasta un segundo.
Antes de transferirse al proveedor DRaaS, los datos capturados durante el almacenamiento deben ser encriptados automáticamente. Los datos y los sistemas de la copia de seguridad deben comprobarse constantemente en busca de errores y desviaciones de forma automatizada. Deben utilizarse sistemas redundantes y distribuidos globalmente para almacenar los datos.
En caso de daños, el proveedor de DRaaS debe proporcionar al menos dos servicios. En primer lugar, debe restaurar los sistemas afectados. La restauración ha de incluir todos los datos, aplicaciones y sistemas esenciales. A la hora de elegir un proveedor, hay que tener en cuenta que puede ser necesaria la restauración en entornos multicloud. Por otro lado, el proveedor de DRaaS debe interconectar los sistemas failover durante la restauración para que desde el punto de vista del usuario el proceso operativo continúe con las mínimas interrupciones.
Más allá de estos requisitos básicos y en vista de las amenazas actuales, es aconsejable elegir un proveedor de DRaaS que ofrezca antiransomware. Los clientes que deban almacenar una cantidad de datos desorbitada deben tenerlo en cuenta a la hora de elegir un proveedor. La transferencia de enormes cantidades de datos a través de Internet en casos extremos puede llevar varios años, demasiado tiempo restaurar a tiempo los datos. En estos casos, se utilizan dispositivos especiales de almacenamiento de datos móviles, como el famoso "Amazon Snowmobile":