¿Su empresa depende de servicios en la nube, bases de datos, servidores remotos o datos almacenados de algún tipo?
Claro que sí.
¿Teme constantemente el tiempo de inactividad?
Claro que sí.
En nuestro mercado de 24 horas, siempre encendido, siempre conectado y con alguien despierto, el tiempo de actividad es fundamental. Sencillamente, quedarse sin cobertura es malo para el negocio… y es inaceptable. Por eso son tan importantes las soluciones de ingeniería de alta disponibilidad, como las que ofrecen Liquid Web y otras empresas modernas de alojamiento web. Desde la infraestructura de alta disponibilidad y las bases de datos SQL, hasta la replicación redundante, los registros de transacciones y la eliminación de puntos únicos de fallo, un alojamiento web es tan bueno como sus servicios de ingeniería de alta disponibilidad (HA).
Supongamos que su aplicación se alojará en una infraestructura gestionada tradicional.
Ahora, veamos por qué un servidor de alta disponibilidad es una solución mejor.
Alta disponibilidad resumida
Cuando se trata de HA, se deben considerar los tres principios de la ingeniería de fiabilidad:
- Reducir o eliminar los puntos únicos de fallo.
- En los sistemas redundantes, asegúrese de que los puntos de cruce son fiables.
- El sistema implantado debe detectar y reaccionar ante los fallos en tiempo real.
Cuando estos tres principios se aplican de forma fiable, se consigue una reducción significativa del tiempo de inactividad. Un alojamiento web de calidad tendrá estos principios en mente cuando diseñe sus servicios.
Reducir los puntos únicos de fallo en un sistema de HA significa redundancia en los datos-virtuales, físicos o una combinación de ambos. Una estructura de HA tendrá un volumen primario, y al menos un volumen físico de respaldo. Una configuración estándar se compone de dos volúmenes primarios idénticos respaldados por dos volúmenes físicos idénticos de Dispositivo de Bloques Replicados Distribuidos (DR:BD), respaldados por dos volúmenes virtuales DR:BD. Los volúmenes DR:BD realizan una replicación de datos selectiva y sincrónica, lo que significa que sólo los bloques de datos modificados (y no todo el volumen) se reescriben y se respaldan en tiempo real.
Los volúmenes DR:BD reducen en última instancia los tiempos de copia de seguridad, ya que requieren menos recursos informáticos a la vez. Cada nivel de copia de seguridad (dos volúmenes primarios idénticos, dos volúmenes virtuales DR:BD idénticos, etc.) se almacena en servidores físicos separados; algunos hosts incluso realizan copias de seguridad en un servidor en una ubicación remota. Una configuración con una ubicación remota elimina otro punto único de fallo al proteger sus datos de los desastres naturales y otros problemas basados en la ubicación, como los cortes de energía y los fallos de la red.
Qué hacer con la base de datos
En un sistema de HA, se recomienda que su base de datos SQL se almacene en un entorno de servidor separado y redundante, ya que mejora el rendimiento y reduce la sobrecarga de su servidor primario. Un servidor SQL dedicado también trabaja con/hacia los principios de la ingeniería de fiabilidad, ya que está diseñado específicamente para la alta disponibilidad, incluyendo cruces automatizados y fiables y la detección de fallos en tiempo real.
Las bases de datos SQL también crean registros de transacciones incrementales; otra protección contra los puntos únicos de fallo. Los registros de transacciones registran cada cambio en la base de datos a intervalos establecidos con una frecuencia de hasta un minuto: la base de datos SQL puede utilizar los registros de transacciones como un conjunto de datos, escribiendo en los servidores de copia de seguridad en su configuración de HA.
La configuración estándar de Liquid Web para el alojamiento de bases de datos SQL incluye una copia de seguridad diaria de toda la base de datos y 24 horas de registros de transacciones por hora.
Monitorización para Failover
En el núcleo de la configuración de HA debe haber un sistema de monitorización que esté constante y consistentemente vigilando la salud de los servidores agrupados y realizando automáticamente los failovers cuando sea necesario. El subsistema de monitorización más popular en la industria es Heartbeat. Heartbeat es un monitor basado en Linux que puede soportar de forma fiable múltiples nodos. Heartbeat puede identificar con rapidez y precisión los fallos críticos y realizar automáticamente la transición del sistema a un servidor redundante.
Como se puede ver, cada parte del sistema de HA trabaja con/para más de uno de los tres principios de la ingeniería de alta disponibilidad. Los nodos de datos redundantes (físicos y virtuales) reducen los puntos únicos de fallo y crean puntos de cruce fiables.
Un servidor SQL dedicado crea otra capa de redundancia, otra protección contra los puntos únicos de fallo, y tiene puntos de cruce integrados y automatizados.
Por último, Heartbeat se sitúa en el centro de toda la configuración, supervisando el sistema en tiempo real y automatizando los cruces cuando es necesario.
Con un sistema de HA de calidad, el tiempo de inactividad se reduce o prácticamente se elimina, manteniendo su negocio en funcionamiento todo el día, todos los días.