Por lo tanto, en Stratus somos y hemos sido líderes en infraestructura informática confiable durante décadas. Sin embargo, al igual que muchos términos tecnológicos, la definición de alta disponibilidad (HA) es muy amplia. El año pasado vimos una encuesta de una firma de analistas muy respetada que decía que la mayoría de los encuestados pensaba que la alta disponibilidad significaba tener un plan de recuperación ante desastres. Y hemos descubierto que la definición también cambia cuando se habla con personas con experiencia en las diferentes plataformas informáticas (es decir, el mainframe y el dev/ops ven esto de manera muy diferente). IDC tiene un conjunto de niveles de disponibilidad que ha utilizado durante años, pero parecen un poco amplios, ya que la mayoría de las tecnologías que existen pertenecen a la categoría AL3 superamplia.

Entonces, ¿qué es la alta disponibilidad? Estas son nuestras definiciones agrupadas por impacto en el usuario final.

Impacto significativo en los usuarios finales (generalmente se mide en horas de inactividad; IDC denomina a esto AL1 y AL2)

Desprotegido: es probable que esto sea bastante fácil de entender. Se trata de una carga de trabajo que no tiene funciones de confiabilidad especiales implementadas en la capa de aplicación, hipervisor o infraestructura. Si cae, está bajando.

Respaldo: se trata de una carga de trabajo que se copia (o captura instantáneas) periódicamente en un nodo o centro de datos diferente. Esta es una buena medida de cumplimiento y puede ayudar a recuperarse (si tiene horas o más)

Recuperación ante desastres: se trata de una forma de copia de seguridad más sólida que se automatiza para una recuperación más rápida en caso de que se produzca una falla importante (podría ser un error humano o una falla importante del centro de datos debido a las condiciones meteorológicas)

Impacto mínimo para el usuario final (generalmente se mide en segundos o minutos de inactividad; IDC lo denomina AL3)

Alta disponibilidad automatizada: esto es muy común en el mundo virtualizado. Cuando se produce un error, se reimplementa una nueva instancia de la carga de trabajo en un nuevo nodo o centro de datos. Una implementación común de esto es la función HA de VMware. Esta función tiene un impacto mínimo en la infraestructura, pero tiene una interrupción de usuario bastante alta y se pierden todos los datos durante el vuelo. Esta es una buena solución para aplicaciones escaladas y con equilibrio de carga, como servidores web.

Alta disponibilidad instantánea: este es el mundo de los clústeres en el mundo industrial o de las instancias redundantes y el almacenamiento replicado en el mundo virtualizado. La interrupción del servicio es mínima (incluso de menos de un segundo en algunos casos). Sin embargo, se pierden todos los datos o transacciones a bordo. Si su aplicación no tiene estado pero no tiene equilibrio de carga, esta es una excelente solución.

Impacto cero para el usuario final (sin tiempo de inactividad; IDC lo llama AL4)

Tolerancia a fallos: esta es una capacidad que antes solo se conocía en el mundo de los mainframes y los miniordenadores. Sin embargo, Stratus fabrica soluciones de hardware, software y nube que proporcionan este nivel de protección a los sistemas operativos e hipervisores estándar a un precio comparable al de los niveles de protección más bajos. La tolerancia a fallos es una redundancia completa de la carga de trabajo que también comparte los datos de vuelo y el estado de la aplicación. Esto significa que hay un funcionamiento continuo e ininterrumpido incluso en caso de fallo.

Tolerancia a fallos en varios sitios: este es el nivel más alto de protección que puede obtener una carga de trabajo. Proporciona tolerancia a fallos, por lo que no hay pérdida de estado ni de datos, pero las cargas de trabajo redundantes se alojan en diferentes sitios. Naturalmente, este tipo de solución conlleva un coste de red más alto, pero si solo los niveles más altos son suficientes, es lo mejor.

Esperemos que esto ayude a desmitificar todos los tipos de protección que puede obtener. Al evaluar lo que necesita, tenga en cuenta no solo lo que se está protegiendo específicamente, sino también el tiempo de recuperación y los costos de infraestructura, principalmente el procesamiento y las redes.

¿Desea obtener más información sobre la disponibilidad en Stratus? ¡Haz clic en el enlace de abajo!

Imagen del autor

Artículos relacionados

Server aisle

Hable con los expertos en
Penguin Solutions

En Penguin, nuestro equipo diseña, construye, implementa y administra soluciones empresariales de HPC e IA de alto rendimiento y alta disponibilidad, lo que permite a los clientes lograr sus innovaciones revolucionarias.

Comuníquese hoy mismo y analicemos las necesidades de su proyecto de solución de infraestructura.

Hablemos