Centros de datos de IA y HPC
Soluciones tolerantes a fallos
Memoria integrada
¿Cómo protege a su organización y a los clientes que confían en su accesibilidad? Cuando trabaja con un proveedor de soluciones de disponibilidad, es importante establecer qué sistema proporcionará el tiempo de recuperación más rápido. O mejor aún, qué sistema garantiza que sus clientes ni siquiera se den cuenta de que el automóvil se ha estrellado cuando su servidor deja de funcionar.
Se producirán interrupciones en los servidores y nos ocurrirán a los mejores de nosotros. Creer lo contrario equivale a conducir un automóvil sin bolsas de aire porque el fabricante prometió que sus automóviles nunca chocarían.
En 2017, el confiable Amazon Web Services (AWS) experimentó una Interrupción de 4 horas eso afectó a todas las empresas que utilizaban AWS como proveedor de back-end. Puede que cuatro horas no parezcan mucho tiempo para restaurar un sistema de esa enormidad. Sin embargo, para los clientes de AWS, como Netflix, a cuyo sitio se accede las 24 horas del día, los 7 días de la semana, fueron cuatro horas muy caras.
Entonces, ¿cómo protege a su organización y a los clientes que confían en su accesibilidad? Cuando trabaja con un proveedor de soluciones de disponibilidad, es importante establecer qué sistema proporcionará el tiempo de recuperación más rápido. O mejor aún, qué sistema garantiza que sus clientes ni siquiera se den cuenta de que el automóvil se ha estrellado cuando su servidor deja de funcionar.
Guía del comprador sobre la prevención del tiempo de inactividad analiza las seis preguntas que debe hacerse para evitar el tiempo de inactividad, incluidos los fallos del servidor. La guía recomienda plantear preguntas como: «En caso de que se produzca un error en el servidor, ¿cuál es el proceso para restaurar las aplicaciones a su funcionamiento normal de procesamiento y cuánto tiempo lleva?» La guía también compara los diferentes niveles de tiempo de inactividad que se pueden esperar con sistemas específicos.
«Si confía en servidores independientes, el tiempo de recuperación puede oscilar entre minutos y días, dado el alto nivel de interacción humana que se requiere para restaurar las aplicaciones y los datos a partir de la copia de seguridad, siempre que haya realizado copias de seguridad del sistema de forma regular.
Con los clústeres de alta disponibilidad, el procesamiento se interrumpe durante una interrupción del servidor y la recuperación puede tardar de minutos a horas, según el tiempo que lleve comprobar la integridad de los archivos, revertir las bases de datos y reproducir los registros de transacciones una vez que se restablezca la disponibilidad. Si el tamaño del clúster fue correcto durante las etapas iniciales de planificación, los usuarios no deberían experimentar un rendimiento más lento de las aplicaciones mientras el servidor defectuoso esté fuera de funcionamiento; sin embargo, es posible que tengan que volver a ejecutar algunas transacciones con un archivo de diario una vez que se reanude el procesamiento normal.
Las soluciones tolerantes a fallos previenen de forma proactiva el tiempo de inactividad con componentes totalmente replicados que eliminan cualquier punto único de fallo. Algunas plataformas administran automáticamente sus componentes replicados y ejecutan todo el procesamiento al mismo tiempo.
Como los componentes replicados ejecutan las mismas instrucciones al mismo tiempo, no hay interrupciones en el procesamiento, incluso si un componente falla. Esto significa que, a diferencia de un servidor independiente o un clúster de alta disponibilidad, la solución tolerante a errores sigue funcionando mientras se resuelve cualquier problema».
Descarga la versión completa Guía del comprador sobre la prevención del tiempo de inactividad y descubra las cinco preguntas restantes que debe hacerse para evitar el tiempo de inactividad.
En Penguin, nuestro equipo diseña, construye, implementa y administra soluciones empresariales de HPC e IA de alto rendimiento y alta disponibilidad, lo que permite a los clientes lograr sus innovaciones revolucionarias.
Comuníquese hoy mismo y analicemos las necesidades de su proyecto de solución de infraestructura.