Centros de datos de IA y HPC
Soluciones tolerantes a fallos
Memoria integrada
Descubra cómo la tecnología abierta está revolucionando el HPC al permitir soluciones escalables y eficientes que preparan los entornos informáticos de alto rendimiento para el futuro con estrategias de OCP innovadoras de Penguin Solutions.
Parece que en estos días aparecen constantemente nuevas y emocionantes tecnologías de computación de alto rendimiento (HPC). Eso significa que los sistemas deben ser flexible para satisfacer la creciente demanda de HPC pero, al mismo tiempo, escala. El problema es que la dependencia de un proveedor lo restringe al ecosistema de ese proveedor en particular, en lugar de permitirle elegir entre un conjunto de opciones más amplio, menos costoso y, a menudo, más innovador.
Tecnología de código abierto, especialmente Soluciones Open Compute Project (OCP), puede ayudar a las organizaciones a eliminar este obstáculo y a aumentar su retorno de la inversión (ROI) hoy mismo y a prepararlas para el inevitable cambio a SDx. Los proveedores de OCP comparten las especificaciones de diseño para que cada uno pueda crear componentes de infraestructura eficientes e interoperables o incluso un sistema completo, como es el caso de proveedores como Penguin Solutions.
Este enfoque reduce los costos y, al mismo tiempo, proporciona un rendimiento sólido, como lo demuestra el programa CTS-1 de la National Nuclear Security Administration (NNSA) del Departamento de Energía (DOE), donde Penguin Solutions ha desplegado 16 superordenadores Top500 basados en OCP desde 2016.
Todos estos sistemas se construyeron utilizando el Tundra® Extreme Scale basada en COP plataforma informática de alto rendimiento que utiliza procesadores Intel® Xeon®, que van desde el Xeon E5 hasta los procesadores escalables Xeon más recientes.
Como resultado, el DOE pudo reducir el costo de los sistemas HPC de aproximadamente 100 millones de dólares por TeraFlop en 1995 a menos de 5000 dólares por TeraFlop en la actualidad (factor de 20 000), con una mayor potencia de cálculo y eficiencia energética con cada generación.
Estos beneficios han provocado que las ventas de infraestructuras basadas en OCP superen los 1.200 millones de dólares en 2017, sin incluir los gastos de los miembros de la junta directiva de OCP, Facebook, Intel, Rackspace, Microsoft y Goldman Sachs, según un estudio del sector.
Hay algunas diferencias entre los diseños OCP y los tradicionales: el ancho útil es mayor (21 pulgadas frente a 17 pulgadas en un rack EIA de «19 pulgadas»), por lo que puede incorporar más tecnología de alto valor en cada unidad de bastidor; los rieles complejos se sustituyen por estantes simples; la alimentación proviene de una fuente de alimentación común, lo que reduce drásticamente la cantidad de fuentes de alimentación y elimina las unidades de distribución de energía (PDU) y los cables de alimentación como oportunidades de fallo.
Como resultado, los costos de los nodos se reducen entre un 15 y un 20% y la confiabilidad mejora en comparación con los servidores de 19 pulgadas. Añada la eficiencia de procesadores como el Procesador escalable Intel Xeon familia y eso se expande aún más.
Además, el servicio para los servidores OCP se realiza desde el principio, lo que permite reemplazar los sistemas in situ, lo que hace que el mantenimiento sea más sencillo y menos costoso. También hay miles de sistemas operativos abiertos, pilas de software, pilas de redes y otros tipos de software compatibles y probados entre los que elegir, todos los cuales cuestan menos que el software propietario.
Las especificaciones de diseño le brindan la flexibilidad de usar diferentes tecnologías de hardware, como X86, ARM, almacenamiento y cualquier cosa definida por software (SDx). El OCP incluye todo el ecosistema de tecnologías de infraestructura, incluidos los componentes de centros de datos, HPC e inteligencia artificial (IA).
En combinación con la estandarización y la modularidad, puede configurar los sistemas para lo que necesite. Incluso puede integrar aceleradores de unidades de procesamiento gráfico (GPU) en los servidores, lo que allana el camino para futuros entornos heterogéneos.
Esto también significa que ya no tendrá que reemplazar todo el sistema en función del ciclo de vida del componente de menor duración. En su lugar, reemplaza o actualiza los componentes modulares y mantiene su inversión en el sistema general. Así, por ejemplo, a medida que salgan procesadores nuevos y más potentes, podrá cambiarlos por los procesadores antiguos y obtener más potencia sin tener que comprar un sistema completo.
A algunas personas les preocupa la seguridad, pero los sistemas basados en OCP no son ni más ni menos vulnerables a los ataques que otros sistemas informáticos. Sus necesidades de seguridad no son diferentes a las de un entorno de 19 pulgadas, como usar un cifrado específico en los datos y restringir adecuadamente las redes y el acceso a sus sistemas.
Puede disfrutar de la ventaja de que más expertos en seguridad examinen y mejoren las soluciones que implementa. En resumen, hay muchas razones para elegir tecnologías abiertas, especialmente OCP. La próxima vez que su organización esté considerando un cambio de infraestructura, dedique un momento a ver cómo el OCP puede ayudarlo a obtener un mayor ROI y, tal vez, incluso a superar a la competencia. Más información sobre el valor de la tecnología basada en OCP y cómo Penguin Solutions añadirá valor a su organización mediante el uso de soluciones informáticas de tecnología abierta.
En Penguin, nuestro equipo diseña, construye, implementa y administra soluciones empresariales de HPC e IA de alto rendimiento y alta disponibilidad, lo que permite a los clientes lograr sus innovaciones revolucionarias.
Comuníquese hoy mismo y analicemos las necesidades de su proyecto de solución de infraestructura.