Servidores de expansión de memoria CXL de Penguin Solutions

Por qué elegir servidores Big Memory

Despliegue abundante memoria para desbloquear el rendimiento de la IA

El rendimiento del sistema de IA para la inferencia está fundamentalmente limitado por la memoria.

A medida que aumenta la complejidad de los modelos de IA y las organizaciones implementan inferencias a escala empresarial, los clústeres se enfrentan al «muro de la memoria»: las limitaciones actuales en la capacidad de la memoria y el ancho de banda, que limitan el rendimiento de la GPU y aumentan drásticamente la latencia.

Penguin Solutions aprovecha 30 años de experiencia en memoria avanzada para resolver este problema con innovadores servidores de memoria basados en CXL que permiten grandes conjuntos de memoria de sistema compartida. Esta desagregación libera a las GPU de las limitaciones de memoria actuales para ofrecer a cada nodo lo que necesita, cuando lo necesita, y proporciona una nueva flexibilidad y eficiencia a las arquitecturas de clústeres.

Al implementar una memoria abundante y de alto rendimiento, puede maximizar las inversiones actuales en GPU y escalar de manera eficiente la nueva infraestructura de IA para obtener inferencias de producción a escala empresarial.

Creación de memoria agrupada para uso compartido del sistema

La memoria desagregada es accesible para todos los nodos, lo que permite un uso eficiente de los recursos y admite cargas de trabajo de IA que consumen mucha memoria.

Conozca los SLA de latencia para inferencia

Ofrece un rendimiento uniforme y de baja latencia para cumplir con los exigentes requisitos de inferencia de IA en tiempo real.

Optimice el rendimiento del clúster

Maximice el rendimiento y la escalabilidad con una arquitectura de memoria equilibrada y una reducción de los cuellos de botella informáticos.

Principales ventajas de los servidores de gran capacidad de memoria

Servidor de caché MemoryAI™ KV de Penguin Solutions: redefiniendo la velocidad de inferencia y la escalabilidad de la IA

El servidor de caché MemoryAI KV de Penguin Solutions (Altus® XE4318GT-KVC), pendiente de patente, es el primer servidor de caché KV del sector que aprovecha la memoria CXL para ofrecer un dispositivo de memoria de alta capacidad diseñado específicamente para abordar la pared de memoria y admitir inferencias de alto rendimiento a escala.

El servidor de caché MemoryAI KV funciona almacenando y reutilizando pares clave/valor (KV) calculados, lo que descarga la caché KV de la memoria de la GPU. Esta solución elimina las restricciones de memoria, reduce el tiempo de obtención del primer token (TTFT) y aborda los desafíos de recálculo, lo que permite un rendimiento superior para las exigentes cargas de trabajo de inferencia de IA.

Diseñado para ampliar la RAM local accesible para las GPU, alivia los cuellos de botella de memoria y permite a las organizaciones aprovechar al máximo las inversiones en GPU existentes o diseñar clústeres optimizados para una inferencia de alto rendimiento.

A medida que aumentan los modelos, las ventanas de contexto y las demandas de simultaneidad, el servidor de caché KV es esencial para las empresas que buscan cumplir con las estrictas expectativas de latencia y rendimiento en entornos impulsados por la IA.

Rompe las barreras de la memoria

Descargue la memoria caché KV en un servidor dedicado basado en CXL de alta capacidad, lo que eliminará los cuellos de botella en la memoria de inferencia de IA.

Procesamiento acelerado de IA

Reduzca significativamente la latencia y aumente el rendimiento con la reutilización inteligente de la caché KV.

Escale sin límites

Implemente con hasta 11 TB de memoria total, incluidos los impresionantes 8 TB de memoria DDR5 CXL avanzada.

Libere la eficiencia de la GPU

Evite el tiempo de inactividad de la computación.

Servidor compatible con CXL de 19 pulgadas

1 U

Procesador

Ranuras PCIe

Capacidad de memoria

No se ha encontrado ningún artículo.

Procesador

Ranuras PCIe

Capacidad de memoria

No se ha encontrado ningún artículo.

3 U

Procesador

Ranuras PCIe

Capacidad de memoria

No se ha encontrado ningún artículo.

Procesador

Ranuras PCIe

Capacidad de memoria

Altus XE4318GT-CXL

Dual AMD EPYC™ 9005 Series

8x PCIe Gen5 x16 FHFL, 2x PCIe Gen5 x16 LP

11TB DDR5 - 6400 MT/s (88DIMM)

Altus XE4318GT-CXL

El servidor Altus® XE4318GT-CXL es una gran fuente de memoria. El Altus XE4318GT-CXL, que aprovecha la última tecnología de procesamiento de AMD y la última tecnología de memoria de Smart Modular, es un servidor CXL totalmente validado y compatible de Penguin Solutions con expansión de memoria CXL de hasta 22 TB por servidor.

Tamaño de la unidad de estantería:

Procesador:

Dual AMD EPYC™ 9005 Series

Ranuras PCIe:

8x PCIe Gen5 x16 FHFL, 2x PCIe Gen5 x16 LP

Capacidad de memoria:

11TB DDR5 - 6400 MT/s (88DIMM)

Solicitar precios

5 U

Procesador

Ranuras PCIe

Capacidad de memoria

No se ha encontrado ningún artículo.

5 U

Procesador

Ranuras PCIe

Capacidad de memoria

No se ha encontrado ningún artículo.

5 U

Procesador

Ranuras PCIe

Capacidad de memoria

No se ha encontrado ningún artículo.

Infraestructura de Open Compute Project

Servidor OCP de 21 pulgadas con CXL

Las organizaciones de vanguardia pueden elegir Infraestructura de Open Compute Project (OCP) para ampliar su infraestructura de forma rentable. Hay un fuerte argumento a favor del uso Hardware basado en OCP en un centro de datos: La compra y el mantenimiento del OCP son más baratos, reduce los puntos de falla, está diseñado para una administración de energía más eficiente y reduce significativamente los problemas de seguridad.

1 O

Procesador

Ranuras PCIe

Capacidad de memoria

No se ha encontrado ningún artículo.

2 O

Procesador

Ranuras PCIe

Capacidad de memoria

No se ha encontrado ningún artículo.

Solicita que te devuelvan la llamada

Hable con los expertos en CXL de Penguin Solutions

Póngase en contacto hoy mismo y obtenga más información sobre cómo lo ayudamos a alcanzar los objetivos de su proyecto de infraestructura de IA y HPC. Nuestro equipo diseña, construye, implementa y administra soluciones empresariales de alto rendimiento y alta disponibilidad, lo que permite a los clientes lograr sus innovaciones revolucionarias.

La empresa AI Factory Platform

Penguin Solutions es un proveedor líder de infraestructura de memoria e IA, impulsando las fábricas de IA del futuro para empresas, iniciativas soberanas de IA y proveedores de neocloud.

‍

Basados en décadas de experiencia en ingeniería en la intersección de la memoria y la infraestructura de IA/HPC, integramos software de infraestructura diferenciado, memoria avanzada, sistemas de cómputo, servicios integrales y soluciones de socios líderes en la industria en una plataforma integral de fábrica de IA diseñada para ayudar a los clientes a implementar y escalar cargas de trabajo de IA con velocidad y precisión.

Rompe el muro de la memoria. Da rienda suelta a la inferencia de IA del siguiente nivel.

Despliegue abundante memoria para desbloquear el rendimiento de la IA

Creación de memoria agrupada para uso compartido del sistema

Conozca los SLA de latencia para inferencia

Optimice el rendimiento del clúster

Servidor de caché MemoryAI™ KV de Penguin Solutions: redefiniendo la velocidad de inferencia y la escalabilidad de la IA

Rompe las barreras de la memoria

Procesamiento acelerado de IA

Escale sin límites

Libere la eficiencia de la GPU

Servidor compatible con CXL de 19 pulgadas

Altus XE4318GT-CXL

Servidor OCP de 21 pulgadas con CXL

Hable con los expertos en CXL de Penguin Solutions

La empresa AI Factory Platform

Ponte en contacto

Socios

Empresa