Network engineer checking cable connections
Servicios > Servicios gestionados

Servicios gestionados por expertos para Peak
Rendimiento de clústeres de HPC e IA

Los servicios gestionados de Penguin Solutions ofrecen excelencia operativa en inteligencia artificial (IA) y computación de alto rendimiento (HPC) con un enfoque centrado en maximizar el rendimiento de la infraestructura y la disponibilidad de la carga de trabajo.

Hablemos

Ofrezca excelencia operativa
a la infraestructura de IA y HPC

Acelere los resultados de inversión

Aproveche un equipo de expertos en gestión de clústeres de IA y HPC con amplia experiencia en infraestructuras de IA a exaescala para acelerar la generación de valor sin interrumpir las operaciones diarias y evitar retrasos en la carga de trabajo.

Logre el máximo rendimiento

Benefíciese de nuestra experiencia de gestión del tiempo de ejecución de GPU de 2.300 millones de horas para mantener el máximo rendimiento, la fiabilidad de las cargas de trabajo y el ROI mediante la optimización automatizada y el mantenimiento predictivo.

Mejore la resiliencia del clúster

Mantenga la continuidad empresarial y reduzca el tiempo de inactividad con la supervisión proactiva de clústeres las 24 horas del día, los 7 días de la semana, el soporte in situ y nuestros equipos operativos de centros de excelencia (COE) que identifican y resuelven los problemas.

La mejor arquitectura de su clase

Nuestra gestión comprobada
Modelo de prestación de servicios

Nuestros servicios gestionados aportan una amplia experiencia operativa a empresas, proveedores de servicios en la nube (CSP), neoclouds e hiperescaladores con nuestra metodología de entrega basada en la experiencia. Nuestro enfoque acelera el tiempo de generación de valor, maximiza el tiempo de actividad y aumenta el ROI.

Data center room aisle

Guías operativas

Resultados consistentes y confiables a través de procedimientos comprobados, plantillas operativas repetibles y manuales de ejecución detallados refinados a lo largo de años de experiencia. Estos manuales consolidan el conocimiento especializado en modelos de ejecución estructurados y repetibles.

ClusterWare on laptop screen on desk

Tecnología y herramientas especialmente diseñadas

Brindamos excelencia operativa y un rendimiento máximo de los clústeres a través de Penguin Solutions ICE ClusterWare™, una plataforma inteligente de administración de clústeres diseñada específicamente para los clústeres de IA modernos. La plataforma unifica todos los componentes del clúster para lograr una optimización y escalabilidad integrales.

Team members reviewing rack storage

Centros de excelencia

Nuestros COE técnicos actúan como centros de experiencia especializada y metodologías estandarizadas. Los expertos técnicos sénior de cada dominio aceleran la entrega de proyectos mediante activos reutilizables, mejoran la calidad mediante enfoques comprobados y dominan continuamente las tecnologías complejas emergentes.

En las noticias

Experiencia en la gestión de grandes clústeres DGX de NVIDIA

Nuestros años de experiencia nos han permitido desarrollar capacidades inigualables para gestionar grandes fábricas de IA. Por ejemplo, estamos ayudando Meta administre el superclúster de Meta Research, con más de 2000 sistemas NVIDIA DGX, 16 000 GPU NVIDIA A100 Tensor Core, 500 PB de almacenamiento y 40 000 enlaces de red NVIDIA InfiniBand.

Penguin Solutions trabajó con el equipo de operaciones de Meta en la integración del hardware para implementar el clúster y configurar las partes principales del plano de control. La experiencia de Penguin en hardware y software ayudó a unir las contribuciones de NVIDIA y Pure Storage.

Juntos, estos tres socios fueron clave para proporcionar a Meta una solución optimizada, el nuevo SuperCluster de investigación de IA (RSC), que permitió a Meta sentar las bases para la Metaverso.

Lea la historia completa
Lea el comunicado de prensa

Ofreciendo una arquitectura optimizada para la IA y
Servicios gestionados por IA

Penguin Solutions sigue proporcionando un tiempo de actividad y una disponibilidad excepcionales para el gran clúster NVIDIA DGX de Meta.

Meta data center

Compatible con NVIDIA DGX certificado
Socio de servicios gestionados de IA

Penguin Solutions ha diseñado grandes clústeres DGX de NVIDIA, con redes NVIDIA InfiniBand de alta velocidad y almacenamiento optimizado. Tenemos relaciones y experiencia con la mayoría de los proveedores de almacenamiento, lo que nos permite ofrecer soluciones a medida para cada cliente.

Meta server racks
Nuestro proceso: servicios adicionales

El mejor de su clase
Administración de clústeres

Los clústeres de cualquier escala son sistemas complejos que requieren experiencia especializada en los dominios de computación, almacenamiento, redes y software. Deje las complejas exigencias operativas de la infraestructura de IA y HPC en manos de especialistas con más de 2 300 millones de horas de experiencia en la gestión del tiempo de ejecución de las GPU.

Adoptamos un enfoque holístico e independiente de la tecnología, y ofrecemos experiencia en todos los proveedores, arquitecturas y protocolos para respaldar su gama de opciones de tecnología. Como proveedor certificado de servicios gestionados NVIDIA DGX Ready, proveedor de soluciones NVIDIA Elite y Dell Gold Partner, ofrecemos visibilidad y gestión integrales tanto para entornos de varios proveedores como para plataformas estandarizadas, mantenemos su infraestructura de IA y HPC lista para trabajar y con el máximo rendimiento.

Server room network engineers
  • Los líderes de compromiso facilitan una comunicación clara, la responsabilidad y la alineación con los objetivos de los clientes y proporcionan a las partes interesadas revisiones de desempeño periódicas.

  • Los expertos en ingeniería de sistemas administran la configuración, el aprovisionamiento y el ciclo de vida completo del hardware de infraestructura, los sistemas operativos, la infraestructura de red y los subsistemas de almacenamiento. Incluye la gestión de las relaciones con los proveedores de componentes.

  • Nuestro equipo de soporte ofrece una disponibilidad y un tiempo de actividad continuos del sistema para las aplicaciones de misión crítica, incluido un depósito local de repuestos para minimizar el tiempo de inactividad debido a problemas de hardware.

  • Los expertos en DevOps ofrecen automatización para reducir los errores humanos, monitoreo y alertas personalizadas para la resolución proactiva de problemas y paneles para una visibilidad y un estado completos del clúster.

  • Los especialistas en servicios de IA y HPC proporcionan registros detallados de los activos desplegados, protegen el almacenamiento de los activos, respaldan la logística in situ, coordinan la RMA, administran los repuestos y realizan un seguimiento preciso del inventario.

  • Nuestro equipo de soporte garantiza el cumplimiento, la integridad y la gobernanza de su infraestructura de IA y HPC.

  • Nuestro proceso: servicios adicionales

    Servicios integrales de infraestructura de HPC e IA

    Penguin Solutions se dedica al éxito de nuestros clientes. Con 25 años de experiencia en HPC en el diseño, la creación, la implementación y la gestión de clústeres de IA y computación acelerada, hemos habilitado algunas de las cargas de trabajo más sofisticadas del mundo.

    Empty server room
    Diseño

    Servicios de infraestructura de diseño

    Acelere el tiempo de obtención de valor basando las arquitecturas de los sistemas en un conjunto comprobado de diseños que se han validado a escala en numerosas implementaciones de producción.

    Descubra nuestro servicio de diseño
    Descubra nuestro servicio de diseño
    Clean room server build cabling
    Construir

    Servicios de infraestructura de edificios

    Logre altas tasas de estabilidad del sistema con nuestros expertos en fábrica que validan todos los componentes del clúster de procesamiento, incluida la integración de racks, la configuración de la red y las pruebas de instalación.

    Descubra nuestro servicio de construcción
    Descubra nuestro servicio de construcción
    Server room network engineers
    Despliegue

    Servicios de infraestructura de despliegue

    Impulse las instalaciones in situ, incluida la coordinación con los socios de almacenamiento de datos, el personal del centro de datos, las infraestructuras de refrigeración del sistema y el uso de nuestro software ClusterWare para validar la preparación de la producción.

    Descubra nuestro servicio de implementación
    Descubra nuestro servicio de implementación
    Woman in data center with tablet
    Solicitar una devolución de llamada

    Hable con los expertos de Penguin Solutions

    Póngase en contacto hoy mismo para analizar cómo nuestros servicios gestionados pueden optimizar su infraestructura de IA y HPC, ofrecer excelencia operativa y acelerar el tiempo de generación de valor para su organización.

    Hablemos