서비스 > 매니지드 서비스

Peak용 전문가 매니지드 서비스
AI 및 HPC 클러스터 성능

Penguin Solutions Managed Services는 인프라 성능 및 워크로드 가용성 극대화에 중점을 두고 인공 지능 (AI) 및 고성능 컴퓨팅 (HPC) 운영 우수성을 제공합니다.

렛츠 토크

운영 우수성 제공
AI 및 HPC 인프라로

투자 결과 가속화

엑사스케일 AI 인프라에 대한 심층적인 전문 지식을 갖춘 AI 및 HPC 클러스터 관리 전문가 팀을 활용하여 일상적인 운영을 방해하지 않고 워크로드 지연을 방지하지 않고도 가치 창출 시간을 단축할 수 있습니다.

최고 성능 달성

23억 시간의 GPU 런타임 관리 경험을 활용하여 자동화된 최적화 및 예측 유지 관리를 통해 최고의 성능, 워크로드 안정성 및 ROI를 유지할 수 있습니다.

클러스터 레질리언스 강화

연중무휴 사전 예방적 클러스터 모니터링, 현장 지원, CoE (Center of Excellence) 운영팀의 문제 파악 및 해결을 통해 비즈니스 연속성을 유지하고 다운타임을 줄일 수 있습니다.

동급 최고의 아키텍처

당사의 검증된 관리형
서비스 제공 모델

당사의 Managed Services는 경험 중심의 전달 방법론을 통해 기업, 클라우드 서비스 제공업체 (CSP), 네오클라우드 및 하이퍼스케일러에게 심층적인 운영 전문 지식을 제공합니다.우리의 접근 방식은 가치 창출 시간을 단축하고 가동 시간을 극대화하며 ROI를 높입니다.

운영 플레이북

검증된 절차, 반복 가능한 운영 템플릿, 다년간의 경험을 통해 개선된 세부 실행 런북을 통해 일관되고 신뢰할 수 있는 결과를 얻을 수 있습니다.이 플레이북은 전문 지식을 체계적이고 반복 가능한 실행 모델로 통합합니다.

용도에 맞게 설계된 기술 및 도구

당사는 최신 AI 클러스터를 위해 특별히 구축된 지능형 클러스터 관리 플랫폼인 Penguin Solutions ICE ClusterWare™ 를 통해 운영 우수성과 최고의 클러스터 성능을 제공합니다.플랫폼은 포괄적인 최적화 및 확장성을 위해 모든 클러스터 구성 요소를 통합합니다.

센터 오브 엑설런스

당사의 기술 COE는 전문 지식과 표준화된 방법론의 허브 역할을 합니다.각 분야의 선임 기술 전문가는 재사용 가능한 자산을 통해 프로젝트 납품을 가속화하고 검증된 접근 방식을 통해 품질을 개선하며 새롭게 등장하는 복잡한 기술을 지속적으로 마스터합니다.

인 더 뉴스

대규모 NVIDIA DGX 클러스터 전문 지식 관리

다년간의 경험을 통해 대규모 AI 팩토리를 운영하면서 타의 추종을 불허하는 역량을 개발할 수 있었습니다.예를 들어, 저희가 도와드리고 있습니다. 메타 2000개 이상의 엔비디아 DGX 시스템, 16,000개의 엔비디아 A100 텐서 코어 GPU, 500PB의 스토리지, 40,000개의 엔비디아 인피니밴드 네트워킹 링크를 갖춘 메타 리서치 슈퍼 클러스터를 관리할 수 있습니다.

Penguin Solutions는 하드웨어 통합에 대해 Meta의 운영 팀과 협력하여 클러스터를 배포하고 컨트롤 플레인의 주요 부분을 설정했습니다.펭귄의 하드웨어 및 소프트웨어 전문 지식은 NVIDIA와 퓨어스토리지의 기여를 하나로 묶는 데 도움이 되었습니다.

이 세 파트너는 함께 Meta에 최적화된 솔루션인 새로운 AI 연구 슈퍼클러스터 (RSC) 를 제공하는 데 핵심적인 역할을 했습니다. 이를 통해 Meta는 이를 위한 토대를 마련할 수 있었습니다. 메타버스.

전체 스토리 읽기
보도 자료 읽기

AI에 최적화된 아키텍처 제공 및
AI 매니지드 서비스

Penguin Solutions는 메타의 대규모 NVIDIA DGX 클러스터에 탁월한 가동 시간과 가용성을 지속적으로 제공합니다.

엔비디아 DGX 지원 인증
AI 매니지드 서비스 파트너

Penguin Solutions는 고속 NVIDIA InfiniBand 네트워킹과 최적화된 스토리지를 갖춘 대규모 NVIDIA DGX 클러스터를 설계했습니다.당사는 대부분의 스토리지 공급업체와 관계 및 전문 지식을 보유하고 있으므로 모든 고객에게 맞춤형 솔루션을 제공할 수 있습니다.

우리의 프로세스: 추가 서비스

동급 최강
클러스터 관리

모든 규모의 클러스터는 컴퓨팅, 스토리지, 네트워킹 및 소프트웨어 도메인 전반에 걸쳐 전문 지식이 필요한 복잡한 시스템입니다.23억 시간 이상의 GPU 런타임 관리 경험을 갖춘 전문가에게 AI 및 HPC 인프라의 복잡한 운영 요구를 오프로드하십시오.

당사는 포괄적이고 기술에 구애받지 않는 접근 방식을 취하여 공급업체, 아키텍처 및 프로토콜 전반에 걸쳐 전문 지식을 제공하여 고객의 다양한 기술 선택을 지원합니다.인증된 NVIDIA DGX Ready 관리형 서비스 제공업체, NVIDIA Elite 솔루션 제공업체 및 Dell Gold Partner로서 당사는 멀티벤더 환경과 표준화된 플랫폼 모두에 대한 종합적인 가시성과 관리를 제공하고, AI 및 HPC 인프라를 즉시 가동하고 효율성을 극대화할 수 있도록 합니다.

  • 참여 리더는 명확한 의사 소통, 책임 및 고객 목표 달성을 촉진하고 이해 관계자에게 정기적인 성과 검토를 제공합니다.

  • 시스템 엔지니어링 전문가는 인프라 하드웨어, 운영 체제, 네트워크 인프라 및 스토리지 하위 시스템의 설정, 프로비저닝 및 전체 수명 주기를 관리합니다.구성 요소 공급업체 관계 관리를 포함합니다.

  • 당사의 지원 팀은 하드웨어 문제로 인한 가동 중지 시간을 최소화하기 위해 예비 부품의 로컬 창고를 포함하여 미션 크리티컬 애플리케이션을 위한 지속적인 시스템 가용성과 가동 시간을 제공합니다.

  • DevOps 전문가는 인적 오류를 줄이기 위한 자동화, 사전 예방적 문제 해결을 위한 맞춤형 모니터링 및 경고, 전체 클러스터 가시성 및 상태를 위한 대시보드를 제공합니다.

  • AI 및 HPC 서비스 전문가는 배치된 자산에 대한 상세 기록을 제공하고, 자산 보관을 보호하고, 현장 물류를 지원하고, RMA를 조정하고, 예비 부품을 관리하고, 재고를 정확하게 추적합니다.

  • 당사의 지원팀은 AI 및 HPC 인프라의 규정 준수, 무결성, 거버넌스를 보장합니다.

  • 우리의 프로세스: 추가 서비스

    AI 및 HPC 인프라 종합 서비스

    Penguin Solutions는 고객의 성공을 위해 최선을 다하고 있습니다.AI 및 가속화된 컴퓨팅 클러스터의 설계, 구축, 배포, 관리 분야에서 25년간 쌓아온 HPC의 경험을 바탕으로 세계에서 가장 정교한 워크로드 중 일부를 지원했습니다.

    디자인

    설계 인프라 서비스

    수많은 프로덕션 배포에서 대규모로 검증된 일련의 검증된 설계를 기반으로 시스템 아키텍처를 구축하여 가치 창출 시간을 단축합니다.

    디자인 서비스 살펴보기
    디자인 서비스 살펴보기
    짓다

    빌딩 인프라 서비스

    랙 통합, 네트워크 구성 및 번인 테스트를 포함하여 컴퓨팅 클러스터의 모든 구성 요소를 검증하는 공장 내 전문가와 함께 높은 시스템 안정성을 달성하십시오.

    빌드 서비스 살펴보기
    빌드 서비스 살펴보기
    배포

    배포 인프라 서비스

    데이터 스토리지 파트너, 데이터 센터 직원, 시스템 냉각 인프라와 협력하고 ClusterWare 소프트웨어를 활용하여 생산 준비 상태를 검증하는 등 현장 설치를 주도합니다.

    배포 서비스 살펴보기
    배포 서비스 살펴보기
    콜백 요청

    Penguin Solutions의 전문가와 상담하세요

    지금 연락하셔서 당사의 매니지드 서비스가 어떻게 AI 및 HPC 인프라를 최적화하고, 운영 효율성을 제공하고, 조직의 가치 창출 시간을 가속화할 수 있는지 알아보십시오.

    렛츠 토크