ClusterWare on laptop screen on desk
產品介紹 > ICE 叢集軟體

ICE 叢集軟體™ 智慧基礎架構管理軟體平台

無論是十個節點還是數千個節點,ICE ClusterWare 平台都能統一並自動化叢集部署和管理,簡化作業、簡化管理,並為系統架構設計師和 IT 領導者最佳化效能。

請求示範
人工智慧與高效能運算工作負載

硬體無人工智慧與 HPC 基礎架構管理
軟體平台

ICE ClusterWare 將來自超過三億小時 GPU 執行階段體驗的作業智慧嵌入軟體中,大幅提升團隊部署、管理和最佳化 AI 基礎架構的能力,以實現並維持大規模的叢集峰值效能。

隨著人工智慧 (AI) 和高效能運算 (HPC) 工作負載持續擴大,IT 領導者面臨部署、管理和擴展先進的運算基礎架構的挑戰,以滿足不同使用者群組的安全性和治理需求,同時維持大規模的正常運行時間和效能。

Penguin Solutions 的 ICE 叢集軟件是一個智慧型、不具硬體的軟體平台,可將純金屬硬體、網路和軟體資源無縫整合到統一、高效能運算基礎架構中。

隨著 AI 從試驗到生產的擴展,基礎架構需求會變化。頂尖性能和卓越的營運成為競爭優勢的必要條件。多個團隊需要安全、隔離的叢集存取,而不會犧牲效率。ICE 叢集軟體無縫支援從首次部署到企業規模的這一進化。

下載資料表
ICE ClusterWare on monitor

管理和擴展 AI 和 HPC 工作負載 ICE 叢集軟體平台

ICE ClusterWare 平台簡化了 AI 和 HPC 叢集的部署、管理、監控和擴展,為組織提供智慧型自動化、即時洞察和無縫擴充能力。

ICE ClusterWare on monitor
  • 透過統一的 GUI 和 CLI 控制項將硬體、網路和軟體整合到統一、易於管理的基礎架構中,降低複雜性。

  • 透過零接觸式佈建來降低管理費用,確保更快速的部署和持續系統最佳化。

  • 透過高可用性、不同硬體的組態,以及智慧型工作負載分配,協調數千個節點,以實現最佳效能。

  • 透過運算、網路和 GPU/CPU 指標的即時監控,並具有主動異常偵測和自動修復功能,提供最高的叢集效能和可靠性。

  • 可讓多個使用者社群透過網路隔離的多租戶安全共用基礎架構,在租戶之間提供零信任隔離。

  • 從第一天起支持成長,讓組織能夠擴展 AI 和 HPC 基礎架構,而不會造成營運瓶頸。

  • 由 Penguin Solutions 數十年的 AI 和 HPC 專業知識的支持,確保長期基礎架構可靠性和最大的投資報酬率。

  • 全企業生產能力

    進階效能最佳化

    ICE ClusterWare 進階效能最佳化可提供頂尖效能,並提升叢集彈性和資源可用性,同時降低管理費用。透過使用智慧型自動化主動識別和解決隱藏問題,可以防止單一節點效能不佳降低整個叢集的效率。

    我們正在申請專利的異常偵測技術會持續監控人工智慧基礎架構、在影響工作負載之前偵測問題,並觸發自動自動修復,這意味著只有經過驗證的高效能節點才能接收工作負載,使用者才能獲得所需的效能。

    安全資源共用

    由於越來越多的團隊和客戶需要叢集存取,CIO 必須在不犧牲效率的情況下提供安全、隔離的資源。ICE ClusterWare 可讓組織透過安全地將叢集資源擴充至多個獨立使用者社群 (例如 GPU 即服務客戶和企業部門),藉此將 AI 基礎架構投資報酬率最大化。

    有了網路隔離的多租用服務,ICE ClusterWare 可確保安全性、效能和控管,隨著使用者群組的增加。每個承租人都會收到完全隔離的環境,具有彈性選擇工作負載管理員、管理其使用者,以及安全地執行工作負載。

    Data analyst reviewing monitor
    請求回電

    與企鵝解決方案的專家交談

    與我們的專家聯繫,探索 ICE ClusterWare 如何支持您的智能運算環境 (ICE),無論您是剛剛剛開始還是想要優化和管理現有的 AI 和 HPC 基礎架構。

    不確定從哪裡開始?已經有硬件了嗎?基礎設施已經設置了嗎?

    我們可以幫助。

    讓我們談談
    請求示範