製品 > メモリーAI™ KV キャッシュサーバー

メモリーの壁を突破する ー さらなる AI 推論のために

ペンギンソリューションズの大容量メモリサーバーアプライアンスで AI アプリケーションを高速化し、効率的なスケーリングを実現

話そう
価格をリクエスト
なぜ大容量メモリサーバーなのか

豊富なメモリーをデプロイして AI パフォーマンスを引き出す

推論のためのAI システムのパフォーマンスは、基本的にメモリーの制約を受けます。

AI モデルの複雑さが増し、企業がエンタープライズ規模の推論を導入するにつれて、クラスターは「メモリウォール」に直面します。メモリ容量と帯域幅の現在の制限は、GPU のパフォーマンスを制約し、レイテンシーを大幅に増加させます。

ペンギンソリューションズは、高度なメモリにおける30年の経験を活かして、共有システムメモリーの大規模なプールを可能にする画期的なCXLベースのメモリーサーバーでこの問題を解決しています。このようにディスアグリゲート(分離)することで、GPUは現在のメモリー制限から解放され、各ノードが必要なものを必要なときに提供できるようになり、クラスターアーキテクチャーに新たな柔軟性と効率性がもたらされます。

豊富で高性能なメモリーを導入することで、既存の GPU への投資を最大限に活用し、新しい AI インフラストラクチャーをエンタープライズ規模のプロダクション推論用に効率的に拡張できます。

データシートをダウンロード

共有システム用のプールメモリーの作成

ディスアグリゲート(分離)されたメモリーはすべてのノードからアクセスできるため、リソースを効率的に利用でき、メモリーを大量に消費するAI ワークロードをサポートできます。

推論のためのレイテンシー SLA に対応

一貫性のある低レイテンシーのパフォーマンスを提供し、要求の厳しいリアルタイム AI 推論要件をサポートします。

クラスターのパフォーマンスを最適化

バランスの取れたメモリアーキテクチャとコンピューティングのボトルネックの軽減により、スループットとスケーラビリティを最大化します。

大容量メモリーサーバーの主なメリット

ペンギンソリューションズ MemoryAI™ KV キャッシュサーバー:AI 推論速度とスケーラビリティの再定義

ペンギンソリューションズの特許出願中のMemoryAI KVキャッシュサーバー(Altus® XE4318GT-KVC)は、CXL メモリーを活用してメモリウォールの課題に対処し、大規模で高性能な推論をサポートすることを目的に設計された大容量メモリーアプライアンスを提供する業界初のKVキャッシュサーバーです。

MemoryAI KV キャッシュサーバーは、計算されたキー/値 (KV) ペアを保存して再利用することで、GPU メモリーから KV キャッシュをオフロードします。このソリューションは、メモリー制約を排除し、TTFT(TTFT)を短縮し、再計算の課題に対処することで、要求の厳しいAI 推論ワークロードで優れたパフォーマンスを実現します。

GPUにアクセス可能なローカルRAMを拡張するように設計されているため、メモリーのボトルネックが軽減され、企業は既存のGPU投資を最大限に活用したり、高スループットの推論に最適化されたクラスターを設計したりできます。

モデル、コンテキストウィンドウ、同時実行の需要が高まるにつれて、AI 主導の環境で厳しいレイテンシーとパフォーマンスの期待に応えたい企業にとって、KVキャッシュサーバーは不可欠です。

話そう
価格をリクエスト

メモリーの壁を打ち破る

KV キャッシュを専用の大容量 CXL ベースのサーバーにオフロードすることで、AI 推論メモリーのボトルネックを解消します。

アクセラレーテッド AI 処理

インテリジェントな KV キャッシュの再利用により、レイテンシーを大幅に削減し、スループットを向上させます。

制限のないスケーリング

最大 8 TB の高度な DDR5 CXL メモリーを含め、合計で最大 11 TB のメモリーを搭載できます。

GPU の効率性を引き出す

コンピューティングのアイドル時間を防ぎます。

19 インチ CXL 対応サーバー

1U
プロセッサー
PCIe スロット
メモリ容量
アイテムが見つかりません。
2U
プロセッサー
PCIe スロット
メモリ容量
アイテムが見つかりません。
3U
プロセッサー
PCIe スロット
メモリ容量
アイテムが見つかりません。
4U
プロセッサー
PCIe スロット
メモリー容量
  • Altus XE4318GT-KVC

    ペンギン・ソリューションズのAltus XE4318GT-KVCサーバーはAltusベースの4Uラックマウントサーバーで、AI 推論中にKVキャッシュサーバーとして使用するために特別に設計されています。デュアルAMD EPYC CPUを搭載し、最大11 TBのCXLベースのメモリ (SMART CXA-8F2W) を搭載できます。

    ラックユニットサイズ:
    4U
    プロセッサ:
    Dual AMD EPYC™ 9005 Series
    PCIe スロット:
    8x PCIe Gen5 x16 FHFL, 2x PCIe Gen5 x16 LP
    メモリ容量:

    11TB DDR5 - 6400 MT/s(88DIMM)

    データシートをダウンロード
  • Altus XE4318GT-CXL

    Altus® XE4318GTCXL サーバーは、大容量のメモリを提供するパワーハウスです。AMD の最新のコンピューティングテクノロジーとスマートモジュラーの最新のメモリーテクノロジーを活用したAltus XE4318GT-CXLは、ペンギンソリューションズが完全に検証およびサポートを行ったCXL サーバーであり、CXL メモリを1台のサーバーあたり最大22TB まで拡張できます。

    ラックユニットサイズ:
    4U
    プロセッサ:
    Dual AMD EPYC™ 9005 Series
    PCIe スロット:
    8x PCIe Gen5 x16 FHFL, 2x PCIe Gen5 x16 LP
    メモリ容量:

    11TB DDR5 - 6400 MT/s(88DIMM)

    データシートをダウンロード
  • 5U
    プロセッサー
    PCIe スロット
    メモリ容量
    アイテムが見つかりません。
    5U
    プロセッサー
    PCIe スロット
    メモリ容量
    アイテムが見つかりません。
    5U
    プロセッサー
    PCIe スロット
    メモリ容量
    アイテムが見つかりません。
    Open Compute Project インフラストラクチャ

    21 インチ CXL 対応 OCP サーバー

    最先端の組織が選べる Open Compute Project (OCP) インフラストラクチャ 費用対効果の高い方法でインフラストラクチャを拡張できます。使用には強い議論があります データセンターのOCPベースのハードウェア: OCP は購入コストとメンテナンスコストが低く、障害発生ポイントが少なく、電源管理をより効率的に行えるように設計されており、セキュリティ上の問題が大幅に軽減されます。

    OU
    プロセッサー
    PCIe スロット
    メモリ容量
    アイテムが見つかりません。
    OU
    プロセッサー
    PCIe スロット
    メモリ容量
    アイテムが見つかりません。
    コールバックをリクエストする

    ペンギンソリューションズの CXL エキスパートにご相談ください

    お客様の AI と HPC インフラストラクチャプロジェクトの目標達成をご支援します。私たちのチームは、高性能で可用性の高いエンタープライズソリューションを設計、構築、導入、管理し、お客様が画期的なイノベーションを実現できるよう支援します。

    お問い合わせ