Penguin Solutions 的 CXL 内存扩展服务器

为何选择大内存服务器

部署充足的内存以解锁 AI 性能

用于推理的 AI 系统性能从根本上受内存的限制。

随着 AI 模型复杂性的增加以及组织部署企业级推理，集群面临 “内存墙”，即当前内存容量和带宽的限制，这限制了 GPU 性能并大大增加了延迟。

Penguin Solutions利用30年的高级内存经验，通过基于CXL的突破性内存服务器来解决这个问题，该服务器支持大型共享系统内存池。这种分解使 GPU 摆脱了当前的内存限制，可以在需要时为每个节点提供所需的内容，并为集群架构提供了新的灵活性和效率。

通过部署充足的高性能内存，您可以最大限度地利用现有 GPU 投资，并高效地扩展新的 AI 基础架构，用于企业规模的生产推理。

创建池内存，供共享系统使用

所有节点均可访问分解内存，从而实现高效的资源利用并支持内存密集型 AI 工作负载。

满足推理延迟 SLA

提供稳定的低延迟性能，以支持苛刻的实时 AI 推理需求。

优化集群性能

通过平衡的内存架构和减少计算瓶颈，最大限度地提高吞吐量和可扩展性。

大内存服务器的主要优点

Penguin Solutions MemoryAI™ KV 缓存服务器：重新定义 AI 推理速度和可扩展性

Penguin Solutions正在申请专利的MemoryAI KV缓存服务器（Altus® XE4318GT-KVC）是业界首款利用CXL内存提供高容量存储器设备的KV缓存服务器，专为解决内存墙问题和支持大规模高性能推理而设计。

MemoryAI KV 缓存服务器的工作原理是存储和重复使用计算出的键/值 (KV) 对，从 GPU 内存中卸下 KV 缓存。该解决方案消除了内存限制，缩短了首次获得令牌的时间 (TTFT)，并解决了重新计算的挑战，从而为要求苛刻的 AI 推理工作负载提供了卓越的性能。

它旨在扩展 GPU 可访问的本地 RAM，缓解了内存瓶颈，使组织能够充分利用现有 GPU 投资或设计针对高吞吐量推理进行了优化的集群。

随着模型、上下文窗口和并发需求的增长，KV 缓存服务器对于希望在人工智能驱动的环境中满足严格的延迟和性能预期的企业至关重要。

突破记忆障碍

将 KV 缓存卸载到基于 CXL 的高容量专用服务器，从而消除 AI 推理内存瓶颈。

加速 AI 处理

通过智能 KV 缓存重用显著减少延迟并提高吞吐量。

无限制扩展

使用高达 11 TB 的总内存进行部署，包括令人印象深刻的 8 TB 高级 DDR5 CXL 内存。

解锁 GPU 效率

防止计算空闲时间。

19 英寸支持 CXL 的服务器

处理器

PCIe 插槽

存储器容量

未找到任何物品。

处理器

PCIe 插槽

存储器容量

未找到任何物品。

处理器

PCIe 插槽

存储器容量

未找到任何物品。

处理器

PCIe 插槽

存储器容量

Altus XE4318GT-CXL

Dual AMD EPYC™ 9005 Series

8x PCIe Gen5 x16 FHFL, 2x PCIe Gen5 x16 LP

11TB DDR5 - 6400 MT/s（88DIMM)

Altus XE4318GT-CXL

Altus® XE4318GT-CXL 服务器是一款大内存发电厂。Altus XE4318GT-CXL 采用 AMD 的最新计算技术和 Smart Modular 的最新内存技术，是 Penguin Solutions 推出的一款经过全面验证和支持的CXL服务器，每台服务器的CXL内存可扩展至高达22TB。

机架单元尺寸：

处理器：

Dual AMD EPYC™ 9005 Series

PCIe 插槽：

8x PCIe Gen5 x16 FHFL, 2x PCIe Gen5 x16 LP

内存容量：

11TB DDR5 - 6400 MT/s（88DIMM)

索取定价

处理器

PCIe 插槽

存储器容量

未找到任何物品。

处理器

PCIe 插槽

存储器容量

未找到任何物品。

处理器

PCIe 插槽

存储器容量

未找到任何物品。

Open Compute 项目基础架构

21 英寸支持 CXL 的 OCP 服务器

前沿组织可以选择 Open Compute Project (OCP) 基础架构以经济实惠的方式扩展其基础架构。有充分的理由使用数据中心中基于 OCP 的硬件：OCP 的购买和维护成本更低，减少了故障点，旨在提高电源管理的效率，并显著减少了安全问题。

1OU

处理器

PCIe 插槽

存储器容量

未找到任何物品。

2OU

处理器

PCIe 插槽

存储器容量

未找到任何物品。

请求回电

与 Penguin Solutions 的 CXL 专家交谈

立即联系我们，详细了解我们如何帮助您实现 AI 和 HPC 基础设施项目目标。我们的团队设计、构建、部署和管理高性能、高可用性的企业解决方案，使客户能够实现突破性创新。

AI工厂平台公司

Penguin Solutions 是内存与 AI 基础设施的领先供应商，致力于为企业、主权 AI 计划和新型云公司，打造未来的 AI 工厂。

‍

凭借在内存与AI/HPC基础设施领域数十年的工程技术经验，我们整合了差异化的基础设施软件、先进内存、计算系统、端到端服务以及行业领先的合作伙伴解决方案，构建了一个全栈AI工厂平台，旨在协助客户快速且精准地部署和扩展AI工作负载。

突破记忆墙。释放更高水平的 AI 推理。

部署充足的内存以解锁 AI 性能

创建池内存，供共享系统使用

满足推理延迟 SLA

优化集群性能

Penguin Solutions MemoryAI™ KV 缓存服务器：重新定义 AI 推理速度和可扩展性

突破记忆障碍

加速 AI 处理

无限制扩展

解锁 GPU 效率

19 英寸支持 CXL 的服务器

Altus XE4318GT-CXL

21 英寸支持 CXL 的 OCP 服务器

与 Penguin Solutions 的 CXL 专家交谈

AI工厂平台公司

取得联系

合作伙伴

公司