Managing AI Factory Memory
产品 > MemoryAI™ KV 缓存服务器

突破记忆墙。释放更高水平的 AI 推理。

使用 Penguin Solutions 的大内存服务器设备加速您的 AI 应用并高效扩展。

我们来聊聊吧
索取定价
为何选择大内存服务器

部署充足的内存以解锁 AI 性能

用于推理的 AI 系统性能从根本上受内存的限制。

随着 AI 模型复杂性的增加以及组织部署企业级推理,集群面临 “内存墙”,即当前内存容量和带宽的限制,这限制了 GPU 性能并大大增加了延迟。

Penguin Solutions利用30年的高级内存经验,通过基于CXL的突破性内存服务器来解决这个问题,该服务器支持大型共享系统内存池。这种分解使 GPU 摆脱了当前的内存限制,可以在需要时为每个节点提供所需的内容,并为集群架构提供了新的灵活性和效率。

通过部署充足的高性能内存,您可以最大限度地利用现有 GPU 投资,并高效地扩展新的 AI 基础架构,用于企业规模的生产推理。

下载数据表

创建池内存,供共享系统使用

所有节点均可访问分解内存,从而实现高效的资源利用并支持内存密集型 AI 工作负载。

满足推理延迟 SLA

提供稳定的低延迟性能,以支持苛刻的实时 AI 推理需求。

优化集群性能

通过平衡的内存架构和减少计算瓶颈,最大限度地提高吞吐量和可扩展性。

大内存服务器的主要优点

Penguin Solutions MemoryAI™ KV 缓存服务器:重新定义 AI 推理速度和可扩展性

Penguin Solutions正在申请专利的MemoryAI KV缓存服务器(Altus® XE4318GT-KVC)是业界首款利用CXL内存提供高容量存储器设备的KV缓存服务器,专为解决内存墙问题和支持大规模高性能推理而设计。

MemoryAI KV 缓存服务器的工作原理是存储和重复使用计算出的键/值 (KV) 对,从 GPU 内存中卸下 KV 缓存。该解决方案消除了内存限制,缩短了首次获得令牌的时间 (TTFT),并解决了重新计算的挑战,从而为要求苛刻的 AI 推理工作负载提供了卓越的性能。

它旨在扩展 GPU 可访问的本地 RAM,缓解了内存瓶颈,使组织能够充分利用现有 GPU 投资或设计针对高吞吐量推理进行了优化的集群。

随着模型、上下文窗口和并发需求的增长,KV 缓存服务器对于希望在人工智能驱动的环境中满足严格的延迟和性能预期的企业至关重要。

我们来聊聊吧
索取定价

突破记忆障碍

将 KV 缓存卸载到基于 CXL 的高容量专用服务器,从而消除 AI 推理内存瓶颈。

加速 AI 处理

通过智能 KV 缓存重用显著减少延迟并提高吞吐量。

无限制扩展

使用高达 11 TB 的总内存进行部署,包括令人印象深刻的 8 TB 高级 DDR5 CXL 内存。

解锁 GPU 效率

防止计算空闲时间。

19 英寸支持 CXL 的服务器

1U
处理器
PCIe 插槽
存储器容量
未找到任何物品。
2U
处理器
PCIe 插槽
存储器容量
未找到任何物品。
3U
处理器
PCIe 插槽
存储器容量
未找到任何物品。
4U
处理器
PCIe 插槽
存储器容量
  • Penguin Solutions® Altus® XE4318GT-CXL 服务器。

    Altus XE4318GT-CXL

    Altus® XE4318GT-CXL 服务器是一款大内存发电厂。Altus XE4318GT-CXL 采用 AMD 的最新计算技术和 Smart Modular 的最新内存技术,是 Penguin Solutions 推出的一款经过全面验证和支持的CXL服务器,每台服务器的CXL内存可扩展至高达22TB。

    机架单元尺寸:
    4U
    处理器:
    Dual AMD EPYC™ 9005 Series
    PCIe 插槽:
    8x PCIe Gen5 x16 FHFL, 2x PCIe Gen5 x16 LP
    内存容量:

    11TB DDR5 - 6400 MT/s88DIMM)

    下载数据表
  • 5U
    处理器
    PCIe 插槽
    存储器容量
    未找到任何物品。
    5U
    处理器
    PCIe 插槽
    存储器容量
    未找到任何物品。
    5U
    处理器
    PCIe 插槽
    存储器容量
    未找到任何物品。
    Open Compute 项目基础架构

    21 英寸支持 CXL 的 OCP 服务器

    前沿组织可以选择 Open Compute Project (OCP) 基础架构 以经济实惠的方式扩展其基础架构。有充分的理由使用 数据中心中基于 OCP 的硬件:OCP 的购买和维护成本更低,减少了故障点,旨在提高电源管理的效率,并显著减少了安全问题。

    1OU
    处理器
    PCIe 插槽
    存储器容量
    未找到任何物品。
    2OU
    处理器
    PCIe 插槽
    存储器容量
    未找到任何物品。
    Data center room aisle
    请求回电

    与 Penguin Solutions 的 CXL 专家交谈

    立即联系我们,详细了解我们如何帮助您实现 AI 和 HPC 基础设施项目目标。我们的团队设计、构建、部署和管理高性能、高可用性的企业解决方案,使客户能够实现突破性创新。

    我们来聊聊吧