AI 和 HPC 数据中心
容错解决方案
集成内存
如今,令人兴奋的新高性能计算 (HPC) 技术似乎不断出现。这意味着系统必须 灵活的 以满足对HPC不断增长的需求,但同时, 规模。问题在于,供应商锁定会限制您进入该特定供应商的生态系统,而不是允许您从更广泛、更便宜且通常更具创新性的选项中进行选择。
开源技术,尤其是 Open Compute Project (OCP) 解决方案,可以帮助组织消除这一障碍,提高当今的投资回报率 (ROI),为不可避免地向 SDx 的转变做好准备。OCP供应商共享设计规范,这样每个供应商都可以构建高效、可互操作的基础设施组件甚至整个系统,就像Penguin Solutions等供应商一样。
这种方法可以降低成本,同时提供强劲的性能,能源部(DOE)的国家核安全管理局(NNSA)的 CTS-1 计划就证明了这一点 自 2016 年以来,Penguin Solutions 已经部署了 16 台基于 OCP 的前 500 强超级计算机。
这些系统都是使用以下方法构建的 基于 OCP 的 Tundra® 极限比例 使用英特尔® Xeon® 处理器的高性能计算平台,从 Xeon E5 到最新的 Xeon 可扩展处理器。
结果,美国能源部得以将HPC系统的成本从1995年的每TeraFlop的约1亿美元降低到如今的每TeraFlop不到5,000美元(系数为20,000美元),并且每代产品的计算能力和能效都更高。
行业研究显示,这些好处使基于OCP的基础设施的销售额在2017年超过12亿美元,其中不包括OCP董事会成员Facebook、英特尔、Rackspace、微软和高盛的支出。
OCP 与传统设计之间存在一些区别:可用宽度更大(21 英寸,“19 英寸” 环境影响评估机架为 17 英寸),因此您可以在每个机架单元中采用更多高价值的技术;复杂的导轨被简单架子所取代;由通用电源提供电源,从而大大减少了电源数量,从而消除了配电装置 (PDU) 和电源线的故障机会。
因此,与19英寸服务器相比,节点成本降低了15-20%,可靠性也有所提高。提高处理器的效率,例如 Intel Xeon 可扩展处理器 家庭,这甚至进一步扩大。
此外,OCP 服务器的服务是从前端提供的,使系统可以现场更换,从而使维护更简单、成本更低。还有数千种经过支持和测试的开放操作系统、软件堆栈、网络堆栈和其他软件可供选择,它们的成本都低于专有软件。
设计规范使您可以灵活地使用不同的硬件技术,例如 X86、ARM、存储和软件定义的任何东西 (SDx)。OCP 包括整个基础设施技术生态系统,包括数据中心、HPC 和人工智能 (AI) 组件。
结合标准化和模块化,您可以根据需要配置系统。您甚至可以在服务器中集成图形处理单元 (GPU) 加速器,为未来的异构环境铺平道路。
这也意味着您不再需要根据寿命最短的组件的生命周期更换整个系统。相反,您可以更换或升级模块化组件,并保留对整个系统的投资。因此,例如,当新的、更强大的处理器问世时,您可以将它们与旧处理器进行更换,无需购买完整的系统即可获得更高的功率。
有些人担心安全性,但是基于OCP的系统不像其他计算系统那样容易受到攻击。您的安全需求与 19 英寸的环境没有什么不同,例如对数据使用特定的加密,以及正确限制网络和对系统的访问。
您可以受益于更多的安全专家检查和改进您部署的解决方案。简而言之,选择开放技术,特别是OCP的理由有很多。下次您的组织考虑进行基础设施变更时,请花点时间看看 OCP 如何帮助您获得更高的投资回报率,甚至超越竞争对手。 详细了解基于 OCP 的技术的价值 以及Penguin Solutions将如何通过使用开放技术计算解决方案为您的组织增加价值。
在 Penguin,我们的团队设计、构建、部署和管理高性能、高可用性的 HPC 和 AI 企业解决方案,帮助客户实现突破性创新。
立即联系我们,让我们讨论您的基础设施解决方案项目需求。