AI 和 HPC 数据中心
容错解决方案
集成内存
Zefr® 内存筛选过程出货了超过四百万个内存模块,具有久经考验的长期可靠性和性能,可模拟最艰苦的现实条件。
Zefr 高可靠性存储器是一种创新解决方案,旨在满足数据密集型计算环境中对不间断运行的关键需求。这项专有技术采用独特的筛选流程,消除了90%以上的存储器可靠性故障,优化了存储器子系统以最大限度地延长正常运行时间。
通过识别和过滤掉可能影响内存可靠性的边缘组件,Zefr 内存可显著减少系统启动延迟和错误,这些延迟和错误可能导致效率低下、维护成本增加和系统良品率降低。这种先进的存储器解决方案已在现实条件下经过严格测试,以确保业界最高水平的正常运行时间和可靠性。
经过精心校准的老化过程在严格的测试和实际性能之间取得了关键的平衡。该过程基于大量的现场测试数据和建模,确保模块承受的压力达到最大阈值,同时在其使用寿命内仍能反映正常运行条件。精心确定预热时间,可以自信地识别所有潜在缺陷,从而显著减少部署问题。
通过集成 SMART Modular 的 Zefr 内存,系统设计人员和最终用户可以期待更高的计算性能和整体系统可靠性的显著提升。
Zefr 内存对于需要长时间不间断计算的应用特别有价值,例如人工智能 (AI)、机器学习 (ML)、仿真和内存数据库。它使复杂的算法和数据密集型流程能够在不中断或耗时重启的情况下运行直至完成,从而保留宝贵的资源并保持运营效率。
测试脚本和程序随机运行整个内存阵列,覆盖率超过 98%,功耗比标准内存测试程序高 35%。即使记录一次错误码校正 (ECC) 的内存模块也被取消了 Zefr 分类资格。
对实际英特尔或AMD主板的测试可确保只有在真实的真实系统中运行的双列直插式内存模块 (DIMM) 才能被选中。
高速测试可确保只有具有强大时序裕度的 DIMM 才能被选中。
由于金属迁移等各种故障机制,装有容易导致婴儿死亡的设备的 DIMM 在大约 70°C 的环境温度下接受测试时会经过筛选。在此温度下运行系统并以 100% 的内存利用率将 DRAM 外壳温度推高至 +85°C。
七到十小时的测试持续时间可确保 DIMM 能够可靠地运行更长时间的应用程序。
zDIMM 是 SMART 寄存器 DIMM,适用于已通过 Zefr 内存处理的高可靠性应用。
Zefr ZDIMM 内存专为满足数据中心、超大规模服务器、高性能计算 (HPC) 平台以及其他运行需要最大计算可用性并依赖持续系统运行正常运行时间的大型内存应用的环境的严格要求而设计。
立即联系我们,了解我们的技术专业知识和客户支持水平,这仍然是内存制造商之间的行业差异化因素。