因此,在Stratus,几十年来,我们一直是可靠计算基础设施领域的领导者。但是,与技术中的许多术语一样,高可用性 (HA) 的定义非常宽泛。去年,我们看到了一家备受尊敬的分析公司进行的一项调查,该调查显示,大多数受访者认为高可用性意味着制定灾难恢复计划。我们发现,当你与有不同计算平台历史的人交谈时,定义也会随之变化(即大型机与开发人员/运营人员的看法截然不同)。IDC 有一套多年来一直使用的可用性级别,但它们似乎有点宽泛,因为目前的大多数技术都属于超广泛的 AL3 类别。

那么,什么是高可用性呢?以下是我们按最终用户影响分组的定义。

显著的最终用户影响(通常以停机时间来衡量,IDC 称之为 AL1 和 AL2)

未受保护—这可能很容易理解。这种工作负载在应用程序、虚拟机管理程序或基础架构层均未实现任何特殊的可靠性功能。如果下跌,那就下跌了。

备份-这是定期复制(或快照)到其他节点或数据中心的工作负载。这是一项不错的合规措施,可以帮助恢复(如果你有几个小时或更长时间)

灾难恢复 — 这是一种更强大的备份形式,可以在发生重大故障事件(可能是人为错误或天气导致的重大数据中心故障)时自动进行更快的恢复

对最终用户的影响最小(通常以几秒到几分钟的停机时间来衡量——IDC 称之为 AL3)

自动高可用性 — 这在虚拟化世界中非常常见。出现故障时,新的工作负载实例将被重新部署到新的节点或数据中心。VMware 的 HA 功能是常见的实现方式。此功能对基础架构的影响微乎其微,但用户中断率相当高,并且所有传输中的数据都会丢失。对于负载均衡、横向扩展的应用程序(如 Web 服务器)来说,这是一个很好的解决方案。

即时高可用性 — 这是裸机世界中的集群世界或虚拟化世界中的冗余实例和复制存储的世界。服务中断微乎其微(在某些情况下甚至是不到一秒钟)。但是,任何机上数据和/或交易都会丢失。如果你的应用程序是无状态的,但不是负载平衡的,这是一个很好的解决方案。

终端用户零影响(无停机时间 — IDC 称之为 AL4)

容错能力 — 这种能力曾经只在大型机和微型计算机世界中为人所知。但是,Stratus 生产的硬件、软件和云解决方案可为现成操作系统和虚拟机管理程序提供这种级别的保护,其价格与较低的保护级别相当。容错是工作负载的完全冗余,它还共享机上数据和应用程序状态。这意味着即使出现故障,也能持续不间断地运行。

多站点容错 — 这是工作负载可以获得的最高保护级别。它提供容错功能,因此不会丢失状态或数据,但冗余工作负载托管在不同的站点中。当然,这种解决方案的网络成本更高,但是当只有最高级别才能起作用时,这是最好的。

希望这有助于消除您可以获得的所有类型的保护的神秘面纱。在评估需求时,不仅要考虑具体保护的内容,还要考虑恢复时间和基础架构成本,主要是处理和联网成本。

想进一步了解 Stratus 的空房情况吗?点击下面的链接!

作者图片

相关文章

Server aisle

与专家交谈
Penguin Solutions

在 Penguin,我们的团队设计、构建、部署和管理高性能、高可用性的 HPC 和 AI 企业解决方案,帮助客户实现突破性创新。

立即联系我们,让我们讨论您的基础设施解决方案项目需求。

我们来聊聊吧