最大化正常运行时间应该是每个数据中心的首要任务,无论是小型数据中心还是超大规模数据中心。为了让您的数据中心持续运行,必须制定冗余系统计划。
什么是数据中心冗余?
数据中心冗余是指一种系统设计,其中关键组件(例如 UPS 单元、冷却系统和备用发电机)被复制,这样即使某个组件发生故障,数据中心也可以继续运行。例如,冗余UPS 系统在停电时开始工作。如果由于恶劣天气、停电或组件故障而导致停机,数据中心备份组件将发挥其作用以保持整个系统的运行。
为什么数据中心冗余很重要?
企业必须增加正常运行时间并更快地从停机中恢复,无论是意外停机还是计划停机。停机会损害业务。它会对品牌形象、业务运营和客户体验产生严重而直接的影响,导致毁灭性的财务损失、错失商机和声誉受损。即使对于小型企业而言,计划外停机仍然会造成每分钟数百美元的损失。
数据中心的冗余配置有助于降低停机风险,从而减少意外影响造成的损失。从长远来看,精心规划的冗余设计意味着更短的潜在停机时间。此外,冗余组件还可以确保数据安全可靠,因为数据中心的运营始终如一,永不失败。
冗余也是衡量数据中心可靠性、性能和可用性的关键因素。Uptime Institute 提供了一个层级分类系统,根据四个不同的层级(第 1 层、第 2 层、第 3 层和第 4 层)对数据中心进行认证。每个层级对数据中心冗余级别都有严格和具体的要求。
不同级别的冗余
没有一刀切的冗余设计。从长远来看,较低级别的冗余意味着增加潜在的停机时间。虽然更多的冗余将减少停机时间,但会增加维护冗余组件的成本。但是,如果您的业务模型需要尽可能少的停机时间,那么就利润和整体净增长而言,这通常是合理的。要为您的企业选择正确的配置,重要的是要认识到不同冗余模型(包括 N、N+1、N+X、2N、2N+1 和 3N/2)的功能和风险。
N型
N 等于在全 IT 负载下为设施供电、备份或冷却所需的容量。它可以表示您要复制的单元,例如发电机、UPS 或冷却单元。例如,如果一个数据中心需要三个 UPS 单元以满负荷运行,则 N 等于三。
N 架构意味着该设施仅设计用于保持数据中心满负荷运行。简单地说,N 等同于零冗余。如果数据中心设施处于满负荷状态并且出现硬件故障、计划维护或意外中断,任务关键型应用程序将受到影响。使用 N 设计,任何中断都会使您的企业在问题解决之前无法访问您的数据。
N+1 或 N+X 模型
N+1 冗余模型通过向 N 架构添加单个组件(UPS、HVAC 系统或发电机)来支持故障并维持完整的工作负载,从而提供最低级别的弹性。当一个系统离线时,额外的组件会接管负载。回到前面的例子,如果 N 等于三个 UPS 单元,则 N+1 提供四个。同样,N+2 冗余设计提供了两个额外的组件。在我们的示例中,N+2 提供五个 UPS 单元而不是四个。所以 N+X 提供了 N+X 组件来降低在多个同时发生故障的情况下的风险。
2N模型
2N 冗余创建原始 UPS、冷却系统或发电机的镜像,以提供全面的容错能力。这意味着如果需要三个 UPS 单元来支持全部容量,则此冗余模型将包括一组额外的三个 UPS 单元,总共有六个系统。该设计还利用了两个独立的分配系统。
使用 2N 模型,数据中心运营商可以在不影响正常运营的情况下拆除整套组件进行维护。此外,如果出现计划外的多个组件故障,附加组件将接管以维持全部容量。该模型的弹性大大降低了停机风险。
2N+1模型
如果 2N 意味着完全容错,那么 2N+1 提供完全容错的 2N 模型加上额外的组件以提供额外保护。该模型不仅可以承受多个组件故障,即使在整个主系统离线的最坏情况下,它仍然可以维持 N+1 冗余。由于其高度的可靠性,这种冗余模型通常被不能容忍哪怕是轻微的服务中断的企业所使用。
3N/2型号
三对二或 3N/2 冗余模型是指一种冗余方法,其中额外容量基于系统负载。如果我们考虑 3N/2 场景,三个供电系统将为两个服务器供电,这意味着每个供电系统使用 67% 的可用容量。同样,在 4N/3 中,将有四个供电系统为三个工作负载(三台服务器)供电。3N/2 可以升级到 4N/3,但仅限于理论上。这是因为这样一个精心设计的模型有太多的组件,很难管理和平衡负载以保持冗余。
什么是适合你的?
选择满足您业务需求的冗余模型可能具有挑战性。在可靠性和成本之间找到适当的平衡点是关键。对于需要尽可能少的停机时间的企业,就利润和整体净增长而言,更高水平的冗余是合理的。对于那些不这样做的人,较低级别的冗余是可以接受的。它们比其他更复杂的冗余设计更便宜、更节能。
总之,没有正确或错误的冗余模型,因为它取决于一系列因素,例如您的业务目标、预算和 IT 环境。请咨询您的数据中心提供商或与您的 IT 团队讨论以确定最适合您的选择。