2023年改善数据中心的管理规划

在我们进入新的一年之际,正是反思2022年数据中心管理趋势和挑战并计划 2023年需要做些什么以提高正常运行时间、提高效率和生产力的最佳时机。通过创建您可以在 2023 年完成的事情列表来开始新的一年,以优化您的数据中心站点。然后,随着您改进数据中心管理的各个方面(从电源监控到容量规划再到资产管理),随着时间的推移查看结果。

2023年改善数据中心的管理规划-南华中天

以下是您应该列在清单上的 10 大新年决心:

一、查找所有机架的搁浅电源

数据中心经理经常为准确规划和管理电源容量的复杂性而苦恼。传统的功率预算方法——将铭牌值降低到 60% 或 70% 左右——是手动的、估计的,在很大程度上是不准确的,并且浪费金钱。幸运的是,有一条新的前进道路。您现在可以通过利用计算功率预算配置文件的机器学习算法,实现功率容量规划自动化并将机架功率利用率提高多达 40%根据它们在您的环境中的使用方式为您的每个设备实例。寻找免费电源并自信地将其部署到您现有的机柜中,以推迟构建不需要的容量,每个机柜的成本在 15,000 到 20,000 美元之间。

二、查找并关闭您的幽灵服务器

您是否知道不符合能源之星标准的旧服务器在闲置时会消耗 175 瓦,浪费空间和金钱?需要识别和整合这些幽灵服务器,以充分利用您当前的电力、空间和冷却能力。如果您没有合适的工具,这可能需要一个繁琐的手动过程来查找存储资产信息的 Excel 文件、前往数据中心审核和验证信息、部署验证利用率的工作负载工具、寻找设备所有者等。相反,利用数据中心管理软件轻松运行幽灵服务器报告. 然后,使用相同的软件通过了解哪些资产和连接将受到影响、哪些额外容量将被释放以及自动化工作流程来管理退役过程。

三、清理布线鼠窝

数据中心电缆管理通常被认为是网络工程师的一项工作,但整个企业可能会受到不良布线实践的影响,这些做法会导致不必要的设备安装困难、气流受阻导致设备过热和损坏,以及故障排除和维护时间延长。遵循电缆管理最佳实践,例如直观记录您的连接、在安装前精确测量电缆长度、自动验证连接以及使用报告和仪表板跟踪连接容量。

2023年改善数据中心的管理规划-南华中天

四、获取所有库存的清晰文档

现代数据中心环境极其复杂,需要监控大量 IT 资产,而 Excel 和 Visio 等传统管理工具已无法完成工作。通过利用数据中心 CMDB准确跟踪所有 IT 设备(服务器、网络、存储设备)和支持基础设施资产(机架、机架 PDU、配线架、结构化布线、跳线、UPS、母线、分支电路)。用于完整的资产管理, 请务必跟踪资产的详细物理位置(例如,站点位置、机柜位置和确切的U 位置)、尺寸、重量和物理数据/电源端口信息、物理关系和连接性、基础设施资源的利用率和容量(例如,电源、空间和冷却),并能够在机架立面视图中远程可视化您的资产,并叠加实时电源和温度传感器读数。通过跟踪和监控备件(例如硬盘驱动器、卡、内存模块、电源、跳线和任何其他组件,甚至是螺丝盒),尽可能详细地了解您的库存文档。

五、获取所有电源和/或网络连接的清晰文档

跟踪您的连接和端口容量已成为成功管理数据中心的关键。当您考虑到一个拥有 100 个机架的数据中心涉及一个包含70,000 多个端口和布线组件的复杂系统时,很明显您无法承受糟糕的文档。遵循最佳实践并获得清晰的连接文档,以便轻松进行影响分析,找到部署新设备的理想位置,了解实时可用端口和空间容量,记录布线安装,并了解您的连接是否兼容。

六、实施用于旁路气流的索环

使用高架地板索环消除旁路气流可提高冷却能力并提高能效。如果您还没有这样做,请考虑在高架地板上安装索环。标准索环是一个矩形切口,距离边缘 4 英寸,位于面板中央。将索环放置在机架下方的正确位置,可以轻松部署和升级设备,而无需更换面板。

七、实施冷通道或热通道遏制

数据中心遏制战略提供了许多好处,包括降低能耗、增加冷却能力、为 IT 设备提供稳定的供应温度、为 IT 设备提供更多的电力容量、增加正常运行时间以及延长 IT 资产的生命周期。您可以实施热通道封闭,封闭 IT 设备排出的热废气并将其返回冷却设备,或实施冷通道封闭,封闭输送冷送风的通道,让数据中心的其余部分成为热空气返回全会。这两种遏制方法都具有独特的优势,您可以从中受益。

2023年改善数据中心的管理规划-南华中天

八、部署环境传感器

环境监测对于确保数据中心站点的整体健康状况、减轻停机威胁和提高效率是必不可少的。在您的数据中心部署的最关键的传感器是:

  1. 温度。监控温度可帮助您识别可能损坏设备并导致停机的热点,或者了解您是否过冷和能源成本超支。遵循ASHRAE 指南以确保正确放置传感器并确保您的设备处于推荐的温度范围内。
  2. 湿度。如果您的环境太干燥,静电就会积聚。太潮湿,设备会腐蚀。在任一方向,极端湿度水平都会损坏设备,因此您应该根据 ASHRAE 指南监测湿度。
  3. 空气流动。监控气流以帮助避免热点并保持稳定的环境温度。
  4. 压力。监测气压差异,以帮助识别可能导致冷却效率低下和热点的空气泄漏。
  5. 振动。随着时间的推移,数据中心的振动可能会损坏磁盘驱动器并导致停机。因此,他们应该受到监控。
  6. 水。及早检测数据中心的水可以让您有足够的时间来防止因空调泄漏、冷凝、管道爆裂或局部管道故障而导致的潜在灾难和停机。

九、实行电能计量

功率计提供关键数据和对配电基础设施利用率的洞察力,以帮助确保安全、高效和可靠的运行。来自电表的数据可以帮助您增加正常运行时间、改进容量规划、管理现有容量、报告电源使用效率 (PUE)、降低能源消耗和成本,并根据消耗量对内部或外部客户进行计费。计量电源基础设施可以包括:

1.智能机架 PDU。智能 PDU有多种类型的计量选项,可将机柜内的电力分配给 IT 设备。

  • 入口计量。PDU 入口处的计量有助于确定机架的电源使用情况和可用容量。
  • 出口计量。PDU 出口处的计量提供与入口计量 PDU 相同的优势,而且您可以深入了解设备级别的功耗。
  • 断路器计量。知道断路器何时跳闸,以便您可以快速重置它。
  • 出口控制。从任何位置远程打开、关闭和重新启动各个插座。

2.母线下车和母线末端馈电。架空配电系统可以提供灵活性和易用性。根据您的母线槽系统的型号,功率计可能位于机架上方的母线分支处或一排的末端馈线处。出料箱流量计测量出口处的负载,末端进料流量计测量末端进料入口处的负载。

3.远程电源面板 (RPP)。RPP 将来自地板 PDU 或其他电源的安全可靠的电力直接分配到服务器机柜。

4.楼层 PDU。落地式 PDU 是大型落地式装置,可将原始电源转换和分配为较低容量的电源。

5.不间断电源 (UPS)。UPS是一种备用电池,可确保在公用电源出现故障时不会发生电源中断。

6.建筑米。公用事业仪表提供设施总用电量的测量值。

2023年改善数据中心的管理规划-南华中天

十、部署现代 DCIM 工具

由于在家工作的员工和与隔离相关的数据中心访问限制,远程数据中心管理工具不再是可选的。数据中心基础设施管理 (DCIM) 软件在任何数据中心管理工具包中都是必不可少的,它可以跨组织孤岛连接信息,并允许您在单一管理平台中集中管理所有资源和容量,以保持正常运行时间、提高容量利用效率,以及提高人们的生产力。请务必选择现代的第二代 DCIM工具,该工具提供:

  1. 零配置分析。开箱即用的预构建仪表板、报告和交互式可视化分析,无需任何繁琐的配置工作。
  2. 数据共享和协作。鼓励信息共享和协作以打破组织孤岛的共享仪表板和团队视图。
  3. 通过集成实现自动化。开箱即用的 ITSM 连接器在不同的数据库之间共享数据,以节省时间并消除多次手动数据输入。
  4. 多供应商兼容性。基于标准的插件允许您管理所有第三方设备,而不必局限于特定供应商。
  5. 超快速部署。只需很少的资源和精力即可轻松部署,可提供即时的投资回报。
  6. 可扩展性。您的解决方案应提供企业级的可扩展性,无需额外的软件许可和服务器实例即可扩展以处理数百万资产和每天轮询数十亿个数据点的传感器。
  7. 能力的完整性。全方位功能,包括资产、容量、变化、能源、电力、环境、安全、连接、可视化以及商业智能和分析。

从这些改善数据中心站点管理的解决方案入手,到明年,您将拥有更高效的容量利用率、更健康的环境和设备以及更高的人员生产力。