计算机机房硬件设备管理与维护探究

  • 来源:消费电子
  • 关键字:计算机硬件,故障分析,维护要求
  • 发布时间:2022-01-08 19:58

  【摘 要】计算机机房硬件设备的数量和种类较多,并且此类设备的运行效能要求较高,需要确保运行稳定性,同时,更 需要具备较强的运行持续性。在现代化的计算机机房架构中,一些较为先进的网络通讯协议以及得到较为广泛的应用。虽然此 类协议支持的硬件运行范围得到了明显的扩展,但是在实际的硬件设备管理过程中,计算机机房依旧会出现一些问题,此类问 题可能不会与外部的干扰相关,而是硬件系统结构自身的运行问题,这就对工作人员维护管理硬件设备的能力提出了更高的要 求。本文在分析计算机机房硬件设备管理与维护内容的基础上,探究与此类设备相关的常见故障类型,进而提出相应的硬件设 备维护与管理办法。

  引言

  在针对计算机机房中的硬件设备开展维护与管理工 作时,工作人员需要明确计算机机房的一般结构形式,并 依据此结构形式,选择具体的问题排查办法。一般情况 下,计算机机房的整体结构形式并不会十分复杂,这与计 算机机房自身的散热需求相关。其中,机柜的布置应整齐 有序,与机柜相连接的各类辅助设备应运转正常,且运行 稳定,需要满足不同区域的计算机硬件设备控制需求。从 硬件设备组成内容的角度分析,其中,与网络通信相关的 设备数量往往较多,包括路由器设备以及数据交换机设备 等,此类设备对计算机服务器设备的运行效率有关键影 响。除此之外,在开展此类计算机硬件管理与维护工作之 前,工作人员应明确此类硬件设备常见的问题,并将此类 问题固定到单一类比的硬件设备上,这不仅有利于定位问 题的源头,更有利于提升计算机硬件问题的处理效率。

  一、计算机机房硬件设备常见故障分析

  (一)电源系统硬件故障分析

  电源系统硬件故障问题是常见的硬件设备问题,此 类问题的主要原因与电源本身的供电稳定性和供电能力相 关[1]。但是,在出现了电源系统硬件故障问题时,此类问 题的表现形式往往较为复杂。计算机机房中的电源种类众 多,体积相对较大的电源控制硬件单元一般会与机柜或者 空调系统相连,并且此类硬件单元的整体结构形式往往较 为复杂。在出现问题时,这种电源作用效果会出现在下游 设备中,进而对计算机硬件设备的运行效能产生影响。例 如,在总线输入电源出现问题时,下游的计算机散热机组 以及网络交互机组可能会出现运行稳定性问题或者直接停 止运行。此时,工作人员需要从计算机散热机组以及网络 交互机组端开始排查,并且往往不能马上断定是否为电源 的问题。另外,硬件设备自身的电路电压也会影响硬件设 备的运行稳定性,而这种电路层面的问题极其麻烦,会对 工作人员排查硬件问题产生干扰。

  (二)空调系统硬件故障分析

  如果计算机机房的环境温度超出了35℃,则此时的环境温度已经不适合机房中硬件设备的运行要求了,需要 马上进行降温处理,否则会诱发计算机设备运行安全的问 题,导致实际的运行效能下降[2]。在较高的温度状态下, 计算机硬件设备的运转滞后性将会更加明显,一些与网络 数据交换、数据存储相关的硬件设备甚至会直接报错。空 调系统故障时,工作人员需要对空调系统的自适应调节控 制单元进行检修,明确此类空调系统存在的控制问题。现 阶段,计算机机房的空调系统具备了智能化调节的属性, 可以根据环境温度自行进行空气温度调节,从而促使计算 机机房的温度可以维持在固定的温度区间。但是,智能化 控制系统如果出现了问题,其发送的空气调节指令就会出 错。此时,如果温度传感器检测到的温度与实际的指令控 制温度之间存在冲突,则相应的温度调节行为就会出现冲 突,从而无法表现正确的温度调节行为,最为常见的温度 调节行为即为温度失衡调节行为,其会直接影响机房的控 制温度,进而影响计算机机房中各类硬件的运行效能。

  二、计算机机房硬件设备管理与维护要求分析

  (一)应具备错时维护特点,不能与固定需求之间出 现维护冲突

  错时维护要求是计算机机房硬件设备管理及维护的 基本要求,维护工作与故障处理工作可以同时进行,但是 维护工作需要为故障处理工作提供处理参考数据,此类数 据也是计算机硬件设备的维护经验数据。一般情况下,计 算机机房中的机柜数量较多,不同机柜复杂的运行功能不 同,对应的硬件设备运行需求也存在差异[3]。在出现硬件 设备问题时,会体现在具体的软件运行层面,尤其是网络 信息交互层面。此时,工作人员需要及时定位此类问题硬 件所在的机柜,之后需要根据硬件的运行要求,启动备用 硬件设备。但是这个过程的持续时间可能会比较长。为 此,工作人员应选择错时维护的办法,在机柜运行需求不 高时,依次维护运行设备,检修设备的实际运行状态,这 样,既可以避免对已经参与运行的硬件设备产生影响,也 可以避免与固定需求之间出现维护冲突,实际的硬件维护 管理工作质量也会更好。

  (二)应具备良好的维护成本管控效能,降低硬件资 源浪费

  维护成本管理是计算机机房硬件设备管理与维护中 的关键内容,现阶段,智能化的计算机硬件维护管理方式 比较常见,但是其内部运行的各类指令依旧需要工作人员 进行控制,并且需要根据机房的实际运行状态进行变化和 调整。在这个过程中,设备的维护和检修工作往往相对复 杂,与电力系统维护、空调系统维护、网络组件维护以及 线路管网维护相关的工作内容较多,需要工作人员按照标 准化的检修流程进行作业。如果计算机机房出现了明显的 硬件设备问题,此时,与此硬件设备相关的维护与检修工 作则需要多名检修人员相互配合完成,这样才能获得较好 的硬件设备维护效果。但是,这种时间成本会直接转化为 经济成本,而且往往消耗的维护资金比较多。这就要求工 作人员在参与此类硬件设备维护与管理工作时,需要注意 成本的管理和控制。同时,更需要注重减少硬件资源的浪 费,这样才能有效控制计算机机房硬件设备管理与维护成本。

  三、计算机机房硬件设备管理与维护方法分析

  (一)重视指示灯、仪器仪表维护检修数据,强化数 字化维修基础

  指示灯以及指示等相关的仪器仪表数据是计算机机房 硬件维护的数据基础,此类数据会直接显示在相应的故障 报错组件中,工作人员根据相应的指示灯形态即可确定具 体的硬件故障和问题。在这个过程中,工作人员需要明确 不同指示灯的具体指代情况。例如,在硬件网关的运行过 程中,其运行状态往往包含三种颜色的指示灯,即黄色、 绿色和红色。其中,黄色和绿色代表硬件网关运行正常, 但是如果黄色等闪烁,则说明可能存在网关延迟性问题, 此时,工作人员需要对具体的延时进行测试。如果滞后的 时长并未超出硬件网关的相应时效,则不需要进行维修, 在后续的运行过程中此类设备可能会自动调节指令的引导 下恢复正常[4]。但是,如果硬件网关的红灯亮起,则说明网 关并未通过,实际的数据吞吐量已经降到了最低,无法满 足计算机硬件系统的运行要求。则此时,工作人员应对相 应的硬件设备进行针对性地维修和处理。需要注意的是, 现阶段,数字化维修的故障显示效果并不十分完善,与此 相关的数据可能显示不正常,但是实际的硬件运行过程却 没有显性问题。这一方面与数字化控制系统的运行敏感度 相关,另一方面也与硬件设备自身的质量相关。

  (二)细化硬件设备维护调试流程,归纳总结常见硬 件问题

  硬件设备的维护调试流程具有规范化的特点,并且其细节性突出,需要工作人员在明确具体的排查流程基础 上,强化设备维护与调试工作的规范性,同时,应在实 践工作中积累技术应用经验,变化故障排查办法,从而提 升故障设备管理与维护的有效性。首先,在对计算机机房 硬件设备的组建形式有了充分的了解之后,工作人员需要 明确此类设备的运行过程中可能会出现的问题。例如,对 于空调设备,其常见的问题即为温度感应器的自动控制问 题。针对此种问题,工作人员需要明确引发此类问题的常 见因素,这样,在出现类似问题时,即可以直接进行问题 的排查和故障的检修;其次,工作人员需要明确计算机硬 件设备故障排查的系统性特点,这种系统性特点与硬件设 备自身的运行需求相关,但更多的在于硬件设备本身运行 的功能性。换言之,硬件设备的功能实现形式并非单一设 备功能实现形式,而是需要多种设备相互配合。如果出现 了设备运行问题,工作人员也需要从结构整体的角度排查 此类问题,这样才能提升设备维护及管理调试工作质量。

  (三)准备硬件故障响应预案,合理安排设备管理与 维护周期

  针对易损设备组件制定故障相应预案尤为关键。现 阶段,这种故障相应预案会在实际的设备运行过程中表现 出不同的设备应用形式,但基本上均为增加备用设备的 数量。在电力系统出现问题时,为了确保电能供应的稳定 性,工作人员可为关键机柜设备的总线开关提供应应急相 应备用方案。在出现了类似问题时,系统会直接启用备用 电力装置,停止故障装置的运行。这样不仅可以提升电力 系统运行安全性,也可降低故障设备对计算机机房硬件设 备运行成本的影响。需要注意的是,并非所有的硬件设备 均需要配置应急预案,此类设备为维护周期比较长,一般 情况下,并不会出现明显的故障问题。例如,与线路运行 相关的网线设备或者交换设备等,此类设备的运行稳定性 较好,并不会在运行过程中出现明显的故障问题。

  四、结束语

  总之,计算机机房硬件设备管理与维护的具体形式和 办法需要符合机房自身的运行管理需求,其中,电力系统 与空调系统为设备维护与管理中的关键系统,也是影响硬 件设备维护效能的关键内容。此间,工作人员需要合理选 择备用系统资源,积极调整设备管理与维护周期,从而降 低设备维护与管理成本,提高设备管理与维护工作的整体 质量。

  参考文献:

  [1] 刘举. 计算机机房硬件设备管理与维护探究[J]. 电脑知识与技术,2021,17(14):195-196.

  [2] 石伟, 袁顺刚, 卢高庆. 基于自动化交互行为的电力机房巡检机器人系统设计[J]. 制造业自动化,2021,43(02):152- 156.

  [3] 张国俊. 计算机与电子类设备机房的管理与维护探讨[J]. 信息记录材料,2021,22(01):33-34.

  [4] 王光烨. 高校计算机实验室机房的硬件设备维护[J]. 电子技术与软件工程,2020(19):130-131.

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: