Dell OpenManage 帮助

事件类型定义和组件运行状况

Server Administrator 使用事件类型来划分系统中影响特定重要组件的事件。组件状态三种最常见的事件类型为:正常、警告和严重。

此帮助模块定义了事件类型、状态和严重性的术语。如果您需要了解有关 Server Administrator 用于对事件进行分类和标识组件运行状况的其他术语的更多详情,请阅读此帮助部分。

事件类型和相应的严重性

无论 Server Administrator 是在报告组件的运行状况,还是在对事件进行分类,以下均是可以用来进行区分的事件属性:正被监测的组件或冗余,以及该组件正在经历的事件的类型、状态和严重性。

组件或冗余

Server Administrator 根据类型、严重性和状态对组件和某些组件的冗余进行分类。

组件

系统中的所有组件在某种意义上都很重要。但是,系统管理应用程序(例如 Server Administrator)选出了一些需要特别注意的组件。运行良好的系统特别依赖于电压适宜的稳定电源以正常运行系统组件。电力经过系统的交流电源 (AC) 转换器传送至系统的电源设备。系统组件还要求机箱内部的温度处于可工作的范围。运行程序和对数据进行计算都需要随机存取存储器工作状态良好。由于这些要求,电源转换器、电源设备、风扇和系统内存成为 Server Administrator 监测的最重要的组件。

冗余

Server administrator 还监测冗余组件的运行状况并报告系统的冗余状况。

根据系统对企业实体或组织的任务的重要程度,系统中安装的某些系统组件具有已设计好的冗余。如果系统对于组织的任务至关重要,则该系统最可能具有冗余组件。冗余组件用于替代其出现故障的同类组件。冗余有助于避免系统因关机或组件损坏而停机。

完全冗余 整个系统完全冗余表示所有设备均在正常限定范围内工作。如果系统需要四个风扇实现完全冗余,且四个风扇全部都在工作,则系统具有风扇组件的完全冗余。如果两个主风扇中的一个出现故障,则每个风扇均有一个备用风扇。除了一般的预防性维护,完全冗余无需采取其他任何措施。
降级冗余 降级冗余表示完全冗余所需的某些组件未在运行。这时系统可以运行,但在组件出现故障的情况下,没有足够的组件使可运行组件替代故障组件。例如,如果完全冗余需要四个风扇,则三个可运行风扇表示降级冗余。在出现故障时,两个主风扇中只有一个有备用风扇。
无冗余 无冗余表示系统只有避免系统出现故障的最少数量的工作组件。没有可工作的冗余组件。如果需要四个风扇用于完全冗余,但只有两个风扇正在运行,则出现故障时,两个主风扇都没有备用风扇。

类型

事件按类型分类。事件类型包括正常、警告和严重。

正常 正常事件表示组件在允许的值范围内运行,在该范围内组件可在系统中很好地执行其功能。常用于说明状况正常的组件的另一个术语是“良好”。如果组件良好,或事件为正常,则系统操作员不必采取纠正措施。
警告 如果受管理的组件未处于最佳运行状态,但仍可以运行,则将出现警告事件。警告事件为系统操作员提供了一些准备时间。对警告事件采取的适当措施通常是进行进一步调查并计划对组件进行维护。警告同时也提醒系统操作员在组件恢复正常前要对组件多加注意。高级用户和管理员可以为警告事件定义最小值和最大值。定义警告范围的权限使高级用户和管理员可以设定需要的反应时间,以处理开始出现性能降低迹象的工作组件。
严重 严重事件表示组件在正常工作范围之外运行,或者根本无法运行。根本无法运行的组件通常称为不可恢复组件。系统制造商定义了组件的严重范围,因为制造商最清楚组件内部的工程原理及其正常功能。相对于警告,严重表明情况更加紧急,系统操作员应更加重视这类组件性能下降的情况。对严重或故障组件采取的适当措施包括立即将系统关机或尽快安排更换组件。

状态

组件或系统属性的状态包括可运行、降级或无法运行。

可运行 可运行温度表示机箱内的温度探测器读取的温度在正常的运行范围内。
降级 降级温度表示机箱内的温度探测器读取的温度在警告范围(由触发警告所需的最高和最低运行温度定义)内。机箱内的温度要么低于正常的最低温度,要么高于正常的最高温度。
无法运行 无法运行的组件或组件属性表示组件在故障状态下或无法恢复的范围内运行。以温度为例,如果系统仍然在运行,而温度远远高于或低于正常温度范围,则可能会触发系统热关机,或者可能会损害或破坏系统组件。

严重性

组件的每个事件类型和状态都根据其严重性进行评估。事件的严重性包括通知、轻微、重大和严重。

通知 正常事件或组件的状况为可运行状态,与正常事件相关的严重性为通知。Server Administrator 对正常事件采取的唯一措施是通知。Server Administrator 通知系统操作员组件正常。
轻微 根据组件的状态,警告事件可能为轻微或严重。例如,卸下风扇冗余系统中的某个风扇,该事件的严重性为轻微。
重大 某些警告事件可以指出系统面临重大风险。如果某个风扇长时间没有装入系统,事件可能会成为重大事件,因为可能会影响冗余功能。如果组织的任务要求冗余,而系统中的该组件长期缺失,则可能会导致组件出现故障时没有可用的备用组件,从而最终导致系统出现故障。
严重 检测到组件处于故障范围内的事件是严重事件。风扇、交流电源线或内存模块等组件的故障会危及系统的运行和数据保存。

事件类型、严重性和状态之间的关系

下表列出了重要组件的示例事件,并说明了事件类型、严重性和状态之间的关系。

注: 由于 VMware ESXi 操作系统的限制,此版本的 Server Administrator 不提供“设置警报措施”功能。
组件 事件或警报类型 严重性 状态
交流电源线 正常通知 可运行
交流电源线 故障 严重 降级
电源设备 故障 严重 降级
冗余(针对电源系统) 正常 通知 可运行
冗余(针对电源系统) 降级 轻微 降级
冗余(针对电源系统) 丢失 重大 降级
温度 正常 通知 可运行
温度 警告 轻微 降级
温度 故障 严重 降级
关机 严重 无法运行