本指南用于数据中心运营范围的每日或班次级审阅。目标是形成短而可追溯的交接记录,说明当前风险、负责人和下一步动作。
前提条件
| 要求 | 作用 |
|---|
| 活动运营边界 | 审阅应限定在相关站点、机房或设备组。 |
| 当前来源状态 | 团队需要知道 BMS、告警、工单和表计是否足够新。 |
| 负责人清单 | 风险需要明确的运营或维护负责人。 |
| 交接模板 | 简短模板让审阅可重复。 |
| 输入 | 确认内容 |
|---|
| 看板摘要 | 资产数量、告警状态、工单状态、风险指标和当前范围。 |
| 预测队列 | 7、30、90 天风险桶和高风险设备。 |
| 打开工单 | 新建、已分配、进行中、阻塞、退回、完成和待审阅。 |
| SLA 暴露 | 违约清单、队列老化、负责人、优先级和升级状态。 |
| 能耗读数 | 表计覆盖、需量变化、已映射的 PUE 或 WUE 指标和假设。 |
操作步骤
- 在解释看板值前确认来源新鲜度。
- 审阅高严重度告警和当前风险资产。
- 检查预测队列变化,并与工单历史比较。
- 审阅打开工单、阻塞工单和 SLA 暴露。
- 将能耗和表计信号作为运营指标审阅,并保留假设。
- 指派负责人、下一步检查项和截止时间。
预期输出
每日审阅应输出一份简洁交接,包含当前风险、负责人、证据链接、阻塞事项、SLA 暴露和下一班次需要检查的记录。
验证清单
- 结论前已检查来源新鲜度。
- 高影响事项有资产、位置、负责人和证据链接。
- SLA 风险与实际工单状态对应。
- 能耗信号包含表计范围和假设。
- 下一步检查项有明确负责人。
故障处理
| 现象 | 处理 |
|---|
| 看板和工单状态不一致 | 比较来源时间戳和工单同步历史。 |
| SLA 违约没有负责人 | 在交接关闭前升级给运营负责人。 |
| 能耗信号范围不清 | 记录表计范围,避免作为绩效结论。 |
| 预测队列突然变化 | 检查来源信号新鲜度和近期维护事件。 |
相关文档