数据中心运营
数据中心运营是 FactVerse 面向数据中心设施与设备运营的模块。它把资产身份、数据大厅上下文、BMS 点位映射、设备健康、预测性维护、告警诊断、工单派发、SLA 审阅和闭环证据组织到同一个运营工作流中。
当数据中心运营团队需要把源系统记录连接到受治理的数字孪生,审阅当前运营风险,并用可追溯证据准备维护动作时,请使用本指南。
AI 辅助分析界面请查看 数据中心运营 AI 工具。
当前服务边界
| 界面或服务 | 当前角色 |
|---|---|
| FactVerse 前端 | 提供数据中心总览、数据大厅筛选、资产列表与详情、预测队列、诊断控制台、闭环视图、运营看板、BMS 映射视图和模型运营状态。 |
| Core backend 与 DCOps 模块切片 | 提供 /api/v1/dcops 看板、KPI、资产读取、健康趋势、预测历史、诊断历史、计划建议、派工候选、闭环记录、BMS 映射、运营分析、快照导出和实时事件流。 |
| Inspector 与工单 | 提供告警、工单、反馈、附件和现场执行上下文。 |
| 预测性维护 | 当数据中心资产需要更细的维护分析时,提供设备健康和剩余寿命工作流。 |
| DFS | 在运营依赖这些数据前,准备源数据、BMS 映射、表计读数、工单记录、设备身份和受治理数据集。 |
| AI Engine 与 Advisor | 提供健康评分、剩余寿命估计、告警诊断文本,以及项目启用时的 standard 或 NVIDIA 执行元数据。 |
该模块用于运营审阅和维护工作流准备。现场团队应在执行动作前确认数据映射、工程假设和审批状态。
运营流程
当前用户工作流
| 工作流 | 用户可以审阅或执行的内容 |
|---|---|
| 总览看板 | 审阅资产数量、告警状态、工单状态、数据大厅范围、健康评分、数据已映射时的 PUE/WUE 指标,以及运营风险信号。 |
| 资产运营 | 审阅数据中心资产、设备详情、近期告警、最新诊断、未完成工单、健康趋势、预测历史和反馈状态。 |
| 健康审阅 | 计算或读取设备健康评分、风险等级、异常分数和整体健康分布。 |
| 预测队列 | 审阅 7、30、90 天风险分组、高风险设备、剩余寿命区间和维护关注对象。 |
| 诊断控制台 | 创建或读取告警诊断记录,审阅置信度、trace ID、证据来源和诊断历史。 |
| 派工与闭环 | 审阅待派工候选、批准创建工单、关联反馈,并检查诊断、动作和反馈证据是否完整。 |
| 计划 | 审阅维护计划建议、生成草稿计划、检查冲突,并处理时间窗口或资源冲突。 |
| 运营看板 | 审阅队列老化、SLA 达成率、SLA 违约列表、诊断复用、派工转化漏斗、KPI 变化、趋势和可导出的运营快照。 |
| 实时运营流 | 订阅告警、工单和风险快照更新事件。 |
| BMS 映射 | 审阅、验证并发布 BMS 数据的 source point 到 target field 映射规则。 |
| 模型运营 | 审阅当前执行模式、降级元数据,以及 standard 或 NVIDIA 执行路径的状态指标。 |
开始前准备
| 要求 | 说明 |
|---|---|
| 租户与站点上下文 | DCOps 读取接口按租户隔离。站点和数据中心筛选应与当前运营范围一致。 |
| 权限 | 主要读取界面使用 dcops.view。预测界面使用 dcops.predict.view。诊断和工单动作需要对应的诊断、工单或反馈权限。 |
| 资产身份 | 设备记录应有稳定的设备 ID、名称、类型、位置、重要性,以及数据大厅或房间归属。 |
| 源系统映射 | BMS 点位、告警、工单、表计读数和设备记录应映射到同一套资产身份。 |
| 工作负责人 | 明确谁审阅告警、接受派工候选、分派工单、处理 SLA 违约并记录反馈。 |
| 数据质量 | 解释健康或预测结果前,确认时间戳、单位、源数据新鲜度、缺失值和过期映射。 |
| 审阅记录 | 把诊断文本、trace ID、工单链接、反馈和快照导出保存在运营审阅记录中。 |
源数据准备请先查看 DFS 快速开始、连接 BMS 到设施数字孪生 和 准备预测性维护信号历史。
打开数据中心运营
| 视图 | 路由 |
|---|---|
| 总览 | /datacenterops/dashboard |
| 资产列表 | /datacenterops/assets |
| 资产详情 | /datacenterops/assets/:assetId |
| 预测队列 | /datacenterops/predictive-queue |
| 诊断控制台 | /datacenterops/diagnosis |
| 闭环视图 | /datacenterops/closed-loop |
| 运营看板 | /datacenterops/operations |
| 集成 | /datacenterops/integrations |
模块是否可用取决于租户配置。后端会在服务 /api/v1/dcops 路径前检查数据中心运营模块是否启用。
准备运营数据
| 数据领域 | 典型准备内容 |
|---|---|
| 资产层级 | 把站点、数据中心、数据大厅、房间、机柜、设备和重要性映射到稳定 ID。 |
| BMS 点位 | 将源点位名称映射到目标字段,并在发布前验证规则覆盖。 |
| 告警 | 将告警严重度、状态、标题、来源设备和时间戳映射到资产层。 |
| 工单 | 将未开始、已分派、处理中、已完成和反馈记录连接到告警和设备。 |
| 表计与能源读数 | 为运营审阅准备电力、水或其他公用工程读数、单位和时间窗口。 |
| 预测信号 | 为可维护资产准备健康快照、故障预测历史和剩余寿命输入。 |
源系统需要连接配置、源到目标映射、同步监控、数据质量审阅和受治理数据集时,请使用 DFS。
审阅看板和资产
- 选择相关站点或数据中心范围。
- 审阅资产、告警、工单、健康和风险摘要。
- 打开资产列表,并按风险或设备类型筛选。
- 打开资产详情,审阅近期告警、诊断记录、未完成工单、健康趋势、预测历史和反馈状态。
- 当审阅结果需要共享时,导出或保存运营快照。
PUE 和 WUE 指标应作为运营审阅信号。用于管理报告前,请确认表计覆盖、负载定义和计算假设。
审阅健康与预测风险
| 领域 | 检查内容 |
|---|---|
| 健康评分 | 综合评分、风险等级、异常分数、执行模式、时间戳,以及可用时的因子拆解。 |
| 健康趋势 | 所选资产和时间窗口内的健康评分历史。 |
| 预测历史 | 7、30、90 天故障概率、剩余寿命区间、模型版本和执行模式。 |
| 高风险设备 | 超过所选风险阈值和时间窗口的设备。 |
| 预测队列 | 用于近期维护计划和运营会议的风险分组。 |
健康和预测输出应作为审阅证据。维护负责人应结合巡检、工单、源信号新鲜度和现场约束再批准动作。
诊断告警并闭环
- 打开诊断控制台或告警详情。
- 审阅告警严重度、受影响设备、近期告警模式和源时间戳。
- 创建或读取诊断记录。
- 检查置信度、trace ID、证据来源和诊断历史。
- 负责人接受建议动作后创建或关联工单。
- 工单关闭时记录反馈。
- 确认闭环视图包含诊断、动作和反馈证据。
诊断可能使用 Advisor 生成文本,也可能使用规则回退。两种路径都应通过来源、置信度、trace ID 和审计记录保留在审阅证据中。
计划与派工
| 界面 | 用途 |
|---|---|
| 计划建议 | 审阅候选维护窗口、预计时长、优先级和风险评分。 |
| 计划草稿 | 为选定窗口生成草稿计划,并检查资源或时间窗口冲突。 |
| 待派工 | 审阅尚无未完成工单的开放告警。 |
| 批量批准 | 在选定告警和诊断证据完成审阅后批准派工候选。 |
| 批量操作 | 在权限允许时分配负责人、统一优先级、追加升级说明、重试诊断或协调闭环证据。 |
保持动作负责人清晰。批量操作应在班组长或运营负责人批准所选记录后用于分诊和队列管理。
BMS 映射与模型运营
- 打开 集成。
- 审阅最新发布的 BMS 映射版本和来源。
- 验证映射规则中必要的
sourcePoint与targetField覆盖。 - 源数据负责人确认后发布映射变更。
- 将审计记录保存在运营交接材料中。
模型运营会展示执行模式和状态元数据。用它确认工作流运行在 standard 路径,还是项目启用的 NVIDIA 路径,并在验收中记录回退或降级状态。
API 范围
数据中心运营 API 位于 /api/v1/dcops 下:
| 分组 | 示例 endpoint |
|---|---|
| 总览与 KPI | /, /dashboard/overview, /dashboard/overview/trends, /dashboard/kpis |
| 资产与健康 | /assets, /assets/rul-intervals, /assets/{assetId}/detail, /assets/{assetId}/health, /assets/{assetId}/health/trend, /health/summary |
| 预测 | /assets/{assetId}/predictions, /assets/{assetId}/predictions/history, /predictions/high-risk |
| 诊断 | /diagnosis/from-alert/{alertId}, /alerts/{alertId}/diagnosis, /alerts/{alertId}/closed-loop |
| 计划 | /planning/recommendations, /planning/generate, /planning/{planId}/conflicts, /planning/{planId}/resolve |
| 派工与反馈 | /dispatch/pending, /dispatch/alerts/{alertId}/approve, /dispatch/batch-approve, /recommendations/{diagnosisId}/create-work-order, /work-orders/{workOrderId}/feedback, /work-orders/{workOrderId}/closed-loop |
| 运营看板 | /dashboard/operations, /dashboard/operations/kpi-delta, /dashboard/operations/queue-aging, /dashboard/operations/predictive-queue, /dashboard/operations/trends, /dashboard/operations/sla-rates, /dashboard/operations/sla-breaches, /dashboard/operations/diagnosis-reuse, /dashboard/operations/dispatch-funnel, /dashboard/operations/snapshot, /dashboard/operations/snapshot.csv, /dashboard/operations/events |
| 集成与模型运营 | /integrations/bms/mappings, /integrations/bms/mappings/validate, /integrations/bms/mappings/publish, /model-ops/status, /model-ops/engine-mode |
验证清单
- 租户、站点和数据中心筛选与审阅范围一致。
- 资产、设备、告警、BMS 点位、表计和工单 ID 指向同一组运营对象。
- 源时间戳、单位和新鲜度适合当前决策。
- BMS 映射变更已有负责人批准和审计证据。
- 健康和预测输出已结合巡检与工单上下文审阅。
- 诊断记录包含 trace ID、证据来源、置信度和负责审阅人。
- 动作执行后记录工单反馈,让闭环视图能反映结果。
- 快照和 CSV 导出用于交接时,与范围说明和假设一起保存。