数据中心运营 AI 工具
数据中心运营通过产品 API、Advisor 辅助诊断、预测性维护交接,以及 AI Engine 健康或剩余寿命调用来支持 AI 辅助工作流。目标是帮助运营人员审阅风险、准备维护动作,并保持证据可追溯。
当实施团队需要理解 DCOps 哪些界面可由应用调用、哪些输出需要审阅,以及如何结合 DFS、Inspector 和预测性维护时,请使用本页。
工具层
| 层级 | 主要用户 | 访问边界 | 输出类型 |
|---|---|---|---|
/api/v1/dcops/* 产品 API | 数据中心运营 UI 和已批准的后端工作流 | dcops.view、dcops.predict.view、dcops.diagnosis.run、dcops.workorder.link、dcops.feedback.write | 看板、资产健康、预测、诊断、派工、BMS 映射、计划和运营快照 |
| Advisor 诊断 | 诊断工作流和审阅助手 | 产品服务认证与诊断权限 | 诊断摘要、置信度、证据来源和 trace ID |
| 预测性维护 | 可靠性和维护负责人 | pdm:read、pdm:write 及相关产品权限 | 设备健康、异常审阅、剩余寿命估计、advisory 和工单反馈 |
| AI Engine | 产品服务和受控后端任务 | 服务认证与项目配置 | 健康评分、剩余寿命估计、诊断支持和执行模式元数据 |
| DFS | 数据负责人和集成团队 | DFS 连接器、映射、数据集和质量审阅权限 | BMS、告警、表计、设备、工单和信号历史数据集 |
外部 Agent 需要 DCOps 上下文时,应使用已批准的后端工作流,并用共享 /mcp/base/ 上下文读取资产、文档、工单和证据。对外暴露工作流前,应在目标环境中进行运行时工具发现。
推荐 AI 辅助流程
数据准备
| 数据 | 价值 |
|---|---|
| 设备身份 | 将看板、BMS 点位、预测、告警、工单和反馈连接到同一运营对象。 |
| BMS 映射 | 说明哪些源点位驱动目标字段,以及映射覆盖是否可接受。 |
| 告警历史 | 为诊断提供严重度、时间、重复模式和受影响设备上下文。 |
| 工单历史 | 提供近期动作、未完成队列、SLA 状态和闭环反馈。 |
| 健康与预测快照 | 提供评分、风险等级、概率、剩余寿命区间、模型版本和执行模式。 |
| 表计与能源读数 | 在定义、单位和时间窗口经过验证后,支持 PUE/WUE 和能源审阅。 |
自动审阅前,请先使用 DFS 映射、DFS Lite 数据质量 和 准备预测性维护信号历史。
健康和预测接口
| Endpoint | 用途 | 审阅检查 |
|---|---|---|
POST /api/v1/dcops/assets/{assetId}/health | 为单个资产计算并保存健康快照。 | 确认资产身份、近期告警数量、工单上下文、源数据新鲜度和执行模式。 |
GET /api/v1/dcops/assets/{assetId}/health/trend | 读取选定时间窗口内的健康评分趋势。 | 检查时间范围、缺失历史和风险等级变化。 |
GET /api/v1/dcops/health/summary | 审阅所有设备的健康分布。 | 确认站点范围和哪些资产有当前快照。 |
POST /api/v1/dcops/assets/{assetId}/predictions | 生成故障概率和剩余寿命结果。 | 审阅模型版本、概率窗口、剩余寿命区间和源数据假设。 |
GET /api/v1/dcops/assets/{assetId}/predictions/history | 读取单个资产的预测历史。 | 将近期预测与工单和现场发现对照。 |
GET /api/v1/dcops/predictions/high-risk | 列出超过所选风险阈值的设备。 | 派工前验证阈值、时间窗口和审阅负责人。 |
当工作流需要更丰富的模型管理、异常审阅、设备模板或 advisory inbox 时,请使用预测性维护文档。
诊断与闭环接口
| Endpoint | 用途 | 审阅检查 |
|---|---|---|
POST /api/v1/dcops/diagnosis/from-alert/{alertId} | 为告警创建诊断记录。 | 确认告警已关联设备,并有源时间戳。 |
GET /api/v1/dcops/alerts/{alertId}/diagnosis | 读取告警诊断历史。 | 审阅诊断文本、置信度、trace ID、创建时间和来源。 |
GET /api/v1/dcops/alerts/{alertId}/closed-loop | 一起读取告警、诊断、工单和反馈证据。 | 完成审阅前确认诊断、动作和反馈都存在。 |
GET /api/v1/dcops/work-orders/{workOrderId}/closed-loop | 读取工单闭环证据。 | 检查诊断关联和反馈状态。 |
POST /api/v1/dcops/work-orders/{workOrderId}/feedback | 记录实际根因、执行动作、解决状态和评分。 | 将反馈绑定到负责审阅人和工单关闭过程。 |
诊断输出应作为运营审阅记录。建议动作需要负责人批准后才进入现场执行。
计划与派工接口
| Endpoint | 用途 | 审阅检查 |
|---|---|---|
GET /api/v1/dcops/planning/recommendations | 读取选定窗口内的维护候选。 | 确认风险评分、预计时长、优先级和资产范围。 |
POST /api/v1/dcops/planning/generate | 生成草稿计划。 | 分派前审阅计划项和冲突数量。 |
GET /api/v1/dcops/planning/{planId}/conflicts | 检查计划冲突。 | 与班组负责人检查资源或时间窗口冲突。 |
POST /api/v1/dcops/planning/{planId}/resolve | 处理计划冲突。 | 记录处理策略和剩余冲突。 |
GET /api/v1/dcops/dispatch/pending | 列出还没有未完成工单的开放告警。 | 确认诊断状态和动作负责人。 |
POST /api/v1/dcops/dispatch/batch-approve | 批准选定派工候选。 | 在所选告警和诊断证据完成审阅后使用。 |
运营分析
| Endpoint | 用途 |
|---|---|
/dashboard/operations | 综合运营队列和吞吐看板数据。 |
/dashboard/operations/kpi-delta | 近期 KPI 相对上一周期的变化。 |
/dashboard/operations/queue-aging | 未完成队列老化分组。 |
/dashboard/operations/predictive-queue | 7、30、90 天预测风险分组。 |
/dashboard/operations/sla-rates | 响应和完成 SLA 达成率指标。 |
/dashboard/operations/sla-breaches | 按行动优先级排序的开放 SLA 违约工单。 |
/dashboard/operations/diagnosis-reuse | 派工中的诊断复用率。 |
/dashboard/operations/dispatch-funnel | 从告警到闭环结果的转化漏斗。 |
/dashboard/operations/snapshot | 用于看板和交接的可导出运营快照。 |
/dashboard/operations/snapshot.csv | 供表格审阅的 CSV 导出。 |
/dashboard/operations/events | 告警、工单和风险快照变化的服务器发送事件流。 |
快照导出可用于运营会议、班次交接和事件复盘。请和范围、假设说明一起保存。
BMS 映射与模型运营
| Endpoint | 用途 | 审阅检查 |
|---|---|---|
GET /api/v1/dcops/integrations/bms/mappings | 读取最新发布或草稿 BMS 映射元数据。 | 检查来源、版本、状态和更新时间。 |
POST /api/v1/dcops/integrations/bms/mappings/validate | 发布前验证映射规则形状。 | 检查 source point、target field、覆盖率、错误和警告。 |
POST /api/v1/dcops/integrations/bms/mappings/publish | 发布映射版本并创建审计证据。 | 源数据负责人批准后发布。 |
GET /api/v1/dcops/model-ops/status | 读取当前执行模式和状态元数据。 | 记录执行模式、降级状态、延迟和更新时间。 |
POST /api/v1/dcops/model-ops/engine-mode | 授权后切换 standard 或 NVIDIA 模式。 | 使用项目批准的模式,审计变更,并确认回退行为。 |
模型运营状态是运营控制界面。模式变更应作为受治理配置变更处理。
建议的 Agent 回答结构
| 部分 | 内容 |
|---|---|
| 范围 | 租户、站点、数据中心、数据大厅、时间窗口和选定资产。 |
| 当前状态 | 看板 KPI、开放告警、队列老化、SLA 风险、健康分布和预测队列。 |
| 证据 | 源记录、健康快照、预测历史、诊断记录、BMS 映射版本、工单和反馈。 |
| 建议审阅 | 面向负责人的分级动作、证据链接和缺失数据说明。 |
| 交接 | 工单草稿、升级说明、计划草稿或现场核查请求。 |
验证清单
- 工作流运行在正确租户和 DCOps 模块范围内。
- 调用方拥有对应读取、诊断、工单、反馈或配置动作的
dcops.*权限。 - 资产身份、BMS 点位、告警、工单和表计读数指向同一站点上下文。
- AI 辅助输出包含来源、置信度、trace ID、可用时的模型或执行模式,以及审阅负责人。
- 工单动作绑定到已批准的派工或计划证据。
- 现场执行后记录反馈,让后续诊断和计划能够吸收结果。