跳到主要内容

数据中心运营 AI 工具

数据中心运营通过产品 API、Advisor 辅助诊断、预测性维护交接,以及 AI Engine 健康或剩余寿命调用来支持 AI 辅助工作流。目标是帮助运营人员审阅风险、准备维护动作,并保持证据可追溯。

当实施团队需要理解 DCOps 哪些界面可由应用调用、哪些输出需要审阅,以及如何结合 DFS、Inspector 和预测性维护时,请使用本页。

工具层

层级主要用户访问边界输出类型
/api/v1/dcops/* 产品 API数据中心运营 UI 和已批准的后端工作流dcops.viewdcops.predict.viewdcops.diagnosis.rundcops.workorder.linkdcops.feedback.write看板、资产健康、预测、诊断、派工、BMS 映射、计划和运营快照
Advisor 诊断诊断工作流和审阅助手产品服务认证与诊断权限诊断摘要、置信度、证据来源和 trace ID
预测性维护可靠性和维护负责人pdm:readpdm:write 及相关产品权限设备健康、异常审阅、剩余寿命估计、advisory 和工单反馈
AI Engine产品服务和受控后端任务服务认证与项目配置健康评分、剩余寿命估计、诊断支持和执行模式元数据
DFS数据负责人和集成团队DFS 连接器、映射、数据集和质量审阅权限BMS、告警、表计、设备、工单和信号历史数据集

外部 Agent 需要 DCOps 上下文时,应使用已批准的后端工作流,并用共享 /mcp/base/ 上下文读取资产、文档、工单和证据。对外暴露工作流前,应在目标环境中进行运行时工具发现。

推荐 AI 辅助流程

数据准备

数据价值
设备身份将看板、BMS 点位、预测、告警、工单和反馈连接到同一运营对象。
BMS 映射说明哪些源点位驱动目标字段,以及映射覆盖是否可接受。
告警历史为诊断提供严重度、时间、重复模式和受影响设备上下文。
工单历史提供近期动作、未完成队列、SLA 状态和闭环反馈。
健康与预测快照提供评分、风险等级、概率、剩余寿命区间、模型版本和执行模式。
表计与能源读数在定义、单位和时间窗口经过验证后,支持 PUE/WUE 和能源审阅。

自动审阅前,请先使用 DFS 映射DFS Lite 数据质量准备预测性维护信号历史

健康和预测接口

Endpoint用途审阅检查
POST /api/v1/dcops/assets/{assetId}/health为单个资产计算并保存健康快照。确认资产身份、近期告警数量、工单上下文、源数据新鲜度和执行模式。
GET /api/v1/dcops/assets/{assetId}/health/trend读取选定时间窗口内的健康评分趋势。检查时间范围、缺失历史和风险等级变化。
GET /api/v1/dcops/health/summary审阅所有设备的健康分布。确认站点范围和哪些资产有当前快照。
POST /api/v1/dcops/assets/{assetId}/predictions生成故障概率和剩余寿命结果。审阅模型版本、概率窗口、剩余寿命区间和源数据假设。
GET /api/v1/dcops/assets/{assetId}/predictions/history读取单个资产的预测历史。将近期预测与工单和现场发现对照。
GET /api/v1/dcops/predictions/high-risk列出超过所选风险阈值的设备。派工前验证阈值、时间窗口和审阅负责人。

当工作流需要更丰富的模型管理、异常审阅、设备模板或 advisory inbox 时,请使用预测性维护文档。

诊断与闭环接口

Endpoint用途审阅检查
POST /api/v1/dcops/diagnosis/from-alert/{alertId}为告警创建诊断记录。确认告警已关联设备,并有源时间戳。
GET /api/v1/dcops/alerts/{alertId}/diagnosis读取告警诊断历史。审阅诊断文本、置信度、trace ID、创建时间和来源。
GET /api/v1/dcops/alerts/{alertId}/closed-loop一起读取告警、诊断、工单和反馈证据。完成审阅前确认诊断、动作和反馈都存在。
GET /api/v1/dcops/work-orders/{workOrderId}/closed-loop读取工单闭环证据。检查诊断关联和反馈状态。
POST /api/v1/dcops/work-orders/{workOrderId}/feedback记录实际根因、执行动作、解决状态和评分。将反馈绑定到负责审阅人和工单关闭过程。

诊断输出应作为运营审阅记录。建议动作需要负责人批准后才进入现场执行。

计划与派工接口

Endpoint用途审阅检查
GET /api/v1/dcops/planning/recommendations读取选定窗口内的维护候选。确认风险评分、预计时长、优先级和资产范围。
POST /api/v1/dcops/planning/generate生成草稿计划。分派前审阅计划项和冲突数量。
GET /api/v1/dcops/planning/{planId}/conflicts检查计划冲突。与班组负责人检查资源或时间窗口冲突。
POST /api/v1/dcops/planning/{planId}/resolve处理计划冲突。记录处理策略和剩余冲突。
GET /api/v1/dcops/dispatch/pending列出还没有未完成工单的开放告警。确认诊断状态和动作负责人。
POST /api/v1/dcops/dispatch/batch-approve批准选定派工候选。在所选告警和诊断证据完成审阅后使用。

运营分析

Endpoint用途
/dashboard/operations综合运营队列和吞吐看板数据。
/dashboard/operations/kpi-delta近期 KPI 相对上一周期的变化。
/dashboard/operations/queue-aging未完成队列老化分组。
/dashboard/operations/predictive-queue7、30、90 天预测风险分组。
/dashboard/operations/sla-rates响应和完成 SLA 达成率指标。
/dashboard/operations/sla-breaches按行动优先级排序的开放 SLA 违约工单。
/dashboard/operations/diagnosis-reuse派工中的诊断复用率。
/dashboard/operations/dispatch-funnel从告警到闭环结果的转化漏斗。
/dashboard/operations/snapshot用于看板和交接的可导出运营快照。
/dashboard/operations/snapshot.csv供表格审阅的 CSV 导出。
/dashboard/operations/events告警、工单和风险快照变化的服务器发送事件流。

快照导出可用于运营会议、班次交接和事件复盘。请和范围、假设说明一起保存。

BMS 映射与模型运营

Endpoint用途审阅检查
GET /api/v1/dcops/integrations/bms/mappings读取最新发布或草稿 BMS 映射元数据。检查来源、版本、状态和更新时间。
POST /api/v1/dcops/integrations/bms/mappings/validate发布前验证映射规则形状。检查 source point、target field、覆盖率、错误和警告。
POST /api/v1/dcops/integrations/bms/mappings/publish发布映射版本并创建审计证据。源数据负责人批准后发布。
GET /api/v1/dcops/model-ops/status读取当前执行模式和状态元数据。记录执行模式、降级状态、延迟和更新时间。
POST /api/v1/dcops/model-ops/engine-mode授权后切换 standard 或 NVIDIA 模式。使用项目批准的模式,审计变更,并确认回退行为。

模型运营状态是运营控制界面。模式变更应作为受治理配置变更处理。

建议的 Agent 回答结构

部分内容
范围租户、站点、数据中心、数据大厅、时间窗口和选定资产。
当前状态看板 KPI、开放告警、队列老化、SLA 风险、健康分布和预测队列。
证据源记录、健康快照、预测历史、诊断记录、BMS 映射版本、工单和反馈。
建议审阅面向负责人的分级动作、证据链接和缺失数据说明。
交接工单草稿、升级说明、计划草稿或现场核查请求。

验证清单

  • 工作流运行在正确租户和 DCOps 模块范围内。
  • 调用方拥有对应读取、诊断、工单、反馈或配置动作的 dcops.* 权限。
  • 资产身份、BMS 点位、告警、工单和表计读数指向同一站点上下文。
  • AI 辅助输出包含来源、置信度、trace ID、可用时的模型或执行模式,以及审阅负责人。
  • 工单动作绑定到已批准的派工或计划证据。
  • 现场执行后记录反馈,让后续诊断和计划能够吸收结果。

相关文档