跳至主要内容

資料中心營運 AI 工具

資料中心營運透過產品 API、Advisor 輔助診斷、預測性維護交接,以及 AI Engine 健康或剩餘壽命呼叫來支援 AI 輔助工作流程。目標是協助營運人員審閱風險、準備維護動作,並保持證據可追溯。

當實施團隊需要理解 DCOps 哪些介面可由應用呼叫、哪些輸出需要審閱,以及如何結合 DFS、Inspector 和預測性維護時,請使用本頁。

工具層

層級主要使用者存取邊界輸出類型
/api/v1/dcops/* 產品 API資料中心營運 UI 和已核准的後端工作流程dcops.viewdcops.predict.viewdcops.diagnosis.rundcops.workorder.linkdcops.feedback.write看板、資產健康、預測、診斷、派工、BMS 對應、計畫和營運快照
Advisor 診斷診斷工作流程和審閱助手產品服務認證與診斷權限診斷摘要、信賴度、證據來源和 trace ID
預測性維護可靠性和維護負責人pdm:readpdm:write 及相關產品權限設備健康、異常審閱、剩餘壽命估計、advisory 和工單回饋
AI Engine產品服務和受控後端任務服務認證與專案設定健康評分、剩餘壽命估計、診斷支援和執行模式元資料
DFS資料負責人和整合團隊DFS 連接器、對應、資料集和品質審閱權限BMS、告警、表計、設備、工單和信號歷史資料集

外部 Agent 需要 DCOps 上下文時,應使用已核准的後端工作流程,並用共享 /mcp/base/ 上下文讀取資產、文件、工單和證據。對外暴露工作流程前,應在目標環境中進行執行時工具發現。

推薦 AI 輔助流程

資料準備

資料價值
設備身份將看板、BMS 點位、預測、告警、工單和回饋連接到同一營運物件。
BMS 對應說明哪些來源點位驅動目標欄位,以及對應覆蓋是否可接受。
告警歷史為診斷提供嚴重度、時間、重複模式和受影響設備上下文。
工單歷史提供近期動作、未完成佇列、SLA 狀態和閉環回饋。
健康與預測快照提供評分、風險等級、概率、剩餘壽命區間、模型版本和執行模式。
表計與能源讀值在定義、單位和時間窗口經過驗證後,支援 PUE/WUE 和能源審閱。

自動審閱前,請先使用 DFS 對應DFS Lite 資料品質準備預測性維護信號歷史

健康和預測介面

Endpoint用途審閱檢查
POST /api/v1/dcops/assets/{assetId}/health為單個資產計算並保存健康快照。確認資產身份、近期告警數量、工單上下文、來源資料新鮮度和執行模式。
GET /api/v1/dcops/assets/{assetId}/health/trend讀取選定時間窗口內的健康評分趨勢。檢查時間範圍、缺失歷史和風險等級變化。
GET /api/v1/dcops/health/summary審閱所有設備的健康分布。確認站點範圍和哪些資產有目前快照。
POST /api/v1/dcops/assets/{assetId}/predictions產生故障概率和剩餘壽命結果。審閱模型版本、概率窗口、剩餘壽命區間和來源資料假設。
GET /api/v1/dcops/assets/{assetId}/predictions/history讀取單個資產的預測歷史。將近期預測與工單和現場發現對照。
GET /api/v1/dcops/predictions/high-risk列出超過所選風險閾值的設備。派工前驗證閾值、時間窗口和審閱負責人。

當工作流程需要更豐富的模型管理、異常審閱、設備模板或 advisory inbox 時,請使用預測性維護文件。

診斷與閉環介面

Endpoint用途審閱檢查
POST /api/v1/dcops/diagnosis/from-alert/{alertId}為告警建立診斷記錄。確認告警已關聯設備,並有來源時間戳。
GET /api/v1/dcops/alerts/{alertId}/diagnosis讀取告警診斷歷史。審閱診斷文字、信賴度、trace ID、建立時間和來源。
GET /api/v1/dcops/alerts/{alertId}/closed-loop一起讀取告警、診斷、工單和回饋證據。完成審閱前確認診斷、動作和回饋都存在。
GET /api/v1/dcops/work-orders/{workOrderId}/closed-loop讀取工單閉環證據。檢查診斷關聯和回饋狀態。
POST /api/v1/dcops/work-orders/{workOrderId}/feedback記錄實際根因、執行動作、解決狀態和評分。將回饋綁定到負責審閱人和工單關閉過程。

診斷輸出應作為營運審閱記錄。建議動作需要負責人核准後才進入現場執行。

計畫與派工介面

Endpoint用途審閱檢查
GET /api/v1/dcops/planning/recommendations讀取選定窗口內的維護候選。確認風險評分、預計時長、優先級和資產範圍。
POST /api/v1/dcops/planning/generate產生草稿計畫。分派前審閱計畫項和衝突數量。
GET /api/v1/dcops/planning/{planId}/conflicts檢查計畫衝突。與班組負責人檢查資源或時間窗口衝突。
POST /api/v1/dcops/planning/{planId}/resolve處理計畫衝突。記錄處理策略和剩餘衝突。
GET /api/v1/dcops/dispatch/pending列出還沒有未完成工單的開放告警。確認診斷狀態和動作負責人。
POST /api/v1/dcops/dispatch/batch-approve核准選定派工候選。在所選告警和診斷證據完成審閱後使用。

營運分析

Endpoint用途
/dashboard/operations綜合營運佇列和吞吐看板資料。
/dashboard/operations/kpi-delta近期 KPI 相對上一週期的變化。
/dashboard/operations/queue-aging未完成佇列老化分組。
/dashboard/operations/predictive-queue7、30、90 天預測風險分組。
/dashboard/operations/sla-rates回應和完成 SLA 達成率指標。
/dashboard/operations/sla-breaches按行動優先級排序的開放 SLA 違約工單。
/dashboard/operations/diagnosis-reuse派工中的診斷複用率。
/dashboard/operations/dispatch-funnel從告警到閉環結果的轉化漏斗。
/dashboard/operations/snapshot用於看板和交接的可匯出營運快照。
/dashboard/operations/snapshot.csv供表格審閱的 CSV 匯出。
/dashboard/operations/events告警、工單和風險快照變化的伺服器發送事件流。

快照匯出可用於營運會議、班次交接和事件復盤。請和範圍、假設說明一起保存。

BMS 對應與模型營運

Endpoint用途審閱檢查
GET /api/v1/dcops/integrations/bms/mappings讀取最新發布或草稿 BMS 對應元資料。檢查來源、版本、狀態和更新時間。
POST /api/v1/dcops/integrations/bms/mappings/validate發布前驗證對應規則形狀。檢查 source point、target field、覆蓋率、錯誤和警告。
POST /api/v1/dcops/integrations/bms/mappings/publish發布對應版本並建立稽核證據。來源資料負責人核准後發布。
GET /api/v1/dcops/model-ops/status讀取目前執行模式和狀態元資料。記錄執行模式、降級狀態、延遲和更新時間。
POST /api/v1/dcops/model-ops/engine-mode授權後切換 standard 或 NVIDIA 模式。使用專案核准的模式,稽核變更,並確認回退行為。

模型營運狀態是營運控制介面。模式變更應作為受治理設定變更處理。

建議的 Agent 回答結構

部分內容
範圍租戶、站點、資料中心、資料大廳、時間窗口和選定資產。
目前狀態看板 KPI、開放告警、佇列老化、SLA 風險、健康分布和預測佇列。
證據來源記錄、健康快照、預測歷史、診斷記錄、BMS 對應版本、工單和回饋。
建議審閱面向負責人的分級動作、證據連結和缺失資料說明。
交接工單草稿、升級說明、計畫草稿或現場核查請求。

驗證清單

  • 工作流程執行在正確租戶和 DCOps 模組範圍內。
  • 呼叫方擁有對應讀取、診斷、工單、回饋或設定動作的 dcops.* 權限。
  • 資產身份、BMS 點位、告警、工單和表計讀值指向同一站點上下文。
  • AI 輔助輸出包含來源、信賴度、trace ID、可用時的模型或執行模式,以及審閱負責人。
  • 工單動作綁定到已核准的派工或計畫證據。
  • 現場執行後記錄回饋,讓後續診斷和計畫能夠吸收結果。

相關文件