資料中心營運 AI 工具
資料中心營運透過產品 API、Advisor 輔助診斷、預測性維護交接,以及 AI Engine 健康或剩餘壽命呼叫來支援 AI 輔助工作流程。目標是協助營運人員審閱風險、準備維護動作,並保持證據可追溯。
當實施團隊需要理解 DCOps 哪些介面可由應用呼叫、哪些輸出需要審閱,以及如何結合 DFS、Inspector 和預測性維護時,請使用本頁。
工具層
| 層級 | 主要使用者 | 存取邊界 | 輸出類型 |
|---|---|---|---|
/api/v1/dcops/* 產品 API | 資料中心營運 UI 和已核准的後端工作流程 | dcops.view、dcops.predict.view、dcops.diagnosis.run、dcops.workorder.link、dcops.feedback.write | 看板、資產健康、預測、診斷、派工、BMS 對應、計畫和營運快照 |
| Advisor 診斷 | 診斷工作流程和審閱助手 | 產品服務認證與診斷權限 | 診斷摘要、信賴度、證據來源和 trace ID |
| 預測性維護 | 可靠性和維護負責人 | pdm:read、pdm:write 及相關產品權限 | 設備健康、異常審閱、剩餘壽命估計、advisory 和工單回饋 |
| AI Engine | 產品服務和受控後端任務 | 服務認證與專案設定 | 健康評分、剩餘壽命估計、診斷支援和執行模式元資料 |
| DFS | 資料負責人和整合團隊 | DFS 連接器、對應、資料集和品質審閱權限 | BMS、告警、表計、設備、工單和信號歷史資料集 |
外部 Agent 需要 DCOps 上下文時,應使用已核准的後端工作流程,並用共享 /mcp/base/ 上下文讀取資產、文件、工單和證據。對外暴露工作流程前,應在目標環境中進行執行時工具發現。
推薦 AI 輔助流程
資料準備
| 資料 | 價值 |
|---|---|
| 設備身份 | 將看板、BMS 點位、預測、告警、工單和回饋連接到同一營運物件。 |
| BMS 對應 | 說明哪些來源點位驅動目標欄位,以及對應覆蓋是否可接受。 |
| 告警歷史 | 為診斷提供嚴重度、時間、重複模式和受影響設備上下文。 |
| 工單歷史 | 提供近期動作、未完成佇列、SLA 狀態和閉環回饋。 |
| 健康與預測快照 | 提供評分、風險等級、概率、剩餘壽命區間、模型版本和執行模式。 |
| 表計與能源讀值 | 在定義、單位和時間窗口經過驗證後,支援 PUE/WUE 和能源審閱。 |
自動審閱前,請先使用 DFS 對應、DFS Lite 資料品質 和 準備預測性維護信號歷史。
健康和預測介面
| Endpoint | 用途 | 審閱檢查 |
|---|---|---|
POST /api/v1/dcops/assets/{assetId}/health | 為單個資產計算並保存健康快照。 | 確認資產身份、近期告警數量、工單上下文、來源資料新鮮度和執行模式。 |
GET /api/v1/dcops/assets/{assetId}/health/trend | 讀取選定時間窗口內的健康評分趨勢。 | 檢查時間範圍、缺失歷史和風險等級變化。 |
GET /api/v1/dcops/health/summary | 審閱所有設備的健康分布。 | 確認站點範圍和哪些資產有目前快照。 |
POST /api/v1/dcops/assets/{assetId}/predictions | 產生故障概率和剩餘壽命結果。 | 審閱模型版本、概率窗口、剩餘壽命區間和來源資料假設。 |
GET /api/v1/dcops/assets/{assetId}/predictions/history | 讀取單個資產的預測歷史。 | 將近期預測與工單和現場發現對照。 |
GET /api/v1/dcops/predictions/high-risk | 列出超過所選風險閾值的設備。 | 派工前驗證閾值、時間窗口和審閱負責人。 |
當工作流程需要更豐富的模型管理、異常審閱、設備模板或 advisory inbox 時,請使用預測性維護文件。
診斷與閉環介面
| Endpoint | 用途 | 審閱檢查 |
|---|---|---|
POST /api/v1/dcops/diagnosis/from-alert/{alertId} | 為告警建立診斷記錄。 | 確認告警已關聯設備,並有來源時間戳。 |
GET /api/v1/dcops/alerts/{alertId}/diagnosis | 讀取告警診斷歷史。 | 審閱診斷文字、信賴度、trace ID、建立時間和來源。 |
GET /api/v1/dcops/alerts/{alertId}/closed-loop | 一起讀取告警、診斷、工單和回饋證據。 | 完成審閱前確認診斷、動作和回饋都存在。 |
GET /api/v1/dcops/work-orders/{workOrderId}/closed-loop | 讀取工單閉環證據。 | 檢查診斷關聯和回饋狀態。 |
POST /api/v1/dcops/work-orders/{workOrderId}/feedback | 記錄實際根因、執行動作、解決狀態和評分。 | 將回饋綁定到負責審閱人和工單關閉過程。 |
診斷輸出應作為營運審閱記錄。建議動作需要負責人核准後才進入現場執行。
計畫與派工介面
| Endpoint | 用途 | 審閱檢查 |
|---|---|---|
GET /api/v1/dcops/planning/recommendations | 讀取選定窗口內的維護候選。 | 確認風險評分、預計時長、優先級和資產範圍。 |
POST /api/v1/dcops/planning/generate | 產生草稿計畫。 | 分派前審閱計畫項和衝突數量。 |
GET /api/v1/dcops/planning/{planId}/conflicts | 檢查計畫衝突。 | 與班組負責人檢查資源或時間窗口衝突。 |
POST /api/v1/dcops/planning/{planId}/resolve | 處理計畫衝突。 | 記錄處理策略和剩餘衝突。 |
GET /api/v1/dcops/dispatch/pending | 列出還沒有未完成工單的開放告警。 | 確認診斷狀態和動作負責人。 |
POST /api/v1/dcops/dispatch/batch-approve | 核准選定派工候選。 | 在所選告警和診斷證據完成審閱後使用。 |
營運分析
| Endpoint | 用途 |
|---|---|
/dashboard/operations | 綜合營運佇列和吞吐看板資料。 |
/dashboard/operations/kpi-delta | 近期 KPI 相對上一週期的變化。 |
/dashboard/operations/queue-aging | 未完成佇列老化分組。 |
/dashboard/operations/predictive-queue | 7、30、90 天預測風險分組。 |
/dashboard/operations/sla-rates | 回應和完成 SLA 達成率指標。 |
/dashboard/operations/sla-breaches | 按行動優先級排序的開放 SLA 違約工單。 |
/dashboard/operations/diagnosis-reuse | 派工中的診斷複用率。 |
/dashboard/operations/dispatch-funnel | 從告警到閉環結果的轉化漏斗。 |
/dashboard/operations/snapshot | 用於看板和交接的可匯出營運快照。 |
/dashboard/operations/snapshot.csv | 供表格審閱的 CSV 匯出。 |
/dashboard/operations/events | 告警、工單和風險快照變化的伺服器發送事件流。 |
快照匯出可用於營運會議、班次交接和事件復盤。請和範圍、假設說明一起保存。
BMS 對應與模型營運
| Endpoint | 用途 | 審閱檢查 |
|---|---|---|
GET /api/v1/dcops/integrations/bms/mappings | 讀取最新發布或草稿 BMS 對應元資料。 | 檢查來源、版本、狀態和更新時間。 |
POST /api/v1/dcops/integrations/bms/mappings/validate | 發布前驗證對應規則形狀。 | 檢查 source point、target field、覆蓋率、錯誤和警告。 |
POST /api/v1/dcops/integrations/bms/mappings/publish | 發布對應版本並建立稽核證據。 | 來源資料負責人核准後發布。 |
GET /api/v1/dcops/model-ops/status | 讀取目前執行模式和狀態元資料。 | 記錄執行模式、降級狀態、延遲和更新時間。 |
POST /api/v1/dcops/model-ops/engine-mode | 授權後切換 standard 或 NVIDIA 模式。 | 使用專案核准的模式,稽核變更,並確認回退行為。 |
模型營運狀態是營運控制介面。模式變更應作為受治理設定變更處理。
建議的 Agent 回答結構
| 部分 | 內容 |
|---|---|
| 範圍 | 租戶、站點、資料中心、資料大廳、時間窗口和選定資產。 |
| 目前狀態 | 看板 KPI、開放告警、佇列老化、SLA 風險、健康分布和預測佇列。 |
| 證據 | 來源記錄、健康快照、預測歷史、診斷記錄、BMS 對應版本、工單和回饋。 |
| 建議審閱 | 面向負責人的分級動作、證據連結和缺失資料說明。 |
| 交接 | 工單草稿、升級說明、計畫草稿或現場核查請求。 |
驗證清單
- 工作流程執行在正確租戶和 DCOps 模組範圍內。
- 呼叫方擁有對應讀取、診斷、工單、回饋或設定動作的
dcops.*權限。 - 資產身份、BMS 點位、告警、工單和表計讀值指向同一站點上下文。
- AI 輔助輸出包含來源、信賴度、trace ID、可用時的模型或執行模式,以及審閱負責人。
- 工單動作綁定到已核准的派工或計畫證據。
- 現場執行後記錄回饋,讓後續診斷和計畫能夠吸收結果。