資料中心營運
資料中心營運是 FactVerse 面向資料中心設施與設備營運的模組。它把資產身份、資料大廳上下文、BMS 點位對應、設備健康、預測性維護、告警診斷、工單派發、SLA 審閱和閉環證據組織到同一個營運工作流程中。
當資料中心營運團隊需要把來源系統記錄連接到受治理的數位孿生,審閱目前營運風險,並用可追溯證據準備維護動作時,請使用本指南。
AI 輔助分析介面請查看 資料中心營運 AI 工具。
目前服務邊界
| 介面或服務 | 目前角色 |
|---|---|
| FactVerse 前端 | 提供資料中心總覽、資料大廳篩選、資產列表與詳情、預測佇列、診斷控制台、閉環視圖、營運看板、BMS 對應視圖和模型營運狀態。 |
| Core backend 與 DCOps 模組切片 | 提供 /api/v1/dcops 看板、KPI、資產讀取、健康趨勢、預測歷史、診斷歷史、計畫建議、派工候選、閉環記錄、BMS 對應、營運分析、快照匯出和即時事件流。 |
| Inspector 與工單 | 提供告警、工單、回饋、附件和現場執行上下文。 |
| 預測性維護 | 當資料中心資產需要更細的維護分析時,提供設備健康和剩餘壽命工作流程。 |
| DFS | 在營運依賴這些資料前,準備來源資料、BMS 對應、表計讀值、工單記錄、設備身份和受治理資料集。 |
| AI Engine 與 Advisor | 提供健康評分、剩餘壽命估計、告警診斷文字,以及專案啟用時的 standard 或 NVIDIA 執行元資料。 |
該模組用於營運審閱和維護工作流程準備。現場團隊應在執行動作前確認資料對應、工程假設和審批狀態。
營運流程
目前使用者工作流程
| 工作流程 | 使用者可以審閱或執行的內容 |
|---|---|
| 總覽看板 | 審閱資產數量、告警狀態、工單狀態、資料大廳範圍、健康評分、資料已對應時的 PUE/WUE 指標,以及營運風險信號。 |
| 資產營運 | 審閱資料中心資產、設備詳情、近期告警、最新診斷、未完成工單、健康趨勢、預測歷史和回饋狀態。 |
| 健康審閱 | 計算或讀取設備健康評分、風險等級、異常分數和整體健康分布。 |
| 預測佇列 | 審閱 7、30、90 天風險分組、高風險設備、剩餘壽命區間和維護關注對象。 |
| 診斷控制台 | 建立或讀取告警診斷記錄,審閱信賴度、trace ID、證據來源和診斷歷史。 |
| 派工與閉環 | 審閱待派工候選、核准建立工單、關聯回饋,並檢查診斷、動作和回饋證據是否完整。 |
| 計畫 | 審閱維護計畫建議、產生草稿計畫、檢查衝突,並處理時間窗口或資源衝突。 |
| 營運看板 | 審閱佇列老化、SLA 達成率、SLA 違約列表、診斷複用、派工轉化漏斗、KPI 變化、趨勢和可匯出的營運快照。 |
| 即時營運流 | 訂閱告警、工單和風險快照更新事件。 |
| BMS 對應 | 審閱、驗證並發布 BMS 資料的 source point 到 target field 對應規則。 |
| 模型營運 | 審閱目前執行模式、降級元資料,以及 standard 或 NVIDIA 執行路徑的狀態指標。 |
開始前準備
| 要求 | 說明 |
|---|---|
| 租戶與站點上下文 | DCOps 讀取介面按租戶隔離。站點和資料中心篩選應與目前營運範圍一致。 |
| 權限 | 主要讀取介面使用 dcops.view。預測介面使用 dcops.predict.view。診斷和工單動作需要對應的診斷、工單或回饋權限。 |
| 資產身份 | 設備記錄應有穩定的設備 ID、名稱、類型、位置、重要性,以及資料大廳或房間歸屬。 |
| 來源系統對應 | BMS 點位、告警、工單、表計讀值和設備記錄應對應到同一套資產身份。 |
| 工作負責人 | 明確誰審閱告警、接受派工候選、分派工單、處理 SLA 違約並記錄回饋。 |
| 資料品質 | 解釋健康或預測結果前,確認時間戳、單位、來源資料新鮮度、缺失值和過期對應。 |
| 審閱記錄 | 把診斷文字、trace ID、工單連結、回饋和快照匯出保存在營運審閱記錄中。 |
來源資料準備請先查看 DFS 快速開始、連接 BMS 到設施數位孿生 和 準備預測性維護信號歷史。
開啟資料中心營運
| 視圖 | 路由 |
|---|---|
| 總覽 | /datacenterops/dashboard |
| 資產列表 | /datacenterops/assets |
| 資產詳情 | /datacenterops/assets/:assetId |
| 預測佇列 | /datacenterops/predictive-queue |
| 診斷控制台 | /datacenterops/diagnosis |
| 閉環視圖 | /datacenterops/closed-loop |
| 營運看板 | /datacenterops/operations |
| 整合 | /datacenterops/integrations |
模組是否可用取決於租戶設定。後端會在服務 /api/v1/dcops 路徑前檢查資料中心營運模組是否啟用。
準備營運資料
| 資料領域 | 典型準備內容 |
|---|---|
| 資產層級 | 把站點、資料中心、資料大廳、房間、機櫃、設備和重要性對應到穩定 ID。 |
| BMS 點位 | 將來源點位名稱對應到目標欄位,並在發布前驗證規則覆蓋。 |
| 告警 | 將告警嚴重度、狀態、標題、來源設備和時間戳對應到資產層。 |
| 工單 | 將未開始、已分派、處理中、已完成和回饋記錄連接到告警和設備。 |
| 表計與能源讀值 | 為營運審閱準備電力、水或其他公用工程讀值、單位和時間窗口。 |
| 預測信號 | 為可維護資產準備健康快照、故障預測歷史和剩餘壽命輸入。 |
來源系統需要連接設定、來源到目標對應、同步監控、資料品質審閱和受治理資料集時,請使用 DFS。
審閱看板和資產
- 選擇相關站點或資料中心範圍。
- 審閱資產、告警、工單、健康和風險摘要。
- 開啟資產列表,並按風險或設備類型篩選。
- 開啟資產詳情,審閱近期告警、診斷記錄、未完成工單、健康趨勢、預測歷史和回饋狀態。
- 當審閱結果需要共享時,匯出或保存營運快照。
PUE 和 WUE 指標應作為營運審閱信號。用於管理報告前,請確認表計覆蓋、負載定義和計算假設。
審閱健康與預測風險
| 領域 | 檢查內容 |
|---|---|
| 健康評分 | 綜合評分、風險等級、異常分數、執行模式、時間戳,以及可用時的因子拆解。 |
| 健康趨勢 | 所選資產和時間窗口內的健康評分歷史。 |
| 預測歷史 | 7、30、90 天故障概率、剩餘壽命區間、模型版本和執行模式。 |
| 高風險設備 | 超過所選風險閾值和時間窗口的設備。 |
| 預測佇列 | 用於近期維護計畫和營運會議的風險分組。 |
健康和預測輸出應作為審閱證據。維護負責人應結合巡檢、工單、來源信號新鮮度和現場約束再核准動作。
診斷告警並閉環
- 開啟診斷控制台或告警詳情。
- 審閱告警嚴重度、受影響設備、近期告警模式和來源時間戳。
- 建立或讀取診斷記錄。
- 檢查信賴度、trace ID、證據來源和診斷歷史。
- 負責人接受建議動作後建立或關聯工單。
- 工單關閉時記錄回饋。
- 確認閉環視圖包含診斷、動作和回饋證據。
診斷可能使用 Advisor 產生文字,也可能使用規則回退。兩種路徑都應透過來源、信賴度、trace ID 和稽核記錄保留在審閱證據中。
計畫與派工
| 介面 | 用途 |
|---|---|
| 計畫建議 | 審閱候選維護窗口、預計時長、優先級和風險評分。 |
| 計畫草稿 | 為選定窗口產生草稿計畫,並檢查資源或時間窗口衝突。 |
| 待派工 | 審閱尚無未完成工單的開放告警。 |
| 批量核准 | 在選定告警和診斷證據完成審閱後核准派工候選。 |
| 批量操作 | 在權限允許時分配負責人、統一優先級、追加升級說明、重試診斷或協調閉環證據。 |
保持動作負責人清晰。批量操作應在班組長或營運負責人核准所選記錄後用於分診和佇列管理。
BMS 對應與模型營運
- 開啟 整合。
- 審閱最新發布的 BMS 對應版本和來源。
- 驗證對應規則中必要的
sourcePoint與targetField覆蓋。 - 來源資料負責人確認後發布對應變更。
- 將稽核記錄保存在營運交接材料中。
模型營運會展示執行模式和狀態元資料。用它確認工作流程執行在 standard 路徑,還是專案啟用的 NVIDIA 路徑,並在驗收中記錄回退或降級狀態。
API 範圍
資料中心營運 API 位於 /api/v1/dcops 下:
| 分組 | 示例 endpoint |
|---|---|
| 總覽與 KPI | /, /dashboard/overview, /dashboard/overview/trends, /dashboard/kpis |
| 資產與健康 | /assets, /assets/rul-intervals, /assets/{assetId}/detail, /assets/{assetId}/health, /assets/{assetId}/health/trend, /health/summary |
| 預測 | /assets/{assetId}/predictions, /assets/{assetId}/predictions/history, /predictions/high-risk |
| 診斷 | /diagnosis/from-alert/{alertId}, /alerts/{alertId}/diagnosis, /alerts/{alertId}/closed-loop |
| 計畫 | /planning/recommendations, /planning/generate, /planning/{planId}/conflicts, /planning/{planId}/resolve |
| 派工與回饋 | /dispatch/pending, /dispatch/alerts/{alertId}/approve, /dispatch/batch-approve, /recommendations/{diagnosisId}/create-work-order, /work-orders/{workOrderId}/feedback, /work-orders/{workOrderId}/closed-loop |
| 營運看板 | /dashboard/operations, /dashboard/operations/kpi-delta, /dashboard/operations/queue-aging, /dashboard/operations/predictive-queue, /dashboard/operations/trends, /dashboard/operations/sla-rates, /dashboard/operations/sla-breaches, /dashboard/operations/diagnosis-reuse, /dashboard/operations/dispatch-funnel, /dashboard/operations/snapshot, /dashboard/operations/snapshot.csv, /dashboard/operations/events |
| 整合與模型營運 | /integrations/bms/mappings, /integrations/bms/mappings/validate, /integrations/bms/mappings/publish, /model-ops/status, /model-ops/engine-mode |
驗證清單
- 租戶、站點和資料中心篩選與審閱範圍一致。
- 資產、設備、告警、BMS 點位、表計和工單 ID 指向同一組營運物件。
- 來源時間戳、單位和新鮮度適合目前決策。
- BMS 對應變更已有負責人核准和稽核證據。
- 健康和預測輸出已結合巡檢與工單上下文審閱。
- 診斷記錄包含 trace ID、證據來源、信賴度和負責審閱人。
- 動作執行後記錄工單回饋,讓閉環視圖能反映結果。
- 快照和 CSV 匯出用於交接時,與範圍說明和假設一起保存。