データセンター運用
データセンター運用は、データセンター施設と設備運用のための FactVerse モジュールです。資産 ID、データホールのコンテキスト、BMS ポイントマッピング、設備健全性、予知保全、アラート診断、作業指示ディスパッチ、SLA レビュー、クローズドループ証拠を 1 つの運用ワークフローにまとめます。
ソースシステム記録を管理されたデジタルツインに接続し、現在の運用リスクをレビューし、追跡可能な証拠で保全アクションを準備する場合に、このガイドを使用します。
AI 支援分析の面は データセンター運用 AI ツール を参照します。
現在のサービス境界
| 面 | 現在の役割 |
|---|---|
| FactVerse frontend | データセンター概要、データホールフィルター、資産一覧と詳細、予測キュー、診断コンソール、クローズドループビュー、運用ダッシュボード、BMS マッピングビュー、モデル運用ステータスを提供します。 |
| Core backend と Data Center Operations services | /api/v1/dcops の dashboard、KPI、asset reads、health trends、prediction history、diagnosis history、planning recommendations、dispatch candidates、closed-loop records、BMS mappings、operations analytics、snapshot export、live event stream を提供します。 |
| Inspector と work orders | アラート、作業指示、フィードバック、添付、現場実行のコンテキストを提供します。 |
| 予知保全 | データセンター資産により詳細な保全分析が必要な場合、設備健全性と残存寿命ワークフローを提供します。 |
| DFS | 運用が依存する前に、ソースデータ、BMS mapping、meter readings、work records、equipment identity、governed datasets を準備します。 |
| AI Engine と Advisor | health scoring、remaining-life estimation、alert diagnosis text、プロジェクトで有効な standard または NVIDIA 実行メタデータを提供します。 |
このモジュールは、運用レビューと保全ワークフローの準備に使用します。現場チームは、アクション実行前にデータマッピング、エンジニアリング前提、承認状態を確認します。
運用フロー
現在のユーザーワークフロー
| ワークフロー | ユーザーがレビューまたは実行できること |
|---|---|
| Overview dashboard | asset count、alert state、work-order state、data hall scope、health score、データがマッピングされている場合の PUE/WUE 指標、運用リスク信号。 |
| Asset operations | データセンター資産、設備詳細、最近のアラート、最新診断、未完了作業指示、health trend、prediction history、feedback state。 |
| Health review | 設備 health score、risk level、anomaly score、aggregate health distribution の計算または読み取り。 |
| Predictive queue | 7、30、90 日の risk buckets、high-risk equipment、remaining useful life intervals、保全注意候補。 |
| Diagnosis console | アラート診断記録の作成または読み取り、confidence、trace ID、evidence source、diagnosis history のレビュー。 |
| Dispatch and closed loop | pending dispatch candidates、work-order creation approval、feedback linkage、diagnosis、action、feedback evidence の確認。 |
| Planning | maintenance planning recommendations、draft plans、conflicts、time-window または resource conflicts のレビュー。 |
| Operations dashboard | queue aging、SLA rates、SLA breach list、diagnosis reuse、dispatch conversion funnel、KPI delta、trends、exportable operations snapshots。 |
| Live operations stream | alerts、work orders、risk snapshot updates のイベント購読。 |
| BMS mapping | BMS データの source point から target field への mapping rules をレビュー、検証、公開。 |
| Model operations | active engine mode、fallback metadata、standard または NVIDIA execution path の status indicators。 |
開始前
| 要件 | メモ |
|---|---|
| テナントとサイトコンテキスト | DCOps reads はテナントスコープです。サイトとデータセンターのフィルターは運用範囲に合わせます。 |
| 権限 | 主な read surfaces は dcops.view、prediction surfaces は dcops.predict.view を使用します。診断と作業指示アクションには該当する診断、作業指示、フィードバック権限が必要です。 |
| 資産 ID | equipment records には安定した equipment ID、name、type、location、criticality、data hall または room assignment を持たせます。 |
| ソースマッピング | BMS points、alerts、work orders、meter readings、equipment records を同じ asset identity に対応付けます。 |
| 作業オーナー | alert reviewer、dispatch candidate owner、work-order assignee、SLA breach owner、feedback owner を決めます。 |
| データ品質 | health または prediction output を解釈する前に、timestamp、unit、freshness、missing values、stale mappings を確認します。 |
| レビュー記録 | diagnosis text、trace IDs、work-order links、feedback、snapshot exports を運用レビューに保存します。 |
ソースデータ準備は Getting Started with DFS、Connect BMS to a Facility Twin、Prepare Predictive Maintenance Signal History から開始します。
データセンター運用を開く
| View | Route |
|---|---|
| Overview | /datacenterops/dashboard |
| Asset list | /datacenterops/assets |
| Asset detail | /datacenterops/assets/:assetId |
| Predictive queue | /datacenterops/predictive-queue |
| Diagnosis console | /datacenterops/diagnosis |
| Closed-loop view | /datacenterops/closed-loop |
| Operations dashboard | /datacenterops/operations |
| Integrations | /datacenterops/integrations |
モジュール可用性はテナント設定に依存します。バックエンドは /api/v1/dcops の提供前にデータセンター運用モジュールの有効化を確認します。
運用データを準備
| データ領域 | 典型的な準備 |
|---|---|
| 資産階層 | site、data center、data hall、room、rack、equipment、criticality を安定 ID にマッピングします。 |
| BMS points | source point names を target fields にマッピングし、公開前に rule coverage を検証します。 |
| Alerts | severity、status、title、source equipment、timestamps を asset layer に対応付けます。 |
| Work orders | open、assigned、in-progress、completed、feedback records を alerts と equipment に接続します。 |
| Meter and energy readings | power、water、utility readings、units、time windows を運用レビュー用に準備します。 |
| Predictive signals | maintained assets の health snapshots、failure prediction history、remaining-life inputs を準備します。 |
ソースシステムに connector configuration、source-to-target mapping、sync monitoring、data-quality review、governed dataset preparation が必要な場合は DFS を使用します。
ダッシュボードと資産をレビュー
- 関連する site または data center scope を選択します。
- asset、alert、work order、health、risk summary cards を確認します。
- asset list を開き、risk または equipment type で絞り込みます。
- asset detail で recent alerts、diagnosis records、open work orders、health trend、prediction history、feedback status を確認します。
- レビュー結果を共有する場合は operations snapshot を保存またはエクスポートします。
PUE と WUE 指標は運用レビュー信号として扱います。管理レポートで使用する前に、meter coverage、load definitions、calculation assumptions を確認します。
健全性と予測リスクをレビュー
| 領域 | 確認内容 |
|---|---|
| Health score | composite score、risk level、anomaly score、engine mode、timestamp、利用可能な factor breakdown。 |
| Health trend | 選択した asset と time window の health-score history。 |
| Prediction history | 7、30、90 日の failure probabilities、remaining-life range、model version、engine mode。 |
| High-risk equipment | 選択した risk threshold と time window を超える equipment。 |
| Predictive queue | 近い保全計画と運用会議のための risk buckets。 |
Health と prediction output はレビュー証拠として扱います。保全オーナーは inspections、work orders、source signal freshness、site constraints と比較してからアクションを承認します。
アラートを診断しクローズドループ化
- diagnosis console または alert detail を開きます。
- alert severity、affected equipment、recent alert pattern、source timestamps を確認します。
- diagnosis record を作成または読み取ります。
- confidence、trace ID、evidence source、diagnosis history を確認します。
- オーナーが推奨アクションを受け入れた後、work order を作成または接続します。
- work order close 時に feedback を記録します。
- closed-loop view に diagnosis、action、feedback evidence が含まれることを確認します。
診断は Advisor-backed text generation または rule-based fallback を使う場合があります。source、confidence、trace ID、audit record をレビュー証拠として残します。
保全を計画しディスパッチ
| Surface | Use |
|---|---|
| Planning recommendations | candidate maintenance windows、estimated duration、priority、risk score をレビューします。 |
| Planning draft | 選択した window の draft plan を生成し、resource または time-window conflicts を確認します。 |
| Pending dispatch | open work order を持たない open alerts をレビューします。 |
| Batch approve | 選択した alert と diagnosis evidence をレビューした後、dispatch candidates を承認します。 |
| Bulk operator actions | 権限がある場合、owner assignment、priority normalization、escalation note、diagnosis retry、closed-loop reconciliation を実行します。 |
アクションオーナーを明確にします。Bulk operations は、shift lead または operations owner が選択レコードを承認した後、triage と queue management に使用します。
BMS マッピングとモデル運用
- Integrations を開きます。
- latest published BMS mapping version と source を確認します。
sourcePointとtargetFieldの coverage を検証します。- ソースオーナーが確認した後、mapping changes を公開します。
- audit record を運用引き渡し資料に保存します。
Model operations は engine mode と status metadata を表示します。standard path または project-enabled NVIDIA path のどちらで動作しているかを確認し、acceptance で fallback または degraded status を記録します。
API 範囲
Data Center Operations APIs は /api/v1/dcops 配下にあります。
| Group | Example endpoints |
|---|---|
| Overview and KPIs | /, /dashboard/overview, /dashboard/overview/trends, /dashboard/kpis |
| Assets and health | /assets, /assets/rul-intervals, /assets/{assetId}/detail, /assets/{assetId}/health, /assets/{assetId}/health/trend, /health/summary |
| Predictions | /assets/{assetId}/predictions, /assets/{assetId}/predictions/history, /predictions/high-risk |
| Diagnosis | /diagnosis/from-alert/{alertId}, /alerts/{alertId}/diagnosis, /alerts/{alertId}/closed-loop |
| Planning | /planning/recommendations, /planning/generate, /planning/{planId}/conflicts, /planning/{planId}/resolve |
| Dispatch and feedback | /dispatch/pending, /dispatch/alerts/{alertId}/approve, /dispatch/batch-approve, /recommendations/{diagnosisId}/create-work-order, /work-orders/{workOrderId}/feedback, /work-orders/{workOrderId}/closed-loop |
| Operations dashboard | /dashboard/operations, /dashboard/operations/kpi-delta, /dashboard/operations/queue-aging, /dashboard/operations/predictive-queue, /dashboard/operations/trends, /dashboard/operations/sla-rates, /dashboard/operations/sla-breaches, /dashboard/operations/diagnosis-reuse, /dashboard/operations/dispatch-funnel, /dashboard/operations/snapshot, /dashboard/operations/snapshot.csv, /dashboard/operations/events |
| Integrations and model ops | /integrations/bms/mappings, /integrations/bms/mappings/validate, /integrations/bms/mappings/publish, /model-ops/status, /model-ops/engine-mode |
検証チェックリスト
- tenant、site、data center filters がレビュー範囲に合っている。
- asset、equipment、alert、BMS point、meter、work-order IDs が同じ運用対象に解決される。
- source timestamps、units、freshness が判断に十分である。
- BMS mapping changes に owner approval と audit evidence がある。
- health と prediction outputs が inspection と work-order context と一緒にレビューされている。
- diagnosis records に trace ID、evidence source、confidence、responsible reviewer がある。
- action 後に work-order feedback が記録され、closed-loop view に outcome が反映される。
- snapshot と CSV exports を引き渡しに使う場合、scope note と assumptions と一緒に保存されている。