データ準備は AI の拡張より先に必要
産業 AI プロジェクトでは、モデルが文書を読めても、判断に関わる資産、場所、信号、作業指示、承認ルールを安定して特定できないことがあります。実運用では、モデル能力と同じくらいデータ基盤が重要です。
データ準備とは、AI Agent とデジタルツインが必要とする運用文脈を整えることです。ソースシステム、資産 ID、空間構造、ライブ信号、アラーム履歴、作業指示、点検証拠、SOP、文書、権限、結果記録を対象にします。
Data Fusion Services は、FactVerse スタックの中でこの基盤を準備します。ソースシステムを接続し、フィールドをツイン実体へマッピングし、データを正規化し、指標を計算し、その文脈を FactVerse Twin Engine、FactVerse AI Agent、Inspector、ダッシュボード、分析ワークフローで使える状態にします。
運用ワークフローから始める
最初に決めるべきことは、どの判断やタスクを改善するかです。
開始点としては、重要設備の予知保全、施設点検ルート、データセンター資産管理、熱供給ネットワーク運用、半導体施設システム、倉庫物流設備点検、デジタル SOP 実行などが適しています。各ワークフローが、先に接続すべきデータと後でよいデータを明確にします。
| ワークフロー | 最初に必要なデータ |
|---|---|
| 予知保全 | 資産階層、センサー傾向、アラーム、保全履歴、点検結果、作業指示結果 |
| 施設点検 | 空間階層、資産リスト、点検ポイント、チェックリスト、写真、問題分類、完了記録 |
| データセンター運用 | 部屋、ラック、施設設備、メーター、アラーム、エネルギー読み値、保全記録、資産責任者 |
| HeatOps | 熱源、サブステーション、メーター、温度、圧力、流量、天気、配熱ログ、現場タスク |
| 半導体施設運用 | ユーティリティ設備、Sub-fab システム、アラーム、運用限界、作業指示、オペレーターメモ |
| 操作ガイダンス | SOP、タスク手順、設備参照、安全メモ、トレーニング記録、承認要件 |
ワークフローから始めることで、データモデルを運用価値に結び付けられます。
ソースシステム一覧を作る
産業現場のデータは、多くのシステムに分散しています。ソース一覧には、どのシステムが存在するか、何を管理しているか、どのようにアクセスするか、更新頻度はどれくらいか、誰が利用を承認するかを記録します。
代表的なソースには、SCADA、BMS、EMS、PLC、ヒストリアン、IoT プラットフォーム、MES、ERP、CMMS、EAM、GIS、BIM、メーター、スプレッドシート、図面、マニュアル、SOP リポジトリ、点検ツール、トレーニングシステム、文書ライブラリがあります。
各ソースについて、所有者、業務目的、接続方法、利用可能なタグと記録、更新頻度、保持期間、単位、タイムスタンプ、命名、品質課題、セキュリティと承認要件を確認します。
資産と空間の ID を整える
AI Agent ワークフローには安定した参照が必要です。ポンプ、AHU、UPS、熱交換器、バルブ、クレーン、車両、部屋、ライン、サブステーションは、複数システムをまたいで識別できる ID を持つ必要があります。
FactVerse と Twin Engine は、この ID レイヤーを使って空間、設備、システム、関係、文書、信号、作業記録を接続します。Data Fusion Services はソース側のフィールドやタグをツイン実体にマッピングし、信号を正しい対象に結び付けます。
設計では、サイト、建物、階、ゾーン、部屋、ライン、ルート、サービスエリア、資産クラス、資産 ID、表示名、型式、場所、責任者、上下流関係、ソースシステム別名、文書リンク、SOP リンク、点検ポイント、作業指示参照を扱います。
時系列データとイベントデータを準備する
継続運用には、信頼できる信号が必要です。温度、振動、電流、圧力、流量、エネルギー、バルブ状態、アラーム状態、設備状態には、一貫した単位、タイムスタンプ、サンプリングルール、品質フラグが必要です。
Data Fusion Services は、単位の正規化、タイムスタンプの整合、欠損値処理、派生指標計算、品質問題のマーキングを支援します。ライブ信号と履歴信号を、ダッシュボード、AI レビュー、保全分析、機械学習データセットで使える信頼度に近づけます。
作業記録と SOP 文脈を接続する
AI の提案を実行につなげるには、作業指示、点検結果、問題分類、受入メモ、写真、SOP、マニュアル、トレーニング記録、承認経路が必要です。
Inspector、Checklist、接続された CMMS または EAM は、現場側のループを支えます。誰が発見事項をレビューしたか、どのアクションを行ったか、どの証拠を取得したか、状態が改善したかを記録します。
SOP と文書は、資産やワークフローに接続しておく必要があります。AI Agent は適切な手順を取得し、関連履歴を要約し、タスク提案を準備し、人によるレビューを承認経路に残せます。
機械学習に使えるデータにする
機械学習に有用なデータセットには、信号、資産文脈、運用状態、人の判断、実行されたアクション、結果が含まれます。原始的なセンサー履歴だけでは、現場の判断を十分に説明できません。
予知保全では、信号を出した資産、通常運転かどうか、発生したアラーム、その後の作業指示、技術者の発見、アクション後に状態が改善したかを記録します。これらの記録は、モデル学習、再学習、評価、提案品質の調整に使えます。
ガバナンスと展開管理
データ準備にはガバナンスも必要です。各ソースには所有者が必要です。各マッピング済み実体には管理者が必要です。各 AI ワークフローには、アクセス、承認、変更管理、証拠保持のルールが必要です。
産業導入では、データ系統、サイバーセキュリティ境界、ロールベースアクセス、モデルレビュー、サイト受入条件、変更履歴、ローカライズ、ロールバック計画を扱います。これにより、パイロット後もデータ基盤への信頼を保ったまま拡張できます。
DataMesh の展開パターン
- ワークフローを選ぶ - 責任者が明確で、結果を測定できる運用ループを選びます。
- ソースを棚卸しする - システム、タグ、記録、文書、所有者、アクセス方法、品質リスクを整理します。
- ID モデルを作る - FactVerse で空間、資産、システム、関係、別名、責任者を定義します。
- データをマッピングして整える - Data Fusion Services でソースを接続し、フィールドをツイン実体へ紐付け、単位とタイムスタンプを整え、指標を計算します。
- 実行文脈を接続する - Inspector、Checklist、CMMS または EAM、SOP、証拠フィールド、承認ルールを接続します。
- AI レビューを準備する - 信頼できる文脈を FactVerse AI Agent に渡し、証拠要約、異常レビュー、提案作成、人による承認に使います。
- 結果を記録する - 現場記録とアクション後の読み値を使い、データ品質、モデル評価、展開判断を改善します。
準備度チェックリスト
- ワークフローに責任者と測定可能な運用結果があるか
- ソースシステム、文書、タグ、記録が所有者付きで棚卸しされているか
- 資産と空間が複数システムで一貫してマッピングされているか
- 単位、タイムスタンプ、サンプリング頻度、品質課題が記録されているか
- 作業指示、点検、SOP、写真、受入記録が接続されているか
- AI Agent が追跡可能な証拠で提案を説明できるか
- 人のレビュー判断と却下された提案を保存できるか
- 結果記録をモデル学習、再学習、評価に使えるか
公開参考情報
Data Fusion Services 製品ページでは、FactVerse スタックのデータ統合レイヤーを説明しています。
FactVerse AI Agent 運用ループガイドでは、AI Agent の提案を人がレビューする現場実行へつなげる方法を説明しています。
Yokogawa と DataMesh の予知保全事例、NIO スマートファクトリー事例、JTC との協業は、産業データ、デジタルツイン文脈、運用ワークフローの公開例です。
