返回指南

資料融合、AI Agent 與營運數位孿生準備度

工業 AI Agent 與營運數位孿生的資料準備指南

這篇指南說明工業 AI Agent 和營運數位孿生上線前需要準備哪些資料:系統清單、資產身份、時間序列品質、工單記錄、SOP 上下文和機器學習回饋資料。

工業 AI Agent 與營運數位孿生的資料準備指南

資料準備先於 AI 規模化

工業 AI 專案常見的問題,是模型能讀文件,卻無法穩定識別決策背後的資產、位置、訊號、工單或審批規則。在真實營運中,資料基礎和模型能力同樣重要。

資料準備的核心,是為 AI Agent 和數位孿生建立可用的營運上下文:源系統、資產身份、空間結構、即時訊號、告警歷史、工單、巡檢證據、SOP、文件、權限和結果記錄。

Data Fusion Services 是 FactVerse 產品體系中準備這層基礎的能力。它連結源系統,將欄位映射到孿生實體,統一資料格式,計算指標,並讓這些上下文可用於 FactVerse Twin EngineFactVerse AI AgentInspector、看板和分析流程。

從營運工作流開始

第一個問題應該是營運問題:要改善哪一個決策或任務。

可行起點包括關鍵設備預測性維護、設施巡檢路線、資料中心資產管理、熱網營運、半導體廠務系統、倉儲物流設備檢查和數位化 SOP 執行。每個工作流都會決定哪些資料必須先接入,哪些資料可以後續再接。

工作流最先需要的資料
預測性維護資產層級、感測器趨勢、告警、維護歷史、巡檢結果、工單結果
設施巡檢空間層級、資產清單、巡檢點、檢查表、照片、問題分類、關閉記錄
資料中心營運機房、機櫃、設施設備、計量表、告警、能耗讀數、維護記錄、資產責任人
HeatOps熱源、換熱站、計量表、溫度、壓力、流量、天氣、調度日誌、現場任務
半導體設施營運公輔設備、Sub-fab 系統、告警、運行邊界、工單、操作員備註
操作指導SOP、任務步驟、設備引用、安全說明、訓練記錄、審批要求

從工作流出發,可以讓資料模型始終服務營運價值。

建立源系統清單

工業現場的資料通常分散在多個系統中。源系統清單需要說明有哪些系統、每個系統負責什麼、如何存取、更新頻率如何,以及由誰批准使用。

常見來源包括 SCADA、BMS、EMS、PLC、歷史資料庫、IoT 平台、MES、ERP、CMMS、EAM、GIS、BIM、計量表、電子表格、圖紙、手冊、SOP 倉庫、巡檢工具、訓練系統和文件庫。

每個來源都應記錄:

  • 負責人和業務用途
  • 連接方式和存取邊界
  • 可用欄位、點位、文件和記錄
  • 更新頻率、延遲和歷史保留時間
  • 單位、時間戳、命名和品質問題
  • 安全、隱私和審批要求

這張清單就是資料整合交付地圖。

建立資產與空間身份

AI Agent 工作流需要穩定引用。泵、空調箱、UPS、換熱器、閥門、塔吊、車輛、房間、產線或換熱站,都應該擁有可以跨系統識別的身份。

FactVerse 和 Twin Engine 用這層身份連接空間、設備、系統、關係、文件、訊號和工單。Data Fusion Services 將源欄位和點位映射到這些實體,讓每個訊號都掛接到孿生中的正確物件。

好的身份設計應覆蓋站點、建築、樓層、分區、房間、產線、路線和服務區域,也應覆蓋資產類別、資產 ID、顯示名稱、型號、位置、責任人、上下游依賴、源系統別名、文件連結、SOP 連結、巡檢點和工單引用。

這層身份把原始資料轉化為營運上下文。

準備時間序列與事件資料

連續營運依賴乾淨的訊號。溫度、振動、電流、壓力、流量、能耗、閥門狀態、告警狀態和設備狀態,需要穩定的單位、時間戳、採樣規則和品質標記。

Data Fusion Services 可以協助統一單位、對齊時間戳、處理缺失值、計算衍生指標並標記品質問題。目標是讓即時和歷史訊號足夠可靠,可以支撐看板、AI 審查、維護分析和機器學習資料集。

連接工單記錄與 SOP 上下文

AI 建議要進入執行,就需要工單記錄、巡檢結果、問題分類、驗收說明、照片、SOP、手冊、訓練記錄和審批路徑。

Inspector、Checklist 以及已連結的 CMMS 或 EAM 系統提供現場閉環。它們記錄誰審查了發現、採取了什麼動作、採集了什麼證據,以及狀態是否改善。

SOP 和文件上下文應該連接到資產和工作流。AI Agent 才能檢索正確流程、總結相關歷史、準備任務建議,並把人工審查保留在審批路徑中。

讓資料可用於機器學習

機器學習需要完整營運語境,原始感測器歷史只是其中一部分。真正有價值的資料集包括訊號、資產上下文、運行狀態、人工判斷、採取的動作和結果。

以預測性維護為例,模型需要知道訊號來自哪個資產、現場是否處於正常運行狀態、出現了哪些告警、後續產生了哪些工單、技術人員發現了什麼,以及動作後狀態是否改善。這些記錄可以支援模型訓練、重新訓練、效果評估和建議品質調校。

治理與上線控制

資料準備也依賴治理。每個資料來源需要負責人,每個映射實體需要維護者,每個 AI 工作流需要存取、審批、變更管理和證據保留規則。

工業部署中,治理應覆蓋資料血緣、網路安全邊界、角色權限、模型審查、現場驗收標準、變更歷史、本地化和回退方案。這些控制能協助團隊在試點之後繼續擴展,同時保持對資料基礎的信任。

DataMesh 上線模式

  1. 選擇工作流 - 選擇一個責任清晰、結果可衡量的營運閉環。
  2. 盤點源系統 - 列出系統、點位、記錄、文件、負責人、存取方式和資料品質風險。
  3. 建立身份模型 - 在 FactVerse 中定義空間、資產、系統、關係、別名和責任人。
  4. 映射並統一資料 - 使用 Data Fusion Services 連接來源,將欄位綁定到孿生實體,統一單位、對齊時間戳並計算指標。
  5. 接入執行上下文 - 連接 Inspector、Checklist、CMMS 或 EAM 工作流、SOP、證據欄位和審批規則。
  6. 準備 AI 審查 - 將可信上下文交給 FactVerse AI Agent,用於證據摘要、異常審查、建議草擬和人工批准。
  7. 捕捉結果 - 使用現場記錄和動作後讀數,持續改進資料品質、模型評估和擴展決策。

準備度檢查清單

  • 工作流是否有負責人和可衡量的營運結果
  • 源系統、文件、點位和記錄是否已按負責人完成盤點
  • 資產和空間是否能在不同系統中保持一致映射
  • 單位、時間戳、採樣頻率和資料品質問題是否已記錄
  • 工單、巡檢、SOP、照片和驗收記錄是否已連接
  • AI Agent 是否能用可追蹤證據解釋建議
  • 人工審查決策和被否決建議是否可以保留
  • 結果記錄是否能支援模型訓練、重新訓練和評估
  • 網路安全、存取控制、資料血緣和變更管理是否已定義

公開參考

Data Fusion Services 產品頁介紹了 FactVerse 產品體系中的資料整合層。

FactVerse AI Agent 營運閉環指南說明了 AI Agent 建議如何進入人工審查的現場執行。

Yokogawa 與 DataMesh 預測性維護參考NIO 智慧工廠參考JTC 合作展示了工業資料、數位孿生上下文和營運工作流的公開案例。