部署工業 AI Agent 前需要準備哪些資料

應從源系統清單、資產與空間身份、有價值的時間序列訊號、告警、工單、巡檢記錄、SOP、文件和現場審批規則開始。

資料準備為什麼會影響營運數位孿生

數位孿生需要穩定的資產名稱、關係、即時狀態、單位、時間戳、工作記錄和證據連結。這些上下文穩定後，AI 建議才能在真實營運語境中被審查。

Data Fusion Services 做什麼

Data Fusion Services 連結源系統，將欄位映射到孿生實體，統一單位和時間戳，準備計算指標，並讓這些上下文進入 Twin Engine、Inspector、AI Agent、看板和分析流程。

工業 AI Agent 與營運數位孿生的資料準備指南

資料準備先於 AI 規模化

工業 AI 專案常見的問題，是模型能讀文件，卻無法穩定識別決策背後的資產、位置、訊號、工單或審批規則。在真實營運中，資料基礎和模型能力同樣重要。

資料準備的核心，是為 AI Agent 和數位孿生建立可用的營運上下文：源系統、資產身份、空間結構、即時訊號、告警歷史、工單、巡檢證據、SOP、文件、權限和結果記錄。

Data Fusion Services 是 FactVerse 產品體系中準備這層基礎的能力。它連結源系統，將欄位映射到孿生實體，統一資料格式，計算指標，並讓這些上下文可用於 FactVerse Twin Engine、FactVerse AI Agent、Inspector、看板和分析流程。

從營運工作流開始

第一個問題應該是營運問題：要改善哪一個決策或任務。

可行起點包括關鍵設備預測性維護、設施巡檢路線、資料中心資產管理、熱網營運、半導體廠務系統、倉儲物流設備檢查和數位化 SOP 執行。每個工作流都會決定哪些資料必須先接入，哪些資料可以後續再接。

工作流	最先需要的資料
預測性維護	資產層級、感測器趨勢、告警、維護歷史、巡檢結果、工單結果
設施巡檢	空間層級、資產清單、巡檢點、檢查表、照片、問題分類、關閉記錄
資料中心營運	機房、機櫃、設施設備、計量表、告警、能耗讀數、維護記錄、資產責任人
HeatOps	熱源、換熱站、計量表、溫度、壓力、流量、天氣、調度日誌、現場任務
半導體設施營運	公輔設備、Sub-fab 系統、告警、運行邊界、工單、操作員備註
操作指導	SOP、任務步驟、設備引用、安全說明、訓練記錄、審批要求

從工作流出發，可以讓資料模型始終服務營運價值。

建立源系統清單

工業現場的資料通常分散在多個系統中。源系統清單需要記錄系統範圍、職責、存取方式、更新頻率和審批責任。

常見來源包括 SCADA、BMS、EMS、PLC、歷史資料庫、IoT 平台、MES、ERP、CMMS、EAM、GIS、BIM、計量表、電子表格、圖紙、手冊、SOP 倉庫、巡檢工具、訓練系統和文件庫。

每個來源都應記錄：

負責人和業務用途
連接方式和存取邊界
可用欄位、點位、文件和記錄
更新頻率、延遲和歷史保留時間
單位、時間戳、命名和品質問題
安全、隱私和審批要求

這張清單就是資料整合交付地圖。

建立資產與空間身份

AI Agent 工作流需要穩定引用。泵、空調箱、UPS、換熱器、閥門、塔吊、車輛、房間、產線或換熱站，都應該擁有可以跨系統識別的身份。

FactVerse 和 Twin Engine 用這層身份連接空間、設備、系統、關係、文件、訊號和工單。Data Fusion Services 將源欄位和點位映射到這些實體，讓每個訊號都掛接到孿生中的正確物件。

好的身份設計應覆蓋站點、建築、樓層、分區、房間、產線、路線和服務區域，也應覆蓋資產類別、資產 ID、顯示名稱、型號、位置、責任人、上下游依賴、源系統別名、文件連結、SOP 連結、巡檢點和工單引用。

這層身份把原始資料轉化為營運上下文。

準備時間序列與事件資料

連續營運依賴乾淨的訊號。溫度、振動、電流、壓力、流量、能耗、閥門狀態、告警狀態和設備狀態，需要穩定的單位、時間戳、採樣規則和品質標記。

Data Fusion Services 可以協助統一單位、對齊時間戳、處理缺失值、計算衍生指標並標記品質問題。目標是讓即時和歷史訊號足夠可靠，可以支撐看板、AI 審查、維護分析和機器學習資料集。

連接工單記錄與 SOP 上下文

AI 建議要進入執行，就需要工單記錄、巡檢結果、問題分類、驗收說明、照片、SOP、手冊、訓練記錄和審批路徑。

Inspector、Checklist 以及已連結的 CMMS 或 EAM 系統提供現場閉環。它們記錄誰審查了發現、採取了什麼動作、採集了什麼證據，以及狀態是否改善。

SOP 和文件上下文應該連接到資產和工作流。AI Agent 才能檢索正確流程、總結相關歷史、準備任務建議，並把人工審查保留在審批路徑中。

讓資料可用於機器學習

機器學習需要完整營運語境，原始感測器歷史只是其中一部分。真正有價值的資料集包括訊號、資產上下文、運行狀態、人工判斷、採取的動作和結果。

以預測性維護為例，模型需要知道訊號來自哪個資產、現場是否處於正常運行狀態、出現了哪些告警、後續產生了哪些工單、技術人員發現了什麼，以及動作後狀態是否改善。這些記錄可以支援模型訓練、重新訓練、效果評估和建議品質調校。

治理與上線控制

資料準備也依賴治理。每個資料來源需要負責人，每個映射實體需要維護者，每個 AI 工作流需要存取、審批、變更管理和證據保留規則。

工業部署中，治理應覆蓋資料血緣、網路安全邊界、角色權限、模型審查、現場驗收標準、變更歷史、本地化和回退方案。這些控制能協助團隊在試點之後繼續擴展，同時保持對資料基礎的信任。

DataMesh 上線模式

選擇工作流 - 選擇一個責任清晰、結果可衡量的營運閉環。
盤點源系統 - 列出系統、點位、記錄、文件、負責人、存取方式和資料品質風險。
建立身份模型 - 在 FactVerse 中定義空間、資產、系統、關係、別名和責任人。
映射並統一資料 - 使用 Data Fusion Services 連接來源，將欄位綁定到孿生實體，統一單位、對齊時間戳並計算指標。
接入執行上下文 - 連接 Inspector、Checklist、CMMS 或 EAM 工作流、SOP、證據欄位和審批規則。
準備 AI 審查 - 將可信上下文交給 FactVerse AI Agent，用於證據摘要、異常審查、建議草擬和人工批准。
捕捉結果 - 使用現場記錄和動作後讀數，持續改進資料品質、模型評估和擴展決策。

準備度檢查清單

工作流是否有負責人和可衡量的營運結果
源系統、文件、點位和記錄是否已按負責人完成盤點
資產和空間是否能在不同系統中保持一致映射
單位、時間戳、採樣頻率和資料品質問題是否已記錄
工單、巡檢、SOP、照片和驗收記錄是否已連接
AI Agent 是否能用可追蹤證據解釋建議
人工審查決策和被否決建議是否可以保留
結果記錄是否能支援模型訓練、重新訓練和評估
網路安全、存取控制、資料血緣和變更管理是否已定義

公開參考

Data Fusion Services 產品頁介紹了 FactVerse 產品體系中的資料整合層。

FactVerse AI Agent 營運閉環指南介紹 AI Agent 建議進入人工審查和現場執行的閉環方式。

Yokogawa 與 DataMesh 預測性維護參考、NIO 智慧工廠參考和 JTC 合作展示了工業資料、數位孿生上下文和營運工作流的公開案例。