資料準備先於 AI 規模化
工業 AI 專案常見的問題,是模型能讀文件,卻無法穩定識別決策背後的資產、位置、訊號、工單或審批規則。在真實營運中,資料基礎和模型能力同樣重要。
資料準備的核心,是為 AI Agent 和數位孿生建立可用的營運上下文:源系統、資產身份、空間結構、即時訊號、告警歷史、工單、巡檢證據、SOP、文件、權限和結果記錄。
Data Fusion Services 是 FactVerse 產品體系中準備這層基礎的能力。它連結源系統,將欄位映射到孿生實體,統一資料格式,計算指標,並讓這些上下文可用於 FactVerse Twin Engine、FactVerse AI Agent、Inspector、看板和分析流程。
從營運工作流開始
第一個問題應該是營運問題:要改善哪一個決策或任務。
可行起點包括關鍵設備預測性維護、設施巡檢路線、資料中心資產管理、熱網營運、半導體廠務系統、倉儲物流設備檢查和數位化 SOP 執行。每個工作流都會決定哪些資料必須先接入,哪些資料可以後續再接。
| 工作流 | 最先需要的資料 |
|---|---|
| 預測性維護 | 資產層級、感測器趨勢、告警、維護歷史、巡檢結果、工單結果 |
| 設施巡檢 | 空間層級、資產清單、巡檢點、檢查表、照片、問題分類、關閉記錄 |
| 資料中心營運 | 機房、機櫃、設施設備、計量表、告警、能耗讀數、維護記錄、資產責任人 |
| HeatOps | 熱源、換熱站、計量表、溫度、壓力、流量、天氣、調度日誌、現場任務 |
| 半導體設施營運 | 公輔設備、Sub-fab 系統、告警、運行邊界、工單、操作員備註 |
| 操作指導 | SOP、任務步驟、設備引用、安全說明、訓練記錄、審批要求 |
從工作流出發,可以讓資料模型始終服務營運價值。
建立源系統清單
工業現場的資料通常分散在多個系統中。源系統清單需要說明有哪些系統、每個系統負責什麼、如何存取、更新頻率如何,以及由誰批准使用。
常見來源包括 SCADA、BMS、EMS、PLC、歷史資料庫、IoT 平台、MES、ERP、CMMS、EAM、GIS、BIM、計量表、電子表格、圖紙、手冊、SOP 倉庫、巡檢工具、訓練系統和文件庫。
每個來源都應記錄:
- 負責人和業務用途
- 連接方式和存取邊界
- 可用欄位、點位、文件和記錄
- 更新頻率、延遲和歷史保留時間
- 單位、時間戳、命名和品質問題
- 安全、隱私和審批要求
這張清單就是資料整合交付地圖。
建立資產與空間身份
AI Agent 工作流需要穩定引用。泵、空調箱、UPS、換熱器、閥門、塔吊、車輛、房間、產線或換熱站,都應該擁有可以跨系統識別的身份。
FactVerse 和 Twin Engine 用這層身份連接空間、設備、系統、關係、文件、訊號和工單。Data Fusion Services 將源欄位和點位映射到這些實體,讓每個訊號都掛接到孿生中的正確物件。
好的身份設計應覆蓋站點、建築、樓層、分區、房間、產線、路線和服務區域,也應覆蓋資產類別、資產 ID、顯示名稱、型號、位置、責任人、上下游依賴、源系統別名、文件連結、SOP 連結、巡檢點和工單引用。
這層身份把原始資料轉化為營運上下文。
準備時間序列與事件資料
連續營運依賴乾淨的訊號。溫度、振動、電流、壓力、流量、能耗、閥門狀態、告警狀態和設備狀態,需要穩定的單位、時間戳、採樣規則和品質標記。
Data Fusion Services 可以協助統一單位、對齊時間戳、處理缺失值、計算衍生指標並標記品質問題。目標是讓即時和歷史訊號足夠可靠,可以支撐看板、AI 審查、維護分析和機器學習資料集。
連接工單記錄與 SOP 上下文
AI 建議要進入執行,就需要工單記錄、巡檢結果、問題分類、驗收說明、照片、SOP、手冊、訓練記錄和審批路徑。
Inspector、Checklist 以及已連結的 CMMS 或 EAM 系統提供現場閉環。它們記錄誰審查了發現、採取了什麼動作、採集了什麼證據,以及狀態是否改善。
SOP 和文件上下文應該連接到資產和工作流。AI Agent 才能檢索正確流程、總結相關歷史、準備任務建議,並把人工審查保留在審批路徑中。
讓資料可用於機器學習
機器學習需要完整營運語境,原始感測器歷史只是其中一部分。真正有價值的資料集包括訊號、資產上下文、運行狀態、人工判斷、採取的動作和結果。
以預測性維護為例,模型需要知道訊號來自哪個資產、現場是否處於正常運行狀態、出現了哪些告警、後續產生了哪些工單、技術人員發現了什麼,以及動作後狀態是否改善。這些記錄可以支援模型訓練、重新訓練、效果評估和建議品質調校。
治理與上線控制
資料準備也依賴治理。每個資料來源需要負責人,每個映射實體需要維護者,每個 AI 工作流需要存取、審批、變更管理和證據保留規則。
工業部署中,治理應覆蓋資料血緣、網路安全邊界、角色權限、模型審查、現場驗收標準、變更歷史、本地化和回退方案。這些控制能協助團隊在試點之後繼續擴展,同時保持對資料基礎的信任。
DataMesh 上線模式
- 選擇工作流 - 選擇一個責任清晰、結果可衡量的營運閉環。
- 盤點源系統 - 列出系統、點位、記錄、文件、負責人、存取方式和資料品質風險。
- 建立身份模型 - 在 FactVerse 中定義空間、資產、系統、關係、別名和責任人。
- 映射並統一資料 - 使用 Data Fusion Services 連接來源,將欄位綁定到孿生實體,統一單位、對齊時間戳並計算指標。
- 接入執行上下文 - 連接 Inspector、Checklist、CMMS 或 EAM 工作流、SOP、證據欄位和審批規則。
- 準備 AI 審查 - 將可信上下文交給 FactVerse AI Agent,用於證據摘要、異常審查、建議草擬和人工批准。
- 捕捉結果 - 使用現場記錄和動作後讀數,持續改進資料品質、模型評估和擴展決策。
準備度檢查清單
- 工作流是否有負責人和可衡量的營運結果
- 源系統、文件、點位和記錄是否已按負責人完成盤點
- 資產和空間是否能在不同系統中保持一致映射
- 單位、時間戳、採樣頻率和資料品質問題是否已記錄
- 工單、巡檢、SOP、照片和驗收記錄是否已連接
- AI Agent 是否能用可追蹤證據解釋建議
- 人工審查決策和被否決建議是否可以保留
- 結果記錄是否能支援模型訓練、重新訓練和評估
- 網路安全、存取控制、資料血緣和變更管理是否已定義
公開參考
Data Fusion Services 產品頁介紹了 FactVerse 產品體系中的資料整合層。
FactVerse AI Agent 營運閉環指南說明了 AI Agent 建議如何進入人工審查的現場執行。
Yokogawa 與 DataMesh 預測性維護參考、NIO 智慧工廠參考和 JTC 合作展示了工業資料、數位孿生上下文和營運工作流的公開案例。
