返回指南

Data Fusion、資料治理與 AI 就緒營運

面向營運數位孿生與 AI Agent 的工業資料治理

介紹如何圍繞營運數位孿生、AI Agent、機器學習資料集和 Data Fusion Services 建立工業資料治理:責任、品質、血緣、權限、變更控制與現場證據。

面向營運數位孿生與 AI Agent 的工業資料治理

資料進入決策時,治理就開始了

當一條信號、告警、儀表讀數、工單、巡檢記錄、文件或計算指標開始影響營運決策時,工業資料治理就已經開始。

對營運數位孿生來說,資料連接只是第一步。團隊還需要知道資料來自哪裡,描述哪台資產或哪個空間,使用什麼單位和時間戳規則,誰負責映射,數值是否可靠,哪些 AI Agent 或看板正在使用它,以及上一次發布後發生了什麼變化。

Data Fusion Services 在 FactVerse 產品體系中支撐這套營運紀律。它連接來源系統,將資料映射到孿生實體,清理並統一欄位,計算指標,準備資料集市,並把即時上下文綁定到數位孿生中。圍繞這些步驟建立治理,才能讓接入的資料真正服務 FactVerse AI AgentFactVerse Twin EngineInspector、看板、模擬和機器學習流程。

DFS 應該幫助治理什麼

資料治理需要沿著資料從來源系統到每個營運使用者的路徑展開。

治理範圍實際問題為什麼重要
來源系統責任哪個系統擁有這個值,誰批准使用避免資料被質疑時責任不清
存取邊界哪個網路、租戶、站點或角色可以讀取保護敏感營運資料和客戶專屬資訊
實體綁定它描述哪台資產、哪個空間、系統、路線或工作流程把原始標籤變成營運上下文
單位與時間戳使用什麼單位、時區、時鐘、採樣率和彙總規則讓趨勢、告警和比較有意義
品質狀態數值是否缺失、過期、插值、越界或來自更換後的感測器幫助 AI 和操作員判斷證據強弱
計算邏輯派生 KPI 或指標由什麼公式產生讓分析、能耗和維護指標可復核
資料血緣哪個連接器、映射、轉換和發布版本產生了這個值支撐排障和稽核復核
使用者清單哪些看板、AI 流程、報告或工單使用這條資料在修改點位或公式前評估影響

這種治理不代表每個點位都要走複雜委員會。關鍵是讓會影響決策的資料具備清晰責任和可重複規則。

按營運身分治理

工業系統經常用不同方式描述同一個對象。一台泵在 SCADA 中可能有一個名稱,在歷史資料庫中有另一種標籤,在 CMMS 中有另一個資產 ID,在 BIM 中又有另一個標註,現場技師還可能使用習慣叫法。資料治理需要用穩定的營運身分把這些別名連接起來。

FactVerse 為空間、資產、系統、關係、文件、資料綁定和工作流程提供共享上下文。Data Fusion Services 將來源欄位和點位映射到這個上下文,讓每個值都綁定到正確的資產、位置和營運閉環。

良好的身分治理應覆蓋園區、建築、樓層、區域、房間、產線、路線、服務區域、資產類別、資產 ID、顯示名稱、型號、負責人、生命週期狀態、上下游系統關係、來源系統別名、文件、SOP、巡檢點、工單引用和權限邊界。

即時與歷史資料的品質規則

時序值和事件會持續變化。資料管線需要操作團隊和資料團隊都能理解的品質規則:缺失值處理、資料過期閾值、單位換算、時間戳和時區對齊、採樣與彙總、異常值和長時間不變值識別、感測器更換記錄、告警級別與復位邏輯、計算指標公式與復核負責人。

Data Fusion Services 可以幫助統一單位、對齊時間戳、識別品質問題並計算派生指標。治理層應記錄使用了哪條規則,以及誰負責復核異常。

對 AI Agent 工作流程,品質狀態本身就是證據的一部分。基於新鮮感測器資料、近期工單歷史和已批准計算結果生成的建議,應與基於過期數值或臨時手工上傳資料的建議區分看待。

資料血緣與變更控制

工業資料經常悄悄變化。BMS 點位可能改名,儀表可能更換,歷史資料庫標籤可能遷移到新閘道,CMMS 欄位可能因流程調整改變含義,KPI 公式也可能更新分母。

數位孿生畫面可能仍然正確,但底層資料已經指向錯誤來源。治理要讓這些變化在影響 AI 復核、看板、工單或外部報告之前變得可見。

實用的變更記錄應包括受影響的來源系統和連接器、改動的點位或公式、受影響的資產和工作流程、下游使用者、復核人、批准狀態、生效日期、回退方式,以及用於驗證變更的證據。

權限、證據與審批

營運資料經常包含敏感資訊:受限房間、客戶專屬布局、生產狀態、設備健康、能耗曲線、維護發現和服務記錄。資料從來源系統進入數位孿生時,治理應保留存取邊界。

有用的控制包括空間、資產、文件、看板和 AI 流程的角色權限,站點級和客戶級資料邊界,AI 輔助建議的審批規則,巡檢、工單和復核決策的證據保留,映射變更和資料匯出的稽核日誌,以及臨時上傳與手工修正值的處理規則。

Inspector 和已連接的工作系統可以記錄誰復核了發現、採取了什麼動作、採集了什麼證據、結果是否改善。這些記錄會成為下一輪 AI 復核或機器學習循環中的治理資料。

面向機器學習的資料治理

機器學習需要的不只是乾淨的感測器歷史。它需要能解釋物理現場發生了什麼的資料。

以預測性維護為例,資料集應包含輸入信號、資產身分、運行狀態、告警上下文、技師復核、工單動作、完成證據和行動後的讀數。能耗分析需要儀表、空間、設備組、運行計畫、天氣、公式和改善記錄。模擬需要場景假設、資產版本、過程狀態和已批准的資料範圍。

資料治理應保留特徵定義、來源欄位、訓練前的品質過濾規則、由工單或巡檢產生的標籤、模型版本、建議版本、人工復核決策、被拒絕的建議、行動後結果、資料集刷新計畫和審批負責人。

DataMesh 推進方式

  1. 選擇一個決策閉環 - 從預測性維護、設施巡檢、資料中心資產復核、能耗證據或數位 SOP 執行等工作流程開始。
  2. 明確資料負責人 - 為來源系統、資產身分、資料映射、品質規則、計算邏輯、權限和下游流程指定負責人。
  3. 映射營運身分 - 使用 FactVerse 對齊空間、資產、系統、關係、文件、工作流程和別名。
  4. 連接並治理資料 - 使用 Data Fusion Services 連接來源系統,將欄位綁定到孿生實體,統一單位,對齊時間戳,計算指標並標記品質狀態。
  5. 登記下游使用者 - 記錄哪些看板、AI Agent 例程、Inspector 表單、報告和機器學習資料集使用這些資料。
  6. 發布前復核變更 - 在影響生產工作流程之前驗證點位變更、公式更新、連接器調整和權限變化。
  7. 採集結果 - 透過 Inspector、Checklist、CMMS、EAM 和客戶系統採集現場證據、復核決策和行動後結果。
  8. 改進規則 - 用異常、映射失敗、過期資料、被拒絕的 AI 建議和現場回饋改進治理模型。

治理檢查清單

  • 每個被治理的資料源是否有業務負責人和技術負責人
  • 資產、空間、系統和工作流程身分是否跨系統一致
  • 來源系統別名和點位命名規則是否記錄清楚
  • 單位、時間戳、採樣率和品質規則是否可見
  • 計算指標是否綁定公式、負責人和復核日期
  • 從來源連接器到孿生對象再到下游使用者的資料血緣是否保留
  • 看板、AI Agent 工作流程、報告和資料集是否登記為使用者
  • 敏感空間、客戶記錄和受限文件是否受角色權限保護
  • 現場證據和工單結果是否能用於復核和機器學習
  • 點位改名、感測器更換、公式變化和綁定失效是否有變更路徑

公開參考

Data Fusion Services 產品頁介紹了 FactVerse 產品體系中的資料整合層。

資料準備指南說明如何為 AI Agent 和營運數位孿生工作流程準備第一層資料基礎。

營運數位孿生模型治理指南說明上線後如何保持模型、資料綁定和現場變化同步。

工業知識圖譜指南說明語義關係如何連接資產、空間、系統、信號、文件和 AI Agent 推理。