跳至主要内容

MDM 實體解析任務

實體解析任務是面向實施人員的 DFS 融合任務,用於準備 MDM 輸出。它可以建立或更新 golden records,確認 deterministic aliases,並把不確定匹配送入 steward queue。

業務 steward 通常只需要使用 Master Entities 和 Steward Queue。本頁面用於實施設定、執行驗證和交接。

能力邊界

  • DFS 和後端服務負責 MDM 持久化、tenant scope、權限和稽核。
  • 解析器根據傳入上下文計算實體、別名和模糊候選。
  • 模糊匹配進入 steward queue,不靜默接受。
  • 來源系統仍然是業務記錄的系統來源。

Resolver 是受治理的資料準備流程,steward 決策仍然是身分流程的一部分。

準備工作

  • 來源資料集已經可用並有 steward。
  • 目標 entity type 已存在。
  • 所需 reference data 已準備好。
  • method configuration 已審閱。
  • 來源欄位包含穩定身分信號。
  • 下游 owner 知道該任務是測試、試點還是生產用途。

輸入

輸入用途
Source datasets可能描述同一物件的來源記錄。
Entity type目標類型,例如 device、asset、part、station。
Match keys高信心 deterministic 匹配欄位。
Fuzzy fields名稱、描述、別名或屬性,用於提出候選。
Survivorship rule來源系統衝突時如何選擇 canonical 屬性。
Existing MDM context目前實體、active aliases、rejected pairs。

設定檢查清單

在 resolver 面向完整資料集執行前,應和資料 owner 一起審閱設定:

設定項需要回答的問題
Entity type該類型是否代表具有穩定生命週期的真實營運物件?
Source priority名稱、位置、類別、狀態衝突時,哪個來源優先?
Deterministic keys哪些欄位可以直接確認匹配,無需進入 steward review?
Fuzzy fields哪些欄位只適合提出候選,需要人工審閱?
Validity period如何處理設備替換、退役資產和重複使用 source ID?
Rejected-pair memory是否納入既有 steward 拒絕記錄,避免重複誤報?
Run mode本次執行是 preview、pilot,還是允許寫入 approved MDM output?

建議從小範圍切片開始,包含乾淨記錄、已知重複、退役物件和少量困難樣本。只用乾淨記錄測試會高估上線準備度。

輸出

  • 建立或更新的 entities;
  • 被確認的 aliases;
  • 進入 steward queue 的 fuzzy candidates;
  • run metrics 與錯誤;
  • 支撐決策的 lineage。

當任務返回 MDM output 時,不應把普通 dataset rows 作為主要輸出。MDM output 是受治理的身分結果。

驗證流程

審閱執行結果

每次執行後檢查:

  • 建立或更新的 entity 數量;
  • 被確認的 alias 數量;
  • 進入 steward queue 的 fuzzy candidate 數量;
  • 被跳過或格式異常的記錄;
  • task errors;
  • steward 工作量是否可接受。

候選量過高通常說明 match keys、來源資料品質或 survivorship rules 還需要調整。

指標意義
Deterministic match rate觀察多少記錄可用穩定 key 匹配。
New entity rate發現意外的實體膨脹。
Fuzzy candidate rate預估生產 steward 工作量。
Rejected-pair repeat rate判斷既有拒絕決策是否被複用。
Missing-key count指向來源映射或資料品質問題。
Downstream row movement觀察身分更新後多少融合記錄、工單或事件發生變化。

每類結果都應抽樣檢查。總體指標健康時,也可能在某個資產類別或來源系統中產生高影響錯誤。

端到端場景

典型實施路徑會把 MDM 連接到 DFS 其他能力:

  1. 使用 DFS Lite 匯入維護、BMS、巡檢或表格中的資產記錄。
  2. 歸一化來源欄位,並映射必需的身分信號。
  3. 針對目標 entity type 執行 MDM resolver task。
  4. 確認 deterministic aliases,並把不確定匹配送入 Steward Queue。
  5. 重新執行 DFS Pro fusion task,把工單、讀數、巡檢和事件關聯到 master entity ID。
  6. 將審閱後的資料集交給 Inspector 工作流、AI Agent 證據檢索、BI 報表或其他營運應用。

交接內容應包含 resolver run ID 或 task name、source slice、entity type、steward decision counts、open exceptions 和 downstream refresh status。

交接清單

  • 任務名稱和用途清楚。
  • 目標 entity type 正確。
  • 輸入資料集和來源欄位已記錄。
  • match keys 和 fuzzy fields 已審閱。
  • steward queue 有 owner。
  • 下游工作流知道輸出是否可用。
  • 已知限制和未解決身分問題已記錄。
  • 執行指標已附到交接記錄。
  • 後續來源資料刷新時的重跑方式已經明確。

下一步

繼續閱讀 Steward Queue