MDM 故障事件融合
故障事件融合用於審閱多個來源系統記錄是否描述同一個真實事件。當系統用不同描述、時間戳、分類或 ID 上報相似故障時,這個流程可以減少漏合和重複計數。
本頁描述治理模式,具體打分設定取決於實施和來源系統。
適用場景
- 多個系統上報同一故障或事件。
- 自然鍵無法識別描述或時間略有差異的重複事件。
- 報表重複統計事件。
- 維護、巡檢或可靠性分析需要審閱後的事件身分。
- AI Agent 回答需要引用多個來源系統的證據。
工作流
候選信號
| 信號 | 作用 |
|---|---|
| 已解析實體 ID | 確認記錄指向同一物件。 |
| 時間窗口 | 找到足夠接近的記錄。 |
| 描述相似度 | 識別同一狀態的不同表述。 |
| 分類或嚴重度 | 輔助比較來源系統分類。 |
| 工單或巡檢關聯 | 提供營運證據。 |
確認事件分組前應綜合多個信號。不同資產上的相似描述應按獨立事件處理。
事件分組狀態
用清晰狀態區分原始事件和已審閱事件分組,避免下游誤讀。
| 狀態 | 含義 | 下游使用方式 |
|---|---|---|
| Raw | 來源事件尚未比較。 | 用於來源系統稽核和匯入排錯。 |
| Candidate | Resolver 找到可能重複的分組。 | 僅用於 steward review。 |
| Confirmed group | Steward 確認多筆記錄描述同一事件。 | 用於可靠性分析、事件計數、AI Agent 證據和報表。 |
| Rejected pair | Steward 拒絕候選關係。 | 用於避免同一誤報再次出現。 |
| Split required | 候選分組中包含多個真實事件。 | 發布 reviewed output 前需要拆分。 |
審閱步驟
- 檢查資產或設備身分。
- 比較來源時間戳。
- 比較故障描述、分類和嚴重度。
- 有條件時檢查工單或巡檢證據。
- 判斷是否描述同一事件。
- 拒絕僅表面相似的候選。
審閱時同時檢查事件證據和營運跟進記錄。故障記錄和工單可能使用不同文字描述同一事件;相同告警文字也可能因為資產或運行窗口不同而代表不同事件。
Reviewed output 欄位
審閱後的事件資料集應暴露足夠上下文,便於下游團隊使用:
| 欄位 | 用途 |
|---|---|
| Reviewed event ID | 確認事件分組的穩定標識。 |
| Master entity ID | 將事件連接到受治理的資產或設備身分。 |
| Source event IDs | 保留回溯到原始來源系統記錄的能力。 |
| Primary timestamp | 定義報表使用的事件時間。 |
| Time window | 說明分組包含的來源記錄時間範圍。 |
| Review status | 區分 raw、candidate、confirmed、rejected 和 split-required。 |
| Decision note | 解釋影響可靠性報表或 AI Agent 回答的人工決策。 |
發布 reviewed IDs 時應同時保留 raw source IDs,方便稽核人員把回答或報表追溯到原始系統記錄。
輸出用途
確認後的事件分組可用於:
- 可靠性分析;
- 預測性維護證據;
- 事故或異常複盤;
- 巡檢與工單跟進;
- BI 報表;
- AI Agent 證據解釋。
實施場景
設施或製造環境中的典型設定如下:
- DFS Lite 匯入告警、維修請求、巡檢發現和工單記錄。
- MDM 先解析資產或設備身分,再開始事件分組。
- Resolver 基於 entity ID、時間窗口、文字相似度、分類和工單證據提出候選事件分組。
- Steward 在佇列中確認或拒絕分組。
- DFS Pro 發布包含 raw source IDs 和 reviewed event IDs 的審閱後事件資料集。
- Inspector、可靠性報表或 AI Agent 工作流使用 reviewed event identity,減少重複事件計數,並引用來源系統證據。
當來源系統已經具備較一致的資產身分、事件時間和營運分類時,該場景效果最好。欄位較弱時,應先改善映射,再把 resolver 擴展到更多來源系統。
檢查清單
- 在信任事件分組前,資產或設備身分已經解析。
- 時間窗口符合業務場景。
- 相似度作為審閱信號使用。
- 被拒絕候選已記錄。
- 下游報表說明使用 raw events 還是 reviewed event groups。
- Reviewed event output 包含 raw source IDs,便於稽核。
- Confirmed groups 已抽樣核對工單或巡檢證據。
- Split-required groups 在進入生產報表前已處理。
常見問題
| 現象 | 可能原因 | 處理 |
|---|---|---|
| 重複事件仍然存在 | 時間窗口過窄或資產身分未解析。 | 審閱 entity aliases 和 scoring configuration。 |
| 不同事件被合併 | 時間窗口過寬或描述匹配過鬆。 | 收緊規則並拒絕錯誤分組。 |
| 審閱佇列過大 | 來源資料品質或 match keys 較弱。 | 改善來源映射並增加更強身分信號。 |
| AI 回答引用證據混亂 | Raw events 和 reviewed event sets 混用。 | 明確交付 reviewed dataset 或 grouping status。 |
下一步
繼續閱讀 Industry Recipes。