MDM 故障事件融合
故障事件融合用于审阅多个源系统记录是否描述同一个真实事件。当系统用不同描述、时间戳、分类或 ID 上报相似故障时,这个流程可以减少漏合和重复计数。
本页描述治理模式,具体打分配置取决于实施和源系统。
适用场景
- 多个系统上报同一故障或事件。
- 自然键无法识别描述或时间略有差异的重复事件。
- 报表重复统计事件。
- 维护、巡检或可靠性分析需要审阅后的事件身份。
- AI Agent 回答需要引用多个源系统的证据。
工作流
候选信号
| 信号 | 作用 |
|---|---|
| 已解析实体 ID | 确认记录指向同一对象。 |
| 时间窗口 | 找到足够接近的记录。 |
| 描述相似度 | 识别同一状态的不同表述。 |
| 分类或严重度 | 辅助比较源系统分类。 |
| 工单或巡检关联 | 提供运营证据。 |
确认事件分组前应综合多个信号。不同资产上的相似描述应按独立事件处理。
事件分组状态
用清晰状态区分原始事件和已审阅事件分组,避免下游误读。
| 状态 | 含义 | 下游使用方式 |
|---|---|---|
| Raw | 源事件尚未比较。 | 用于源系统审计和导入排错。 |
| Candidate | Resolver 找到可能重复的分组。 | 仅用于 steward review。 |
| Confirmed group | Steward 确认多条记录描述同一事件。 | 用于可靠性分析、事件计数、AI Agent 证据和报表。 |
| Rejected pair | Steward 拒绝候选关系。 | 用于避免同一误报再次出现。 |
| Split required | 候选分组中包含多个真实事件。 | 发布 reviewed output 前需要拆分。 |
审阅步骤
- 检查资产或设备身份。
- 比较源时间戳。
- 比较故障描述、分类和严重度。
- 有条件时检查工单或巡检证据。
- 判断是否描述同一事件。
- 拒绝仅表面相似的候选。
审阅时同时检查事件证据和运营跟进记录。故障记录和工单可能使用不同文本描述同一事件;相同告警文本也可能因为资产或运行窗口不同而代表不同事件。
Reviewed output 字段
审阅后的事件数据集应暴露足够上下文,便于下游团队使用:
| 字段 | 用途 |
|---|---|
| Reviewed event ID | 确认事件分组的稳定标识。 |
| Master entity ID | 将事件连接到受治理的资产或设备身份。 |
| Source event IDs | 保留回溯到原始源系统记录的能力。 |
| Primary timestamp | 定义报表使用的事件时间。 |
| Time window | 说明分组包含的源记录时间范围。 |
| Review status | 区分 raw、candidate、confirmed、rejected 和 split-required。 |
| Decision note | 解释影响可靠性报表或 AI Agent 回答的人工决策。 |
发布 reviewed IDs 时应同时保留 raw source IDs,方便审计人员把回答或报表追溯到原始系统记录。
输出用途
确认后的事件分组可用于:
- 可靠性分析;
- 预测性维护证据;
- 事故或异常复盘;
- 巡检与工单跟进;
- BI 报表;
- AI Agent 证据解释。
实施场景
设施或制造环境中的典型设置如下:
- DFS Lite 导入告警、维修请求、巡检发现和工单记录。
- MDM 先解析资产或设备身份,再开始事件分组。
- Resolver 基于 entity ID、时间窗口、文本相似度、分类和工单证据提出候选事件分组。
- Steward 在队列中确认或拒绝分组。
- DFS Pro 发布包含 raw source IDs 和 reviewed event IDs 的审阅后事件数据集。
- Inspector、可靠性报表或 AI Agent 工作流使用 reviewed event identity,减少重复事件计数,并引用源系统证据。
当源系统已经具备较一致的资产身份、事件时间和运营分类时,该场景效果最好。字段较弱时,应先改善映射,再把 resolver 扩展到更多源系统。
检查清单
- 在信任事件分组前,资产或设备身份已经解析。
- 时间窗口符合业务场景。
- 相似度作为审阅信号使用。
- 被拒绝候选已记录。
- 下游报表说明使用 raw events 还是 reviewed event groups。
- Reviewed event output 包含 raw source IDs,便于审计。
- Confirmed groups 已抽样核对工单或巡检证据。
- Split-required groups 在进入生产报表前已处理。
常见问题
| 现象 | 可能原因 | 处理 |
|---|---|---|
| 重复事件仍然存在 | 时间窗口过窄或资产身份未解析。 | 审阅 entity aliases 和 scoring configuration。 |
| 不同事件被合并 | 时间窗口过宽或描述匹配过松。 | 收紧规则并拒绝错误分组。 |
| 审阅队列过大 | 源数据质量或 match keys 较弱。 | 改善源映射并增加更强身份信号。 |
| AI 回答引用证据混乱 | Raw events 和 reviewed event sets 混用。 | 明确交付 reviewed dataset 或 grouping status。 |
下一步
继续阅读 Industry Recipes。