MDM 故障事件融合
故障事件融合用于审阅多个源系统记录是否描述同一个真实事件。当系统用不同描述、时间戳、分类或 ID 上报相似故障时,这个流程可以减少漏合和重复计数。
本页描述治理模式,具体打分配置取决于实施和源系统。
当前审阅接口
故障事件审阅接口与主数据实体审阅接口分开:
| 动作 | 接口族 |
|---|---|
| 查询候选 | /api/v1/dfslite/fault-fusion/candidates |
| 批准重复分组 | /api/v1/dfslite/fault-fusion/candidates/{id}/approve |
| 拒绝重复分组 | /api/v1/dfslite/fault-fusion/candidates/{id}/reject |
读取使用 DFS 读权限;批准和拒绝会写入审阅决策。规划 API 级集成时,继续参考 MDM API 参考。
候选生成边界
故障事件融合可能产生大量重复事件候选。生产运行中,融合方法应通过受治理的审阅界面创建候选,并返回 persisted 和 skipped candidate 等运行数量。操作人员随后通过 UI 或 API 审阅候选。
候选是人工决策的证据。下游报表、可靠性分析、AI Agent 证据检索和维护工作流在需要事件身份时,应使用已确认分组或审阅后的事件数据集。
| 运行输出 | 含义 | 查看位置 |
|---|---|---|
| Persisted candidate count | 已创建进入审阅的候选分组数量。 | 故障融合候选队列。 |
| Skipped candidate count | 未写入的候选数量,通常因为为空、无效、重复或超出范围。 | 运行历史和任务日志。 |
| Approved group | 人工确认多条记录描述同一事件。 | 审阅后事件输出和下游数据集。 |
| Rejected group or pair | 人工拒绝重复关系。 | 用于抑制重复误报的拒绝历史。 |
已发布规则集视图
DFS Pro 中的故障融合入口展示当前部署环境已发布的融合规则集。通过该视图可以查看融合服务实际使用的字段提取、匹配规则、幸存规则、置信度权重和 AI 辅助设置。某个规则块为空,表示对应流程尚未配置。
这样审阅人员看到的规则与实际融合运行保持一致。培训和交接材料也应以运行任务使用的已发布规则集为准。
适用场景
- 多个系统上报同一故障或事件。
- 自然键无法识别描述或时间略有差异的重复事件。
- 报表重复统计事件。
- 维护、巡检或可靠性分析需要审阅后的事件身份。
- AI Agent 回答需要引用多个源系统的证据。
工作流
候选信号
| 信号 | 作用 |
|---|---|
| 已解析实体 ID | 确认记录指向同一对象。 |
| 时间窗口 | 找到足够接近的记录。 |
| 描述相似度 | 识别同一状态的不同表述。 |
| 分类或严重度 | 辅助比较源系统分类。 |
| 工单或巡检关联 | 提供运营证据。 |
确认事件分组前应综合多个信号。不同资产上的相似描述应按独立事件处理。
冲突比较范围
冲突比较应聚焦会改变事件业务含义的字段,例如受治理身份、时间窗口、状态、严重度、分类、资产类型、批次上下文、设备状态、维护对象等。自由文本消息和源系统专用代码通常适合作为审阅证据;当多个系统用各自口径描述同一事件时,把这些字段直接作为冲突字段容易放大噪声。
任务进入常规运行前,应抽样检查冲突计数字段。证据丰富的字段可以继续保留在源证据和审阅视图中,冲突标记则用于提示真正需要人工关注的差异。
事件分组状态
用清晰状态区分原始事件和已审阅事件分组,避免下游误读。
| 状态 | 含义 | 下游使用方式 |
|---|---|---|
| 原始事件 | 源事件尚未比较。 | 用于源系统审计和导入排错。 |
| 候选分组 | 解析器找到可能重复的分组。 | 仅用于人工审阅。 |
| 已确认分组 | 人工确认多条记录描述同一事件。 | 用于可靠性分析、事件计数、AI Agent 证据和报表。 |
| 已拒绝关系 | 人工拒绝候选关系。 | 用于避免同一误报再次出现。 |
| 需要拆分 | 候选分组中包含多个真实事件。 | 发布审阅后输出前需要拆分。 |
审阅步骤
- 检查资产或设备身份。
- 比较源时间戳。
- 比较故障描述、分类和严重度。
- 有条件时检查工单或巡检证据。
- 判断是否描述同一事件。
- 拒绝仅表面相似的候选。
审阅时同时检查事件证据和运营跟进记录。故障记录和工单可能使用不同文本描述同一事件;相同告警文本也可能因为资产或运行窗口不同而代表不同事件。
审阅后输出字段
审阅后的事件数据集应暴露足够上下文,便于下游团队使用:
| 字段 | 用途 |
|---|---|
| 审阅后事件 ID | 确认事件分组的稳定标识。 |
| 主数据实体 ID | 将事件连接到受治理的资产或设备身份。 |
| 源事件 ID | 保留回溯到原始源系统记录的能力。 |
| 主时间戳 | 定义报表使用的事件时间。 |
| 时间窗口 | 说明分组包含的源记录时间范围。 |
| 审阅状态 | 区分原始、候选、已确认、已拒绝和需要拆分。 |
| 决策说明 | 解释影响可靠性报表或 AI Agent 回答的人工决策。 |
发布审阅后事件 ID 时应同时保留原始源 ID,方便审计人员把回答或报表追溯到原始系统记录。
输出用途
确认后的事件分组可用于:
- 可靠性分析;
- 预测性维护证据;
- 事故或异常复盘;
- 巡检与工单跟进;
- BI 报表;
- AI Agent 证据解释。
实施场景
设施或制造环境中的典型设置如下:
- DFS Lite 导入告警、维修请求、巡检发现和工单记录。
- MDM 先解析资产或设备身份,再开始事件分组。
- 解析器基于实体 ID、时间窗口、文本相似度、分类和工单证据提出候选事件分组。
- 数据责任人在队列中确认或拒绝分组。
- DFS Pro 发布包含原始源 ID 和审阅后事件 ID 的事件数据集。
- Inspector、可靠性报表或 AI Agent 工作流使用审阅后的事件身份,减少重复事件计数,并引用源系统证据。
当源系统已经具备较一致的资产身份、事件时间和运营分类时,该场景效果最好。字段较弱时,应先改善映射,再把解析器扩展到更多源系统。
检查清单
- 在信任事件分组前,资产或设备身份已经解析。
- 时间窗口符合业务场景。
- 相似度作为审阅信号使用。
- 被拒绝候选已记录。
- 下游报表说明使用原始事件还是已审阅事件分组。
- 审阅后事件输出包含原始源 ID,便于审计。
- 已确认分组已抽样核对工单或巡检证据。
- 需要拆分的分组在进入生产报表前已处理。
常见问题
| 现象 | 可能原因 | 处理 |
|---|---|---|
| 重复事件仍然存在 | 时间窗口过窄或资产身份未解析。 | 审阅实体别名和打分配置。 |
| 不同事件被合并 | 时间窗口过宽或描述匹配过松。 | 收紧规则并拒绝错误分组。 |
| 审阅队列过大 | 源数据质量或匹配键较弱。 | 改善源映射并增加更强身份信号。 |
| AI 回答引用证据混乱 | 原始事件和已审阅事件集混用。 | 明确交付审阅后数据集或分组状态。 |
下一步
继续阅读 行业场景配方。