MDM 故障事件融合

故障事件融合用于审阅多个源系统记录是否描述同一个真实事件。当系统用不同描述、时间戳、分类或 ID 上报相似故障时，这个流程可以减少漏合和重复计数。

本页描述治理模式，具体打分配置取决于实施和源系统。

当前审阅接口

故障事件审阅接口与主数据实体审阅接口分开：

动作	接口族
查询候选	`/api/v1/dfslite/fault-fusion/candidates`
批准重复分组	`/api/v1/dfslite/fault-fusion/candidates/{id}/approve`
拒绝重复分组	`/api/v1/dfslite/fault-fusion/candidates/{id}/reject`

读取使用 DFS 读权限；批准和拒绝会写入审阅决策。规划 API 级集成时，继续参考 MDM API 参考。

候选生成边界

故障事件融合可能产生大量重复事件候选。生产运行中，融合方法应通过受治理的审阅界面创建候选，并返回 persisted 和 skipped candidate 等运行数量。操作人员随后通过 UI 或 API 审阅候选。

候选是人工决策的证据。下游报表、可靠性分析、AI Agent 证据检索和维护工作流在需要事件身份时，应使用已确认分组或审阅后的事件数据集。

运行输出	含义	查看位置
Persisted candidate count	已创建进入审阅的候选分组数量。	故障融合候选队列。
Skipped candidate count	未写入的候选数量，通常因为为空、无效、重复或超出范围。	运行历史和任务日志。
Approved group	人工确认多条记录描述同一事件。	审阅后事件输出和下游数据集。
Rejected group or pair	人工拒绝重复关系。	用于抑制重复误报的拒绝历史。

已发布规则集视图

DFS Pro 中的故障融合入口展示当前部署环境已发布的融合规则集。通过该视图可以查看融合服务实际使用的字段提取、匹配规则、幸存规则、置信度权重和 AI 辅助设置。某个规则块为空，表示对应流程尚未配置。

这样审阅人员看到的规则与实际融合运行保持一致。培训和交接材料也应以运行任务使用的已发布规则集为准。

适用场景

多个系统上报同一故障或事件。
自然键无法识别描述或时间略有差异的重复事件。
报表重复统计事件。
维护、巡检或可靠性分析需要审阅后的事件身份。
AI Agent 回答需要引用多个源系统的证据。

工作流

候选信号

信号	作用
已解析实体 ID	确认记录指向同一对象。
时间窗口	找到足够接近的记录。
描述相似度	识别同一状态的不同表述。
分类或严重度	辅助比较源系统分类。
工单或巡检关联	提供运营证据。

确认事件分组前应综合多个信号。不同资产上的相似描述应按独立事件处理。

冲突比较范围

冲突比较应聚焦会改变事件业务含义的字段，例如受治理身份、时间窗口、状态、严重度、分类、资产类型、批次上下文、设备状态、维护对象等。自由文本消息和源系统专用代码通常适合作为审阅证据；当多个系统用各自口径描述同一事件时，把这些字段直接作为冲突字段容易放大噪声。

任务进入常规运行前，应抽样检查冲突计数字段。证据丰富的字段可以继续保留在源证据和审阅视图中，冲突标记则用于提示真正需要人工关注的差异。

事件分组状态

用清晰状态区分原始事件和已审阅事件分组，避免下游误读。

状态	含义	下游使用方式
原始事件	源事件尚未比较。	用于源系统审计和导入排错。
候选分组	解析器找到可能重复的分组。	仅用于人工审阅。
已确认分组	人工确认多条记录描述同一事件。	用于可靠性分析、事件计数、AI Agent 证据和报表。
已拒绝关系	人工拒绝候选关系。	用于避免同一误报再次出现。
需要拆分	候选分组中包含多个真实事件。	发布审阅后输出前需要拆分。

审阅步骤

检查资产或设备身份。
比较源时间戳。
比较故障描述、分类和严重度。
有条件时检查工单或巡检证据。
判断是否描述同一事件。
拒绝仅表面相似的候选。

审阅时同时检查事件证据和运营跟进记录。故障记录和工单可能使用不同文本描述同一事件；相同告警文本也可能因为资产或运行窗口不同而代表不同事件。

审阅后输出字段

审阅后的事件数据集应暴露足够上下文，便于下游团队使用：

字段	用途
审阅后事件 ID	确认事件分组的稳定标识。
主数据实体 ID	将事件连接到受治理的资产或设备身份。
源事件 ID	保留回溯到原始源系统记录的能力。
主时间戳	定义报表使用的事件时间。
时间窗口	说明分组包含的源记录时间范围。
审阅状态	区分原始、候选、已确认、已拒绝和需要拆分。
决策说明	解释影响可靠性报表或 AI Agent 回答的人工决策。

发布审阅后事件 ID 时应同时保留原始源 ID，方便审计人员把回答或报表追溯到原始系统记录。

输出用途

确认后的事件分组可用于：

可靠性分析；
预测性维护证据；
事故或异常复盘；
巡检与工单跟进；
BI 报表；
AI Agent 证据解释。

实施场景

设施或制造环境中的典型设置如下：

DFS Lite 导入告警、维修请求、巡检发现和工单记录。
MDM 先解析资产或设备身份，再开始事件分组。
解析器基于实体 ID、时间窗口、文本相似度、分类和工单证据提出候选事件分组。
数据责任人在队列中确认或拒绝分组。
DFS Pro 发布包含原始源 ID 和审阅后事件 ID 的事件数据集。
Inspector、可靠性报表或 AI Agent 工作流使用审阅后的事件身份，减少重复事件计数，并引用源系统证据。

当源系统已经具备较一致的资产身份、事件时间和运营分类时，该场景效果最好。字段较弱时，应先改善映射，再把解析器扩展到更多源系统。

检查清单

在信任事件分组前，资产或设备身份已经解析。
时间窗口符合业务场景。
相似度作为审阅信号使用。
被拒绝候选已记录。
下游报表说明使用原始事件还是已审阅事件分组。
审阅后事件输出包含原始源 ID，便于审计。
已确认分组已抽样核对工单或巡检证据。
需要拆分的分组在进入生产报表前已处理。

常见问题

现象	可能原因	处理
重复事件仍然存在	时间窗口过窄或资产身份未解析。	审阅实体别名和打分配置。
不同事件被合并	时间窗口过宽或描述匹配过松。	收紧规则并拒绝错误分组。
审阅队列过大	源数据质量或匹配键较弱。	改善源映射并增加更强身份信号。
AI 回答引用证据混乱	原始事件和已审阅事件集混用。	明确交付审阅后数据集或分组状态。

下一步

继续阅读行业场景配方。

当前审阅接口​

候选生成边界​

已发布规则集视图​

适用场景​

工作流​

候选信号​

冲突比较范围​

事件分组状态​

审阅步骤​

审阅后输出字段​

输出用途​

实施场景​

检查清单​

常见问题​

下一步​