跳到主要内容

MDM 故障事件融合

故障事件融合用于审阅多个源系统记录是否描述同一个真实事件。当系统用不同描述、时间戳、分类或 ID 上报相似故障时,这个流程可以减少漏合和重复计数。

本页描述治理模式,具体打分配置取决于实施和源系统。

当前审阅接口

故障事件审阅接口与主数据实体审阅接口分开:

动作接口族
查询候选/api/v1/dfslite/fault-fusion/candidates
批准重复分组/api/v1/dfslite/fault-fusion/candidates/{id}/approve
拒绝重复分组/api/v1/dfslite/fault-fusion/candidates/{id}/reject

读取使用 DFS 读权限;批准和拒绝会写入审阅决策。规划 API 级集成时,继续参考 MDM API 参考

候选生成边界

故障事件融合可能产生大量重复事件候选。生产运行中,融合方法应通过受治理的审阅界面创建候选,并返回 persisted 和 skipped candidate 等运行数量。操作人员随后通过 UI 或 API 审阅候选。

候选是人工决策的证据。下游报表、可靠性分析、AI Agent 证据检索和维护工作流在需要事件身份时,应使用已确认分组或审阅后的事件数据集。

运行输出含义查看位置
Persisted candidate count已创建进入审阅的候选分组数量。故障融合候选队列。
Skipped candidate count未写入的候选数量,通常因为为空、无效、重复或超出范围。运行历史和任务日志。
Approved group人工确认多条记录描述同一事件。审阅后事件输出和下游数据集。
Rejected group or pair人工拒绝重复关系。用于抑制重复误报的拒绝历史。

已发布规则集视图

DFS Pro 中的故障融合入口展示当前部署环境已发布的融合规则集。通过该视图可以查看融合服务实际使用的字段提取、匹配规则、幸存规则、置信度权重和 AI 辅助设置。某个规则块为空,表示对应流程尚未配置。

这样审阅人员看到的规则与实际融合运行保持一致。培训和交接材料也应以运行任务使用的已发布规则集为准。

适用场景

  • 多个系统上报同一故障或事件。
  • 自然键无法识别描述或时间略有差异的重复事件。
  • 报表重复统计事件。
  • 维护、巡检或可靠性分析需要审阅后的事件身份。
  • AI Agent 回答需要引用多个源系统的证据。

工作流

候选信号

信号作用
已解析实体 ID确认记录指向同一对象。
时间窗口找到足够接近的记录。
描述相似度识别同一状态的不同表述。
分类或严重度辅助比较源系统分类。
工单或巡检关联提供运营证据。

确认事件分组前应综合多个信号。不同资产上的相似描述应按独立事件处理。

冲突比较范围

冲突比较应聚焦会改变事件业务含义的字段,例如受治理身份、时间窗口、状态、严重度、分类、资产类型、批次上下文、设备状态、维护对象等。自由文本消息和源系统专用代码通常适合作为审阅证据;当多个系统用各自口径描述同一事件时,把这些字段直接作为冲突字段容易放大噪声。

任务进入常规运行前,应抽样检查冲突计数字段。证据丰富的字段可以继续保留在源证据和审阅视图中,冲突标记则用于提示真正需要人工关注的差异。

事件分组状态

用清晰状态区分原始事件和已审阅事件分组,避免下游误读。

状态含义下游使用方式
原始事件源事件尚未比较。用于源系统审计和导入排错。
候选分组解析器找到可能重复的分组。仅用于人工审阅。
已确认分组人工确认多条记录描述同一事件。用于可靠性分析、事件计数、AI Agent 证据和报表。
已拒绝关系人工拒绝候选关系。用于避免同一误报再次出现。
需要拆分候选分组中包含多个真实事件。发布审阅后输出前需要拆分。

审阅步骤

  1. 检查资产或设备身份。
  2. 比较源时间戳。
  3. 比较故障描述、分类和严重度。
  4. 有条件时检查工单或巡检证据。
  5. 判断是否描述同一事件。
  6. 拒绝仅表面相似的候选。

审阅时同时检查事件证据和运营跟进记录。故障记录和工单可能使用不同文本描述同一事件;相同告警文本也可能因为资产或运行窗口不同而代表不同事件。

审阅后输出字段

审阅后的事件数据集应暴露足够上下文,便于下游团队使用:

字段用途
审阅后事件 ID确认事件分组的稳定标识。
主数据实体 ID将事件连接到受治理的资产或设备身份。
源事件 ID保留回溯到原始源系统记录的能力。
主时间戳定义报表使用的事件时间。
时间窗口说明分组包含的源记录时间范围。
审阅状态区分原始、候选、已确认、已拒绝和需要拆分。
决策说明解释影响可靠性报表或 AI Agent 回答的人工决策。

发布审阅后事件 ID 时应同时保留原始源 ID,方便审计人员把回答或报表追溯到原始系统记录。

输出用途

确认后的事件分组可用于:

  • 可靠性分析;
  • 预测性维护证据;
  • 事故或异常复盘;
  • 巡检与工单跟进;
  • BI 报表;
  • AI Agent 证据解释。

实施场景

设施或制造环境中的典型设置如下:

  1. DFS Lite 导入告警、维修请求、巡检发现和工单记录。
  2. MDM 先解析资产或设备身份,再开始事件分组。
  3. 解析器基于实体 ID、时间窗口、文本相似度、分类和工单证据提出候选事件分组。
  4. 数据责任人在队列中确认或拒绝分组。
  5. DFS Pro 发布包含原始源 ID 和审阅后事件 ID 的事件数据集。
  6. Inspector、可靠性报表或 AI Agent 工作流使用审阅后的事件身份,减少重复事件计数,并引用源系统证据。

当源系统已经具备较一致的资产身份、事件时间和运营分类时,该场景效果最好。字段较弱时,应先改善映射,再把解析器扩展到更多源系统。

检查清单

  • 在信任事件分组前,资产或设备身份已经解析。
  • 时间窗口符合业务场景。
  • 相似度作为审阅信号使用。
  • 被拒绝候选已记录。
  • 下游报表说明使用原始事件还是已审阅事件分组。
  • 审阅后事件输出包含原始源 ID,便于审计。
  • 已确认分组已抽样核对工单或巡检证据。
  • 需要拆分的分组在进入生产报表前已处理。

常见问题

现象可能原因处理
重复事件仍然存在时间窗口过窄或资产身份未解析。审阅实体别名和打分配置。
不同事件被合并时间窗口过宽或描述匹配过松。收紧规则并拒绝错误分组。
审阅队列过大源数据质量或匹配键较弱。改善源映射并增加更强身份信号。
AI 回答引用证据混乱原始事件和已审阅事件集混用。明确交付审阅后数据集或分组状态。

下一步

继续阅读 行业场景配方