La preparación de datos viene antes de escalar IA
Los proyectos de IA industrial suelen fallar cuando el modelo puede leer documentos pero no identifica de forma confiable el activo, ubicación, señal, orden de trabajo o regla de aprobación. En operaciones reales, la base de datos es tan importante como el modelo.
Data Fusion Services prepara esta base en FactVerse. Conecta fuentes, mapea campos a entidades del gemelo digital, normaliza datos, calcula indicadores y hace que el contexto sea usable por FactVerse Twin Engine, FactVerse AI Agent, Inspector, dashboards y analítica.
Empezar desde el workflow operativo
La primera pregunta es operacional: qué decisión o tarea debe mejorar. Buenos puntos de inicio son mantenimiento predictivo, rutas de inspección, operaciones de data center, HeatOps, sistemas de facilities semiconductores, equipos logísticos o SOP digitales.
| Workflow | Datos iniciales |
|---|---|
| Mantenimiento predictivo | Jerarquía de activos, sensores, alarmas, historial, inspecciones, resultados de órdenes |
| Inspección facility | Espacios, activos, puntos, checklists, fotos, categorías, cierres |
| Data center | Salas, racks, equipos, medidores, alarmas, energía, mantenimiento, responsables |
| HeatOps | Fuentes, subestaciones, medidores, temperatura, presión, flujo, clima, dispatch |
| Guía operativa | SOP, pasos, equipos, seguridad, capacitación, aprobación |
Inventariar fuentes
Las fuentes típicas incluyen SCADA, BMS, EMS, PLC, historians, IoT, MES, ERP, CMMS, EAM, GIS, BIM, medidores, hojas de cálculo, planos, manuales, repositorios SOP, herramientas de inspección, formación y documentos.
Para cada fuente, registre propietario, propósito, método de conexión, campos disponibles, frecuencia, retención, unidades, timestamps, naming, riesgos de calidad, seguridad y aprobaciones.
Crear identidad de activos y espacios
Los workflows de AI Agent necesitan referencias estables. Bombas, AHU, UPS, intercambiadores, válvulas, grúas, vehículos, salas, líneas y subestaciones deben reconocerse entre sistemas.
FactVerse y Twin Engine usan esta identidad para conectar espacios, equipos, sistemas, relaciones, documentos, señales y órdenes. Data Fusion Services mapea campos y tags a los objetos correctos del twin.
Preparar señales, eventos y ejecución
Temperatura, vibración, corriente, presión, flujo, energía, estado de válvula, estado de alarma y estado de equipo requieren unidades, timestamps, reglas de muestreo y marcas de calidad. Órdenes, inspecciones, fotos, SOP y aceptación aportan contexto de ejecución.
Para machine learning, el dataset útil combina señal, contexto del activo, estado operativo, decisión humana, acción ejecutada y resultado. Estos datos apoyan entrenamiento, reentrenamiento, evaluación y ajuste de recomendaciones.
Patrón de despliegue DataMesh
- Elegir workflow - Un ciclo con propietario claro y resultado medible.
- Inventariar fuentes - Sistemas, tags, documentos, propietarios, acceso y riesgos.
- Modelar identidad - Espacios, activos, sistemas, relaciones y alias en FactVerse.
- Mapear y normalizar - Conectar fuentes, vincular campos a entidades, armonizar unidades y tiempo.
- Conectar ejecución - Inspector, Checklist, CMMS/EAM, SOP, evidencia y aprobación.
- Preparar revisión IA - Entregar contexto confiable a FactVerse AI Agent.
- Capturar resultados - Usar evidencia de campo y lecturas posteriores para mejorar datos y modelos.
Checklist
- Tiene el workflow propietario y resultado medible?
- Están inventariados sistemas, documentos, tags y registros?
- Activos y espacios están mapeados de forma consistente?
- Unidades, timestamps, frecuencias y riesgos de calidad están documentados?
- Órdenes, inspecciones, SOP, fotos y aceptación están conectadas?
- El AI Agent explica recomendaciones con evidencia trazable?
- Revisiones humanas, sugerencias rechazadas y resultados alimentan la evaluación ML?
Referencias públicas
La página de Data Fusion Services describe la capa de integración de datos de FactVerse. La guía del ciclo operativo de FactVerse AI Agent explica cómo las recomendaciones pasan a ejecución revisada. Las referencias Yokogawa y DataMesh, NIO smart factory y JTC muestran ejemplos públicos.
