Que sont les données synthétiques industrielles?

Des données d'entraînement et d'évaluation générées depuis des scènes industrielles, avec vues capteurs, labels, état objet, contexte spatial, état processus et métadonnées de tâche.

Où intervient FactVerse?

FactVerse fournit le jumeau industriel exécutable: structure du site, hiérarchie d'actifs, sémantique, liaisons de données, logique de comportement et traces de revue.

Qu'ajoute DataMesh Robotics?

DataMesh Robotics transforme les scènes twin en données synthétiques et workflows de préparation de tâches pour perception, inspection, mobilité, manipulation et simulation robotique.

Comment cadrer un pilote?

Choisir un environnement, une configuration robot ou capteur, des tâches, des sorties de données, contrôles qualité, chemin d'intégration et métriques de revue liées à l'objectif d'entraînement.

Données synthétiques pour Physical AI industriel et robotique

Pourquoi les données synthétiques industrielles ont besoin d'un jumeau

Les données robot réelles ont une forte valeur. En environnement industriel, la collecte, la répétition et la couverture de nombreux états d'exploitation demandent beaucoup d'effort. Les sites contiennent des états rares: allées bloquées, palettes déplacées, armoires ouvertes, éclairage variable, circulation humaine, changements de shift et états d'équipement brefs.

Les données synthétiques aident les équipes à couvrir cette variation dans un cadre contrôlé. Pour Physical AI industriel, les données doivent venir d'une scène qui comprend actifs, géométrie, règles d'exploitation, positions capteurs, objectifs de tâche et état processus. Le jumeau numérique fournit ce contexte.

DataMesh Robotics utilise le stack DataMesh pour préparer les scènes industrielles, générer des données multimodales et connecter les sorties aux workflows de simulation et d'entraînement robotique.

Ce qui distingue les scènes industrielles

Couche	Besoin de la pipeline
Identité des actifs	Noms d'équipements, types d'objets, versions de modèles et lien vers le jumeau opérationnel
Contexte spatial	Zones, voies, accès, dégagements, coordonnées et zones de sécurité
État processus	État de ligne, poste, étape de travail, exception et timing d'événement
Configuration capteur	Caméra, profondeur, LiDAR, pose robot, champ de vision, calibration, bruit et règles d'échantillonnage
Propriétés physiques	Masse, friction, articulations, contraintes, matériaux et hypothèses de contact
Labels et métadonnées	Segmentation, bounding boxes, IDs instance, profondeur, pose, trajectoire, état tâche et variables de scène
Traces de revue	Version dataset, version scène, hypothèses, recette de génération, résultats qualité et notes d'approbation

Cette structure rend le dataset explicable, reproductible et ajustable.

Workflow DataMesh

Modéliser l'environnement - Construire usine, facility, entrepôt, cellule ou zone d'inspection dans FactVerse avec actifs, zones, métadonnées et relations.
Créer le comportement de scène - Définir variantes de layout, logique processus, mouvement objet, étapes, événements et timing dans FactVerse Designer.
Préparer les assets de simulation - Aligner CAD, BIM, 3D, OpenUSD, matériaux, échelle, coordonnées et règles SimReady.
Configurer capteurs et tâches - Définir caméras, capteurs profondeur, vues robot, objets cibles, objectifs, critères de succès et contraintes.
Générer les données labellisées - Produire RGB, profondeur, segmentation, bounding boxes, IDs, poses, trajectoires, état processus et métadonnées.
Exporter vers les stacks d'entraînement - Packager datasets et scènes pour entraînement robotique, évaluation, Isaac Sim / Omniverse ou outils enterprise.
Revoir et itérer - Suivre qualité, couverture de scène, cohérence des labels, couverture tâche et résultats downstream.

Rôle du stack DataMesh

FactVerse conserve structure de site, actifs, relations, contexte de données, permissions et enregistrements de scène.

FactVerse Twin Engine fournit le contexte runtime pour les twins exécutables: géométrie, data binding, comportement et état d'interaction.

FactVerse Designer sert à créer layouts, logique processus, behavior trees, étapes de tâche et variantes.

DataMesh Robotics couvre génération de données synthétiques, sortie de labels, définition des tâches, reward setup et préparation des pipelines robotique.

FactVerse Adaptor for NVIDIA Omniverse relie les scènes FactVerse aux workflows OpenUSD et Omniverse pour rendu, simulation de capteurs, validation physique et outils externes.

Data Fusion Services connecte données live et historiques quand la scène a besoin d'états d'équipement, alarmes, signaux production ou contexte facility.

Checklist de spécification dataset

Robot, capteur, famille de modèle ou stack d'entraînement cible.
Périmètre environnement, version scène, liste d'assets et coordonnées.
Tâches, objets cibles, états processus et critères de succès.
Configuration capteur, chemins caméra, vues, calibration et bruit.
Règles de variation pour lumière, matériaux, placement, état équipement, routes et timing.
Sorties requises: RGB, profondeur, segmentation, bounding boxes, pose, trajectoire et métadonnées.
Contrôles qualité sur labels, classes, précision spatiale et couverture.
Format d'export, règles de nommage, version dataset et responsable de revue.

Bons points de départ

Datasets perception: images labellisées et profondeur pour objets industriels, équipements, outils, palettes, panneaux, fixtures et zones de travail.
Inspection: vues et labels pour actifs, panneaux, jauges, tuyaux, armoires et zones difficiles d'accès.
Robotique mobile: voies, obstacles, état route, staging areas, points de docking et conditions facility changeantes.
Manipulation et contact: pose objet, matériaux, contraintes de prise, état de contact et séquence de tâche.
Planification usine et entrepôt: variantes layout, flux matière, chemins robot et contraintes opérationnelles avant essais physiques.

Métriques qualité et gouvernance

Couverture par zone, classe objet et état processus.
Cohérence des labels entre frames et versions de scène.
Variation de lumière, placement, occlusion, état objet et pose capteur.
Cohérence physique sur échelle, collision, contact, route et timing.
Qualité d'intégration dans le simulateur ou stack d'entraînement.
Traçabilité de version dataset vers scène, recette et hypothèses.
Enseignements issus de l'évaluation modèle ou de la revue de simulation robotique.

Références publiques

Le lancement DataMesh Robotics présente la direction publique pour données synthétiques, twins industriels exécutables, objectifs de tâche, reward setup et pipelines robotique.

Le showcase GTC 2025 montre les jumeaux de simulation DataMesh avec FactVerse et NVIDIA Omniverse.

L'article FactVerse et NVIDIA Omniverse explique le lien entre contexte de scène FactVerse et workflows Omniverse.