Filmlexikon.
Soutenir
Motion Capture / MoCap
VFX · Technique

Motion Capture / MoCap

Murnau AI illustration
cgi animation vfx supervisor

Technologie de capture et d'enregistrement numérique des mouvements corporels des acteurs ou des objets pour une utilisation dans les animations ou les effets visuels.

Définition

Motion Capture (ou MoCap) est la technologie de capture et d'enregistrement numériques des mouvements corporels en temps réel. Un acteur ou un personnage animé porte une combinaison spéciale avec des marqueurs réfléchissants, suivis par des caméras sensibles à l'infrarouge. Les positions capturées sont converties en données de squelette numériques, qui sont ensuite appliquées à des personnages CGI.

Le Motion Capture est aujourd'hui essentiel pour les blockbusters hollywoodiens avec des personnages numériques comme "Avatar", "Le Livre de la Jungle" ou les films Marvel. Ce procédé permet des animations de mouvement photoréalistes, impossibles à réaliser à la main.

Types de Motion Capture

1. MoCap optique basé sur marqueurs (Standard)

Fonctionnement :

  • Des marqueurs réfléchissants (diamètre 12-16 mm) sont fixés sur le corps.
  • Des caméras infrarouges capturent la position 3D de chaque marqueur.
  • La triangulation calcule les positions précises du squelette.
  • Le calcul en temps réel permet un aperçu en direct.

Équipement :

  • 12 à 32 caméras infrarouges spécialisées (OptiTrack, Vicon, Xsens)
  • Ensembles de marqueurs réfléchissants
  • Combinaisons spéciales avec poches pour marqueurs
  • Logiciel de suivi en temps réel

Avantages :

  • Précision la plus élevée (sub-millimétrique)
  • Plusieurs acteurs possibles simultanément
  • Traitement très rapide
  • Zone de mouvement illimitée possible

Inconvénients :

  • Coûteux (location de studio : 8-15K€/jour)
  • Occlusion des marqueurs (recouvrement) problématique
  • Combinaison spéciale inconfortable
  • Calibrage complexe

2. MoCap inertiel (basé IMU)

Fonctionnement :

  • Accéléromètres sur chaque articulation
  • Aucune caméra externe nécessaire
  • Transmission de données sans fil
  • Latence plus faible possible

Exemples : Xsens MVN, OptiTrack Geno

Avantages :

  • Captures en extérieur possibles
  • Aucune installation de caméra requise
  • Déploiement plus rapide
  • Moins cher que les systèmes optiques

Inconvénients :

  • Dérive et bruit dans le temps
  • Moins précis que l'optique
  • Calibrage avant chaque session
  • Coûteux par combinaison (50-70K€)

3. MoCap sans marqueurs / basé sur IA

Fonctionnement :

  • Algorithmes d'apprentissage profond reconnaissent les articulations du corps à partir de vidéos.
  • Aucun marqueur ni matériel spécial nécessaire.
  • Traitement en temps réel sur GPUs standards.
  • De plus en plus disponible (OpenPose, MediaPipe, RunwayML).

Avantages :

  • Peu coûteux (logiciel coûte 100-500€/mois)
  • Rapide à implémenter
  • Aucun équipement spécial
  • Intérieur et extérieur

Inconvénients :

  • Moins de précision (erreur de ±5-10 cm)
  • Une seule personne par prise
  • Faible performance sur mouvements rapides
  • Post-traitement des données nécessaire

4. MoCap en temps réel / en direct (Streaming)

Fonctionnement :

  • Le suivi en temps réel est directement alimenté dans le moteur 3D.
  • L'acteur voit son double numérique sur un moniteur en direct.
  • Performance interactive possible.
  • Utilisation en Production Virtuelle (studios LED).

Exemples : "The Mandalorian", "Fortnite Performance Capture"

Avantages :

  • Retour en direct pour l'acteur
  • Le réalisateur peut faire des ajustements en temps réel
  • Réduit les reprises
  • Prévisualisation en temps réel

Inconvénients :

  • Extrêmement cher (100K-200K€/jour)
  • Techniquement complexe
  • Talents spécialisés requis
  • Tolérance limitée aux erreurs techniques

Placement des marqueurs : Squelette standard

Un squelette de MoCap standard comporte typiquement 40 à 70 marqueurs :

Tête :
├── Couronne (sommet du crâne)
├── Front
├── Arrière_Tête
└── Cou

Colonne vertébrale :
├── Dorsale_1 (bas)
├── Dorsale_2 (milieu)
├── Dorsale_3 (haut)
└── Clavicule_G/D

Bras gauche :
├── Épaule_G
├── Coude_G
├── Poignet_G
├── Main_G
└── Doigts_G [1-5]

Bras droit :
└── (identique)

Bassin :
├── HANCH_G (hanche gauche)
├── HANCH_D (hanche droite)
└── Bassin_Arrière (arrière)

Jambe gauche :
├── Genou_G
├── Cheville_G
├── Orteils_G
└── Talon_G

Jambe droite :
└── (identique)

Flux de travail MoCap

Phase 1 : Pré-production

Avant la session de capture :

  • Planification des scènes et blocage
  • Définition du placement des marqueurs
  • Installation et calibrage des caméras
  • Ajustement des combinaisons et sélection des tailles
  • Briefing des acteurs

Phase 2 : Capture (en studio)

Préparation (30 min) :
├── L'acteur enfile la combinaison MoCap (30 kg avec équipement)
├── Placement et vérification des marqueurs
└── Calibrage des caméras (Pose en T et Pose en A)

Enregistrement (4-6 heures) :
├── Enregistrement des prises
├── Vérification du contrôle qualité en temps réel
├── Nouvelle prise en cas d'occlusion de marqueur
└── Poses en T entre les prises pour référence

Après capture (30 min) :
├── Validation des données
├── Transfert de fichiers et sauvegarde
└── Nettoyage de l'équipement

Phase 3 : Post-traitement (2-4 semaines)

Données brutes de capture
├── Comblage des lacunes des marqueurs (interpolation en cas d'images manquantes)
├── Réduction du jitter et lissage
├── Ajustement du squelette (conversion marqueurs → squelette)
├── Normalisation de l'échelle et de la pose en T
├── Création du graphe de mouvement
└── Export FBX/EXR pour l'animation

Spécifications techniques

Système de suivi optique (Standard de l'industrie)

Précision : Erreur RMS de ±2-5 mm
Latence : 2-4 images (à 24 ips = 83-166 ms)
Fréquence d'images de capture : 120-240 ips (pour sous-échantillonnage à 24 ips)
Espace de travail : 4m x 4m à 20m x 20m (taille illimitée avec réseau)
Nombre de caméras : 12-32 caméras typiquement
Taux de rafraîchissement : 120 Hz ou 240 Hz

Format et taille des données

Une session de 8 heures avec 50 marqueurs à 120 ips :
├── Données brutes : ~50-80 Go (format propriétaire)
├── Données de squelette : ~2-5 Go (FBX/BVH)
├── Graphe de mouvement : ~500 Mo-1 Go
└── Sauvegarde d'archivage : 150-200 Go (redondant)

Problèmes et solutions en MoCap

Problème 1 : Occlusion des marqueurs

Quoi : Les marqueurs sont cachés par des parties du corps, le système de suivi perd la position.

Solutions :

  • Comblage des lacunes des marqueurs par logiciel (interpolation)
  • Augmenter la distance physique entre les marqueurs
  • Nombre de caméras plus élevé (lignes de visée redondantes)
  • Nettoyer manuellement les zones problématiques

Coût du nettoyage : +30-50% du temps de post-production

Problème 2 : Jitter et bruit

Quoi : Les marqueurs "tremblent" en raison du bruit des caméras ou des reflets.

Solutions :

  • Réduction du jitter par logiciel (filtre de Butterworth)
  • Correction manuelle par images clés
  • Fréquence d'images de capture plus élevée pour le sous-échantillonnage
  • Meilleure qualité des marqueurs (propriétés réfléchissantes)

Problème 3 : Rotation d'épaule / Blocage de cardan

Quoi : Rotations d'épaules non naturelles dues à des singularités mathématiques.

Solutions :

  • Rotation basée sur quaternions (au lieu d'angles d'Euler)
  • Contraintes du solveur dans le système de squelette
  • Animation manuelle pour les images critiques
  • Interpolation d'ordre supérieur

Problème 4 : Mouvements des doigts

Quoi : 5 doigts par main difficiles à suivre (densité de marqueurs élevée).

Solutions :

  • Caméras de suivi de main spécialisées (séparées)
  • Gants avec marqueurs pour les doigts
  • Animation de mains semi-automatique
  • Souvent retravaillé manuellement (80% des plans)

MoCap vs. Animation manuelle

AspectMoCapAnimation manuelle
AuthenticitéNaturelleStylisée
VitesseRapide (1 jour de capture)Lente (1-2 semaines)
CoûtÉlevé initialementÉlevé récurrent
ContrôleLimitéMaximal
Effets spéciauxDifficileFacile
Ajustement finBeaucoup de nettoyageMinimal
Boucles et répétitionSimpleComplexe

Productions célèbres en MoCap

  • Avatar (2009) : 60 jours de MoCap pour les Na'vi bleus
  • Le Hobbit (2012) : Andy Serkis en Gollum en temps réel sur le plateau
  • Le Livre de la Jungle (2016) : Look live-action grâce aux animaux en MoCap
  • Avengers: Infinity War (2018) : Thanos avec MoCap en temps réel
  • The Mandalorian (2019) : MoCap en direct dans un volume LED

Performance d'acteur en MoCap

Ce qui fonctionne :

  • Mouvements amples et clairs
  • Langage corporel et posture
  • Expression émotionnelle par le mouvement
  • Interaction avec d'autres acteurs en MoCap
  • Séquences d'action dynamiques

Ce qui est difficile :

  • Micro-mouvements subtils
  • Gestes des doigts
  • Contact visuel (filmé séparément)
  • Interaction des vêtements
  • Prises d'objets réalistes

Avenir du Motion Capture

Tendances actuelles :

  • Gestion de l'occlusion des marqueurs assistée par IA en temps réel
  • Les systèmes sans marqueurs s'améliorent constamment (RunwayML, OpenPose 2.0)
  • MoCap en direct dans les productions en streaming
  • Approches hybrides (optique + IMU combinés)
  • Post-traitement basé sur le cloud

Voir aussi

Continuer dans le lexique

Termes liés

Signaler une erreur
De l'écosystème Filmfarm

Comprendre le langage visuel, chiffrer les productions, connecter l'équipe.

Le lexique fait partie de l'écosystème Filmfarm — aux côtés du chiffrage (FilmBalance), d'un magazine professionnel (FilmCircus) et de la mise en relation des équipes (FilmCall, CrewMesh). Un vocabulaire commun pour toute la production.

FilmFarm FilmRadarBientôt disponibleFilmPulseBientôt disponibleFilmNumbersBientôt disponibleFilmCapitalBientôt disponibleFilmLabBientôt disponibleFilmBalanceBientôt disponibleFilmCircusBientôt disponible