Spot Detector (YOLOv8m)

Détecteur YOLOv8m du robot quadrupède Boston Dynamics Spot, entraîné dans le cadre du projet FILDARIANE (CRIStAL/CNRS, stage Polytech Lille, 2026).

Vue d'ensemble

Ce modèle sert de brique de redondance dans un système de tracking visuel principalement basé sur des marqueurs AprilTag. Lorsque les tags sont occultés ou hors champ, ce détecteur prend le relais pour maintenir la localisation du robot Spot.

Architecture

Modèle : YOLOv8m (medium, ~25M paramètres, ~52 Mo)
Classe détectée : Spot
Image size : 640 × 640

Entraînement

Epochs : 50
Batch size : 16
Optimizer : auto (SGD)
Hardware : GPU NVIDIA, durée ~1 h

Dataset

Frames extraites des séquences vidéos du DARPA Subterranean Challenge Final Event (Days 2, 3, 4) ainsi que de deux clips Boston Dynamics (Spot Launch et Spot Warehouse), à 1 image par seconde.

Les annotations ont été générées automatiquement par Grounding DINO en zero-shot detection avec le prompt textuel "quadruped robot", puis validées manuellement (architecture Teacher–Student).

Utilisation

from ultralytics import YOLO

model = YOLO("best.pt")
results = model.predict("path/to/image.jpg", conf=0.5)
results[0].show()

Code source

Le pipeline complet (téléchargement vidéos, extraction frames, annotation, entraînement) est disponible sur GitHub : https://github.com/Ronanlg44/spot-AI-vision-detection

Citation

Le Guenne, R. (2026). Spot AI Vision Detection — Brique de redondance YOLOv8m pour le projet FILDARIANE. Stage Polytech Lille / CRIStAL CNRS.

Downloads last month: 54