RoboCup @Home 2023 - CATIE Robotics
La compétition
La RoboCup @Home est la compétition mondiale de référence en robotique de service. Des robots entièrement autonomes doivent exécuter des scénarios domestiques complexes : accueillir des invités, ranger des courses, servir au restaurant, suivre une personne en extérieur, identifier des inconnus dans une foule. Les équipes sont des laboratoires universitaires et centres de recherche parmi les meilleurs au monde. Ce n'est pas un hackathon — c'est une compétition que des équipes préparent pendant des mois, voire des années.
En 2023, la RoboCup se tient à Bordeaux. CATIE Robotics y engage Epock, un robot TIAGo de PAL Robotics, pour la cinquième année consécutive. Le résultat : 3e place mondiale.
Ce que la compétition impose
La difficulté de la RoboCup @Home ne vient pas seulement de la complexité des épreuves. Elle vient de leurs conditions d'exécution : l'arène est inconnue jusqu'aux dernières heures avant le début, le robot doit créer sa propre carte de l'environnement, les paramètres de perception sont calibrés en conditions réelles le jour même, et tout doit fonctionner devant un public nombreux, dans un espace bruyant avec une luminosité variable.
- Navigation
- Perception
- Langage naturel
- Tâches
La navigation autonome repose sur AMCL pour la localisation et ROS move_base pour la planification. Pour améliorer la robustesse sur un sol glissant, des encodeurs déportés ont été ajoutés au robot pour calculer l'odométrie indépendamment des roues, fusionnée avec les autres capteurs via un filtre de Kalman. En complément de la navigation globale, un module de contrôle local de la base mobile permet au robot de gérer des situations que le stack ROS natif ne couvre pas — franchir une porte, naviguer dans un espace confiné, se repositionner précisément devant un objet à attraper.
Toutes les intelligences artificielles sont gérées via un environnement interne appelé Eagle Nest, qui standardise le catalogue d'IA disponibles, gère leur exécution et leur monitoring. Les modules actifs en 2023 :
- Reconnaissance d'objets : YOLOv8, ré-entraîné sur site le jour de la compétition à partir de photos annotées en quelques minutes grâce à Segment Anything Model.
- Reconnaissance faciale : MTCNN pour la détection, réseau siamois entraîné sur VGGFace2 (8000+ identités) pour la ré-identification entre pièces.
- Description de personnes : ResNet entraîné sur CUHK-PEDES pour décrire l'apparence (couleur de cheveux, vêtements…).
- Pose : MoveNet pour détecter en temps réel si une personne est assise, debout, lève la main — utilisé comme filtre économique avant de lancer des algorithmes plus coûteux.
- Localisation précise d'objets : reconnaissance de formes LIDAR pour repositionner le robot face à un objet connu avec une précision que la localisation globale seule ne permet pas.
La pipeline de communication est entièrement offline : transcription par Whisper (ASR entraîné sur 680 000 heures) et compréhension de l'intention par SNIPS NLU. C'est un choix délibéré — en compétition, toute dépendance réseau est un risque. La latence est acceptable et l'ensemble fonctionne sans connexion internet.
Le principal problème rencontré lors des éditions précédentes était la sur-activation : le pipeline interprétait le bruit ambiant comme de la parole. La solution adoptée a consisté à corréler l'activation du microphone avec les états du robot — le système n'écoute que lorsqu'il est dans un état qui l'y autorise, jamais en continu.
Chaque épreuve est une machine à états dédiée qui orchestre les appels aux modules de navigation, perception et langage selon les points atteignables et l'avancement réel : Receptionist, Storing Groceries, Restaurant, Carry My Luggage, Stickler of the Rules. La stratégie de points — décider quelles sous-tâches tenter et dans quel ordre — est une partie entière du travail de préparation.
Mon rôle
Le rôle de Team Leader sur ce type de projet couvre deux dimensions. La dimension de coordination : définir les priorités techniques dans les semaines qui précèdent, arbitrer les choix architecturaux, organiser les sessions de test, gérer la préparation du Team Description Paper. La dimension technique : j'ai été le principal contributeur sur robot-manager, le middleware central qui expose les capacités du robot à toutes les tâches — navigation, synthèse vocale, perception, bras, retours visuels (LEDs, écran). J'ai notamment conçu la gestion des états visuels du robot pour l'interaction avec le public, le système TTS, et contribué à plusieurs tâches dont Receptionist et Carry My Luggage.
Le résultat
3e place mondiale, avec une couverture médiatique nationale : M6 au 19:45, France 2, TV7, Usine Digitale, Usine Nouvelle, Actu Bordeaux. La présence d'Epock dans des journaux télévisés grand public illustre un aspect propre à la RoboCup @Home : la compétition se joue aussi devant un public non expert, ce qui impose des exigences d'interaction et de lisibilité que les benchmarks purement techniques n'évaluent pas.
Le Team Description Paper 2023 est disponible publiquement. Il détaille l'architecture logicielle, les choix techniques par module et les résultats par épreuve.