Partage des tâches entre robots
Pour mieux comprendre l'émergence du travail en groupe dans la nature, des chercheurs belges et turcs ont simulé des fourmis coupe-feuille avec une colonie de robots.
Sophie Félix - Publié le
Les fourmis ont une manière très efficace de se partager les tâches. Des scientifiques de l’université catholique néerlandophone de Louvain (Belgique) et de l’université technique du Moyen-Orient (Turquie) ont cherché à savoir comment elles en étaient venues à choisir ce mode d’organisation. Dans une étude parue dans le journal Plos Computational Biology, ils montrent pour la première fois que des robots sont capables de diviser une tâche complexe en sous-tâches, et ce sans aide extérieure, puis de se partager le travail à partir de règles simples et sans communiquer.
Des robots inspirés du vivant
Dans la nature, quelques espèces ont évolué vers une organisation complexe avec partage des tâches, comme les fourmis, les abeilles ou les termites. Tout organisme multicellulaire est également formé d’un ensemble de cellules individuelles qui se sont spécialisées pour faire vivre le groupe.
Pour évoluer d’une cellule unique à un organisme pluricellulaire ou d’un individu à une fourmilière efficace, plusieurs conditions doivent apparaître simultanément : le groupe doit pouvoir décomposer un travail en sous-tâches, coordonner leur exécution et optimiser le nombre de membres affectés à chaque tâche, et les individus doivent savoir accomplir leurs tâches respectives. Pour comprendre comment la nature a pu réussir ce passage difficile, les scientifiques ont utilisé des simulations de robots qui reproduisent le comportement de fourmis coupe-feuille.
Déchargeurs et caristes
Ces fourmis élèvent des champignons pour s’en nourrir et vont chaque jour chercher des feuilles d’arbre pour les faire pousser. Les ouvrières forment deux équipes : une partie d'entre elles découpe des morceaux de feuilles et les laisse tomber au bas de l’arbre tandis qu’un autre groupe ramène les morceaux du pied de l’arbre à la fourmilière. Il s’agit d’un véritable partage des tâches et non d’un simple travail en parallèle, puisque la deuxième étape ne peut avoir lieu sans la première et que l’ordre importe.
Les chercheurs ont cherché à évaluer la capacité de leurs robots à reproduire ce partage entre les dropper (que nous appellerons « déchargeurs ») et les collector (« caristes »). Pour cela, ils ont construit un terrain de jeu virtuel comprenant un « nid » représentant la fourmilière et une zone source contenant de petits objets figurant des morceaux de feuilles. Entre les deux, le sol est plat ou incliné. Quatre robots, identiques physiquement et par leur programmation, sont placés au niveau du nid et doivent rapporter le maximum d’objets en 5000 secondes. Seule la performance du groupe compte et aucune information n’est livrée au préalable sur la façon de diviser cet exercice en sous-tâches.
Un environnement déterminant
Dans une première expérience, les robots connaissent à l’avance les opérations complexes qui permettent de ramener un objet au nid. Ils en sont capables individuellement, mais doivent optimiser leur comportement collectif pour maximiser le nombre de feuilles rapportées. En essayant toutes les combinaisons, l’étude montre que la configuration optimale dépend du terrain. Lorsqu’il n’y a pas de pente, tous les robots vont du nid à la zone source et rapportent un objet jusqu’au nid : ils sont généralistes.
Dans un terrain en pente, la performance maximale est atteinte lorsque 50 % des robots jouent le rôle de déchargeur, les autres faisant des allers-retours entre la réserve et le nid. Un partage de tâches efficace n’apparaît donc que lorsque le terrain présente certaines caractéristiques : la pente permet de réaliser des économies en énergie et en temps, en utilisant la gravité. Les fourmis elles-mêmes agissent en conséquence : si l’arbre est proche du nid ou tombé au sol, elles restent généralistes.
Une équipe se partageant les tâches ne retrouve jamais une organisation de généralistes.
Apprendre à partir de rien
Ce type de test, permettant d’optimiser les équipes ou le nombre de sous-tâches, a par exemple servi à l’étude des transports, des mouvements de foule ou l’optimisation des communications. Mais il suppose que chaque membre de la colonie de robots sait d’avance exécuter toutes les tâches qu’il pourrait être amené à faire, ce qui limite les comportements possibles.
Lors d'une deuxième expérience, les chercheurs ont donc utilisé des robots qui ne connaissaient que quelques commandes de base : marcher aléatoirement, repérer le nid et la source, éviter les obstacles, ramasser et déposer une charge. Grâce à un programme d’évolution, les robots apprennent en groupe à rapporter des objets au nid puis à améliorer leurs performances. Ils parviennent alors aux mêmes configurations optimales.
Une méthode évolutionniste inédite
Les chercheurs ont utilisé un scénario d’évolution appelé Grammatical Evolution qui modifie la programmation des robots grâce à des mutations, des croisements et des sélections. Calqué sur l’évolution de l’ADN, cet outil génère un nouveau code à chaque génération de robots. Ainsi, les robots de la deuxième expérience ont appris des actions complexes impliquant 4 à 11 actions de base connues par la première génération. Les simulations numériques permettent de parcourir très vite de nombreuses générations : pour cette étude, les 22 simulations de 2000 générations ont nécessité trois mois de calcul sur un supercalculateur, chaque simulation observant 100 groupes de quatre ou vingt robots.
Contrairement à la première expérience où les robots, une fois spécialisés, le demeuraient, ceux-ci changent de fonction selon le nombre d’objets en attente dans la réserve. Cette apparence spontanée d’un comportement collectif cohérent s’appelle « stigmergie ». Il n’y a en effet aucune communication entre les robots, mais une coordination indirecte se met en place. Par exemple, un robot s’arrête à la réserve s’il rencontre un objet et le ramène au nid. Mais il continue jusqu’à la source s’il ne croise aucun objet. Donc si la réserve est peu remplie, les robots ont tendance à devenir déchargeurs sans qu’aucune règle n'ait été fixée sur le nombre d’objets devant se trouver dans la réserve. De même, des déchargeurs aideront les caristes débordés.
Pour maximiser leurs performances, les robots doivent se spécialiser et agir rapidement ; un partage efficace entre des robots lents ne permet de rapporter qu’un faible nombre d’objets au nid. Cela étant, si le robot ne connaît pas le geste adéquat, célérité et spécialisation ne suffisent pas : certains robots perdent du temps en déposant les objets pris dans la zone source sans les amener sur la pente. Autre leçon de l'expérience : le partage des tâches se produit plus aisément lorsque les robots sont capables d’effectuer les sous-tâches individuellement avant de participer à un comportement de groupe, comme dans la première expérience.
Cette étude montre donc qu’un partage de tâches efficace peut survenir à partir de règles simples, mais dans un environnement adapté qui permette de réduire les coûts de transport. Les scientifiques espèrent améliorer encore les performances des robots en leur permettant de communiquer comme le font les animaux vivant en société, à l'instar des abeilles. Ces essaims de robots à l’intelligence collective développée seront alors capables d'effectuer une mission en s’adaptant automatiquement aux conditions changeantes de l’environnement.