Accueil · Blog · Recherche

Pourquoi l'IA peine à voir le monde comme nous : le problème de la liaison

Pourquoi l'IA peine à voir le monde comme nous : le problème de la liaison

Quand vous voyez une pomme rouge sur une assiette bleue, votre cerveau sait immédiatement que le rouge appartient à la pomme, pas à l'assiette. Cette capacité — à lier des caractéristiques comme la couleur, la forme et la texture au bon objet — s'appelle la liaison. Une nouvelle recherche du Kording Lab de l'Université de Pennsylvanie (Lianghuan Huang, Yihao Li, Saeed Salehi, Yingshan Chang, Ansh Soni et Konrad P. Kording), acceptée à ICML 2026, révèle que même les Vision Transformers (ViTs) les plus avancés échouent souvent à cette tâche cognitive fondamentale, surtout lorsque les objets partagent des caractéristiques.

La recherche

L'équipe a formalisé le problème de la liaison à l'aide de la théorie de l'information et a développé une méthode de sondage pour mesurer la quantité d'informations de liaison encodée dans les représentations d'un modèle. Ils ont testé plusieurs ViTs pré-entraînés sur des ensembles de données conçus pour défier la liaison, comme des images avec des objets qui se chevauchent, un partage de caractéristiques (par exemple, deux cercles rouges) et des scènes naturelles. Leur principal constat : les informations de liaison sont présentes mais faibles, en particulier dans le jeton [CLS] (le jeton récapitulatif utilisé pour la classification). Les jetons spatiaux ont obtenu de meilleurs résultats, mais dans l'ensemble, les modèles ont souvent attribué à tort des caractéristiques au mauvais objet, reflétant un échec courant dans les tâches de raisonnement visuel. Par exemple, dans des scènes avec deux objets partageant une couleur, les ViTs ont souvent confondu quel objet avait quelle couleur, entraînant des baisses de précision allant jusqu'à 30 % par rapport aux humains.

Pourquoi c'est important

Pour la cognition humaine, la liaison est automatique et sans effort — nous n'y pensons même pas. Mais cette étude révèle que notre cerveau effectue un calcul sophistiqué que même la meilleure IA ne peut pas reproduire. Comprendre la liaison aide à expliquer pourquoi l'IA peut être trompée par des exemples adverses ou avoir du mal avec des scènes multi-objets. Pour votre propre cerveau, la liaison repose sur l'attention et la mémoire de travail ; lorsque celles-ci échouent (par exemple, en multitâche), vous rencontrez les mêmes erreurs — comme mettre le lait dans le placard. Améliorer votre capacité à vous concentrer et à garder plusieurs caractéristiques en mémoire peut aiguiser votre raisonnement visuel.

Ce que vous pouvez faire

Entraînez la capacité de liaison de votre cerveau : pratiquez des jeux de recherche visuelle où vous devez associer des caractéristiques (par exemple, trouver le carré bleu parmi des carrés rouges et des cercles bleus). Limitez également le multitâche — lorsque vous divisez votre attention, la liaison en souffre. Essayez des exercices de pleine conscience qui se concentrent sur un seul objet, en notant sa couleur, sa texture et sa forme ensemble.

Source : arXiv q-bio.NC

Curieux de connaître votre propre cerveau ? Faites notre test de QI adaptatif gratuit ou essayez 306 niveaux d'entraînement cérébral.

Curieux de connaître votre QI ?

Passez notre test adaptatif gratuit, scientifiquement conçu, sur 7 domaines cognitifs. Sans inscription.

Passer le test gratuit