Accueil · Blog · Actualités

L'IA trébuche sur un test classique d'attention : pourquoi les humains surpassent encore les machines

L'IA trébuche sur un test classique d'attention : pourquoi les humains surpassent encore les machines

L'intelligence artificielle peut réussir des examens et rédiger des essais, mais soumettez-la à un test psychologique classique de concentration et elle s'effondre rapidement. Une nouvelle étude du PNAS Nexus montre que les principaux modèles d'IA—y compris GPT-4o, Claude 3.5 Sonnet et Gemini 2.5—ont du mal à maintenir leur attention lorsque les tâches s'allongent, une faiblesse qui comporte des leçons importantes pour la cognition humaine.

La recherche

Des chercheurs dirigés par Suketu Patel ont soumis plusieurs grands modèles de langage (LLM) à la tâche de Stroop, un test psychologique bien connu. Dans ce test, des mots de couleur apparaissent dans une encre colorée, et les participants doivent nommer la couleur de l'encre plutôt que lire le mot. Par exemple, le mot « rouge » imprimé en encre bleue nécessite de supprimer l'habitude automatique de lecture. Avec des listes courtes de cinq mots, les modèles d'IA ont bien performé, GPT-4o atteignant 91 % de précision. Mais à mesure que les listes s'allongeaient, les performances s'effondraient. À dix mots, la précision de GPT-4o tombait à 57 % ; à quarante mots, elle chutait à seulement 15 %. Claude 3.5 Sonnet a maintenu des performances stables jusqu'à vingt mots, puis a chuté à 24 % de précision à quarante mots. Les chercheurs ont observé des tendances similaires avec GPT-5, Claude Opus 4.1 et Gemini 2.5. Lorsque des mots concordants et discordants apparaissaient ensemble, la précision pour les éléments discordants tombait à presque zéro. Les modèles revenaient de plus en plus à la lecture des mots au lieu de nommer la couleur de l'encre, révélant une incapacité à maintenir l'objectif demandé.

Pourquoi c'est important

Cette étude met en lumière une différence cruciale entre l'attention humaine et machine. Les humains aussi ont des difficultés avec la tâche de Stroop—la lecture est plus automatique que la nomination des couleurs—mais la plupart des gens maintiennent des performances stables même avec de longues listes. La chute spectaculaire de précision de l'IA suggère que les LLM actuels manquent d'un contrôle exécutif robuste, l'ensemble des processus mentaux qui nous aident à réguler l'attention et à résister aux distractions. Contrairement aux cerveaux biologiques, ces modèles n'ont aucun mécanisme pour maintenir la concentration sur des séquences étendues. Pour quiconque s'intéresse aux capacités cognitives, cela souligne la valeur de la flexibilité de l'attention humaine. Bien que l'IA puisse traiter de vastes informations, elle ne peut égaler notre capacité à garder un seul objectif en tête et à filtrer les signaux concurrents.

Ce que vous pouvez faire

Pour protéger votre propre attention, pratiquez le monotâche. Engagez-vous régulièrement dans des activités qui nécessitent une concentration soutenue, comme lire un livre sans interruption ou résoudre des puzzles comme le test de Stroop vous-même. Cela renforce votre contrôle exécutif et maintient votre esprit vif.

Source : ScienceDaily Mind & Brain

Curieux de connaître votre propre cerveau ? Faites notre test de QI adaptatif gratuit ou essayez 306 niveaux d'entraînement cérébral.

Curieux de connaître votre QI ?

Passez notre test adaptatif gratuit, scientifiquement conçu, sur 7 domaines cognitifs. Sans inscription.

Passer le test gratuit