Será que uma inteligência artificial avançada pode realmente exercer controle de tomada de decisão, ou está apenas presa em um loop de imitação automática de padrões? Um estudo de ciência cognitiva usando a clássica "tarefa de Stroop" revela uma limitação fundamental nos mecanismos de atenção de modelos de linguagem de grande escala (LLMs).
A Pesquisa
Liderada pelo pesquisador Suketu Patel e um coletivo de especialistas, o estudo teve como objetivo explorar divergências estruturais entre a atenção artificial baseada em transformadores e a atenção cognitiva humana. Os investigadores utilizaram a tarefa de Stroop, um teste clínico imaculado onde palavras de cores são impressas em tinta de cor incompatível, para avaliar o controle executivo e a capacidade de inibir uma resposta automática. A equipe testou modelos de fronteira premium, incluindo GPT-5, Claude Opus 4.1 e Gemini 2.5.
Os resultados mostraram que, enquanto LLMs lidam eficientemente com sequências curtas, seu controle executivo se desfaz à medida que o comprimento dos tokens aumenta. Com uma lista breve de cinco palavras incompatíveis, os modelos tiveram bom desempenho. No entanto, conforme as listas se expandiam, a precisão caía catastroficamente. Por exemplo, GPT-4o alcançou 91% de acurácia com 5 palavras, despencou para 57% com 10 palavras e colapsou para apenas 15% com 40 palavras. Claude 3.5 Sonnet manteve-se estável até 20 palavras, mas caiu para 24% com 40 palavras. Em listas mistas contendo cores compatíveis e incompatíveis, a precisão da máquina caiu para perto de 0% para itens incompatíveis, revelando uma perda completa de orientação da tarefa. Padrões idênticos foram verificados em sistemas de próxima geração, incluindo GPT-5, Claude Opus 4.1 e Gemini 2.5.
Humanos, em contraste, conseguem manter acurácia estável ao longo de sequências longas. Tanto humanos quanto LLMs são fundamentalmente mais treinados em leitura de palavras do que em nomeação de cores. No entanto, o cérebro humano pode exercer controle executivo de cima para baixo para suprimir o impulso automático de ler palavras, mantendo o foco intacto. O colapso total de desempenho dos LLMs expõe uma limitação arquitetônica fundamental na atenção sintética em comparação com a atenção biológica, conforme publicado na PNAS Nexus.
Por Que Isso Importa
Este estudo destaca uma força cognitiva chave que você usa todos os dias: o controle inibitório. Quando você ignora um pensamento distrativo ou resiste a um hábito, está usando o mesmo maquinário neural que permite realizar a tarefa de Stroop de forma confiável. Entender que seu cérebro consegue sustentar o foco sob carga cognitiva—enquanto mesmo a IA mais avançada não consegue—ressalta o valor do treinamento de atenção. Sua capacidade de permanecer na tarefa, especialmente em situações longas e complexas, é um ativo cognitivo genuíno.
O Que Você Pode Fazer
Seu controle executivo pode ser aprimorado. Experimente exercícios de treino cerebral que enfatizam a flexibilidade cognitiva, como alternar entre regras ou tarefas. Jogos como a própria tarefa de Stroop estão disponíveis online; praticá-los pode melhorar sua capacidade de inibir respostas automáticas. A prática consistente com tarefas cognitivas desafiadoras pode ajudar a manter e até melhorar sua capacidade de atenção.
Fonte: Neuroscience News
Curioso sobre seu próprio cérebro? Faça nosso teste de QI adaptativo gratuito ou tente 306 níveis de treino cerebral.