Способен ли продвинутый искусственный интеллект действительно осуществлять контроль над принятием решений или же он просто заперт в цикле автоматического подражания шаблонам? Исследование в области когнитивистики с использованием классического психологического «теста Струпа» выявило фундаментальное ограничение механизмов внимания больших языковых моделей (LLM).
Исследование
Под руководством исследователя Сукета Пателя и группы экспертов, исследование было направлено на изучение структурных расхождений между машинным вниманием на основе трансформеров и человеческим когнитивным вниманием. Исследователи использовали задачу Струпа — чистый клинический тест, в котором слова, обозначающие цвета, напечатаны несовпадающим цветом чернил, для оценки исполнительного контроля и способности подавлять автоматический ответ. Команда протестировала передовые модели, включая GPT-5, Claude Opus 4.1 и Gemini 2.5.
Результаты показали, что LLM эффективно обрабатывают короткие последовательности, но их исполнительный контроль рушится по мере увеличения длины токенов. С коротким списком из пяти несовпадающих слов модели работали хорошо. Однако по мере расширения списков точность катастрофически падала. Например, GPT-4o достигал 91% точности на 5 словах, падал до 57% на 10 словах и обрушивался до всего 15% на 40 словах. Claude 3.5 Sonnet оставался стабильным до 20 слов, но упал до 24% на 40 словах. В смешанных списках, содержащих как совпадающие, так и несовпадающие цвета, точность машин падала почти до 0% для несовпадающих элементов, что выявило полную потерю ориентации на задачу. Идентичные закономерности были подтверждены на системах следующего поколения, включая GPT-5, Claude Opus 4.1 и Gemini 2.5.
Люди, напротив, могут поддерживать стабильную точность на длинных последовательностях. И люди, и LLM принципиально лучше обучены чтению слов, чем называнию цветов. Однако человеческий мозг может применять нисходящий исполнительный контроль, чтобы подавлять автоматический импульс чтения слов, сохраняя фокус неизменным. Полный коллапс производительности LLM выявляет фундаментальное архитектурное ограничение синтетического внимания по сравнению с биологическим, как опубликовано в PNAS Nexus.
Почему это важно
Это исследование подчеркивает ключевую когнитивную способность, которую вы используете каждый день: тормозный контроль. Когда вы игнорируете отвлекающую мысль или сопротивляетесь привычке, вы используете те же нейронные механизмы, которые позволяют вам надежно выполнять задачу Струпа. Понимание того, что ваш мозг может сохранять концентрацию при когнитивной нагрузке — в то время как даже самый продвинутый ИИ не может — подчеркивает ценность тренировки внимания. Ваша способность оставаться сосредоточенным на задаче, особенно в длительных и сложных ситуациях, является настоящим когнитивным активом.
Что вы можете сделать
Ваш исполнительный контроль можно улучшить. Попробуйте упражнения для тренировки мозга, которые делают упор на когнитивную гибкость, например, переключение между правилами или задачами. Игры, подобные задаче Струпа, доступны онлайн; их практика может улучшить вашу способность подавлять автоматические реакции. Регулярная практика с сложными когнитивными задачами может помочь поддерживать и даже улучшить вашу концентрацию.
Источник: Neuroscience News
Любопытно узнать свой мозг? Пройдите наш бесплатный адаптивный IQ-тест или попробуйте 306 уровней тренировки мозга.