Чи може передовий штучний інтелект справді здійснювати контроль над прийняттям рішень, чи він лише замкнений у циклі автоматичного імітування патернів? Дослідження з когнітивної науки з використанням класичного психологічного "тесту Струпа" виявляє фундаментальне обмеження в механізмах уваги великих мовних моделей (LLM).
Дослідження
Очолюване дослідником Сукетом Пателем та групою експертів, дослідження мало на меті вивчити структурні розбіжності між увагою трансформерних машин та когнітивною увагою людини. Дослідники використали тест Струпа — чистий клінічний тест, де слова-кольори надруковані невідповідним кольором чорнила — для оцінки виконавчого контролю та здатності пригнічувати автоматичну реакцію. Команда протестувала передові моделі, зокрема GPT-5, Claude Opus 4.1 та Gemini 2.5.
Результати показали, що хоча LLM ефективно обробляють короткі послідовності, їхній виконавчий контроль руйнується зі збільшенням довжини токенів. З коротким списком із п'яти невідповідних слів моделі працювали добре. Однак зі збільшенням списку точність катастрофічно падала. Наприклад, GPT-4o досягла 91% точності на 5 словах, впала до 57% на 10 словах і знизилася до лише 15% на 40 словах. Claude 3.5 Sonnet залишалася стабільною до 20 слів, але впала до 24% на 40 словах. У змішаних списках, що містили як відповідні, так і невідповідні кольори, машинна точність впала майже до 0% для невідповідних елементів, що свідчить про повну втрату орієнтації на завдання. Ідентичні закономірності підтвердилися в системах наступного покоління, включаючи GPT-5, Claude Opus 4.1 та Gemini 2.5.
Натомість люди можуть підтримувати стабільну точність на довгих послідовностях. І люди, і LLM краще натреновані на читання слів, ніж на називання кольорів. Але людський мозок може здійснювати низхідний виконавчий контроль, щоб придушити автоматичний імпульс читання слів, зберігаючи фокус недоторканним. Повний колапс продуктивності LLM виявляє фундаментальне архітектурне обмеження синтетичної уваги порівняно з біологічною, як опубліковано в PNAS Nexus.
Чому це важливо
Це дослідження підкреслює ключову когнітивну силу, яку ви використовуєте щодня: гальмівний контроль. Коли ви ігноруєте думку, що відволікає, або чините опір звичці, ви використовуєте ті самі нейронні механізми, які дозволяють надійно виконувати тест Струпа. Розуміння того, що ваш мозок може підтримувати фокус під когнітивним навантаженням, тоді як навіть найсучасніший ШІ не може, підкреслює цінність тренування уваги. Ваша здатність залишатися зосередженим, особливо в довгих, складних ситуаціях, є справжнім когнітивним активом.
Що ви можете зробити
Ваш виконавчий контроль можна вдосконалити. Спробуйте вправи для тренування мозку, які наголошують на когнітивній гнучкості, наприклад, перемикання між правилами або завданнями. Ігри, як-от сам тест Струпа, доступні онлайн; їх практика може покращити вашу здатність пригнічувати автоматичні реакції. Регулярна практика зі складними когнітивними завданнями може допомогти підтримувати та навіть покращувати вашу здатність до концентрації.
Джерело: Neuroscience News
Цікавитеся власним мозком? Пройдіть наш безкоштовний адаптивний IQ тест або спробуйте 306 рівнів тренування мозку.