Тест Струпа виявляє обмеження уваги ШІ порівняно з людською зосередженістю

7 червня 2026 · 2 хв читання · Дослідження

Чи може передовий штучний інтелект справді здійснювати контроль над прийняттям рішень, чи він лише замкнений у циклі автоматичного імітування патернів? Дослідження з когнітивної науки з використанням класичного психологічного "тесту Струпа" виявляє фундаментальне обмеження в механізмах уваги великих мовних моделей (LLM).

Дослідження

Очолюване дослідником Сукетом Пателем та групою експертів, дослідження мало на меті вивчити структурні розбіжності між увагою трансформерних машин та когнітивною увагою людини. Дослідники використали тест Струпа — чистий клінічний тест, де слова-кольори надруковані невідповідним кольором чорнила — для оцінки виконавчого контролю та здатності пригнічувати автоматичну реакцію. Команда протестувала передові моделі, зокрема GPT-5, Claude Opus 4.1 та Gemini 2.5.

Результати показали, що хоча LLM ефективно обробляють короткі послідовності, їхній виконавчий контроль руйнується зі збільшенням довжини токенів. З коротким списком із п'яти невідповідних слів моделі працювали добре. Однак зі збільшенням списку точність катастрофічно падала. Наприклад, GPT-4o досягла 91% точності на 5 словах, впала до 57% на 10 словах і знизилася до лише 15% на 40 словах. Claude 3.5 Sonnet залишалася стабільною до 20 слів, але впала до 24% на 40 словах. У змішаних списках, що містили як відповідні, так і невідповідні кольори, машинна точність впала майже до 0% для невідповідних елементів, що свідчить про повну втрату орієнтації на завдання. Ідентичні закономірності підтвердилися в системах наступного покоління, включаючи GPT-5, Claude Opus 4.1 та Gemini 2.5.

Натомість люди можуть підтримувати стабільну точність на довгих послідовностях. І люди, і LLM краще натреновані на читання слів, ніж на називання кольорів. Але людський мозок може здійснювати низхідний виконавчий контроль, щоб придушити автоматичний імпульс читання слів, зберігаючи фокус недоторканним. Повний колапс продуктивності LLM виявляє фундаментальне архітектурне обмеження синтетичної уваги порівняно з біологічною, як опубліковано в PNAS Nexus.

Чому це важливо

Це дослідження підкреслює ключову когнітивну силу, яку ви використовуєте щодня: гальмівний контроль. Коли ви ігноруєте думку, що відволікає, або чините опір звичці, ви використовуєте ті самі нейронні механізми, які дозволяють надійно виконувати тест Струпа. Розуміння того, що ваш мозок може підтримувати фокус під когнітивним навантаженням, тоді як навіть найсучасніший ШІ не може, підкреслює цінність тренування уваги. Ваша здатність залишатися зосередженим, особливо в довгих, складних ситуаціях, є справжнім когнітивним активом.

Що ви можете зробити

Ваш виконавчий контроль можна вдосконалити. Спробуйте вправи для тренування мозку, які наголошують на когнітивній гнучкості, наприклад, перемикання між правилами або завданнями. Ігри, як-от сам тест Струпа, доступні онлайн; їх практика може покращити вашу здатність пригнічувати автоматичні реакції. Регулярна практика зі складними когнітивними завданнями може допомогти підтримувати та навіть покращувати вашу здатність до концентрації.

Джерело: Neuroscience News

Цікавитеся власним мозком? Пройдіть наш безкоштовний адаптивний IQ тест або спробуйте 306 рівнів тренування мозку.

Цікавитесь власним IQ?

Пройдіть наш безкоштовний науково розроблений адаптивний тест за 7 когнітивними доменами. Без реєстрації.

Пройти безкоштовний тест

Тест Струпа виявляє обмеження уваги ШІ порівняно з людською зосередженістю

Дослідження

Чому це важливо

Що ви можете зробити

Цікавитесь власним IQ?

Схожі публікації

Як середні шари Whisper AI відповідають активності мозку під час мовлення

54 583 сканування мозку відобразили старіння білої речовини та підтвердили теорію «останній прийшов — перший пішов»

Нейроморфні схеми прискорюють навчання ШІ з кількох прикладів, змагаючись з людським мозком

Хвороби Альцгеймера та Паркінсона мають спільний мозковий сигнал, показує МРТ-дослідження