Когда вы видите красное яблоко на синей тарелке, ваш мозг мгновенно понимает, что красный цвет принадлежит яблоку, а не тарелке. Эта способность — связывать такие признаки, как цвет, форма и текстура, с правильным объектом — называется связыванием. Новое исследование из лаборатории Кординга Пенсильванского университета (Lianghuan Huang, Yihao Li, Saeed Salehi, Yingshan Chang, Ansh Soni и Konrad P. Kording), принятое на ICML 2026, показывает, что даже самые современные Vision Transformers (ViTs) часто не справляются с этой фундаментальной когнитивной задачей, особенно когда объекты имеют общие признаки.
Исследование
Команда формализовала проблему связывания с помощью теории информации и разработала метод зондирования для измерения того, сколько информации о связывании закодировано в представлениях модели. Они протестировали несколько предварительно обученных ViTs на наборах данных, предназначенных для проверки связывания, таких как изображения с перекрывающимися объектами, общими признаками (например, два красных круга) и естественными сценами. Ключевой вывод: информация о связывании присутствует, но слаба, особенно в токене [CLS] (обобщающем токене для классификации). Пространственные токены работали лучше, но в целом модели часто неправильно приписывали признаки не тому объекту, что отражает распространённый сбой в задачах визуального мышления. Например, в сценах с двумя объектами одного цвета ViTs часто путали, у какого объекта какой цвет, что приводило к снижению точности до 30% по сравнению с людьми.
Почему это важно
Для человеческого познания связывание происходит автоматически и без усилий — мы даже не задумываемся об этом. Но это исследование показывает, что наш мозг выполняет сложные вычисления, которые не может воспроизвести даже лучший ИИ. Понимание связывания помогает объяснить, почему ИИ можно обмануть состязательными примерами или он с трудом справляется со сценами с несколькими объектами. Для вашего мозга связывание опирается на внимание и рабочую память; когда они дают сбой (например, при многозадачности), вы испытываете те же ошибки — например, кладёте молоко в шкаф. Улучшение способности фокусироваться и удерживать в уме несколько признаков может обострить ваше визуальное мышление.
Что вы можете сделать
Тренируйте способность мозга к связыванию: практикуйте игры на визуальный поиск, где нужно сопоставлять признаки (например, найти синий квадрат среди красных квадратов и синих кругов). Также ограничьте многозадачность — когда внимание разделено, связывание страдает. Попробуйте упражнения на осознанность, фокусируясь на одном объекте, отмечая его цвет, текстуру и форму вместе.
Источник: arXiv q-bio.NC
Хотите узнать свой мозг? Пройдите наш бесплатный адаптивный IQ-тест или попробуйте 306 уровней тренировки мозга.