Главная · Блог · Исследования

Разреженные автокодировщики раскрывают, как языковые модели отражают семантическую карту мозга

Разреженные автокодировщики раскрывают, как языковые модели отражают семантическую карту мозга

Группа исследователей из Гонконгского университета обнаружила механистическое объяснение того, почему промежуточные слои больших языковых моделей (LLM) лучше всего предсказывают активность мозга при обработке языка. Применяя разреженные автокодировщики (SAE) к моделям GPT-2 XL и Llama-3.1-8B, они разложили эти модели на 16 000–32 000 интерпретируемых признаков на слой, выявив, что одни семантические признаки восстанавливают 94% пиковой производительности кодирования мозга.

Исследование

В работе Дунсинь Го, Цзикунь Ву и Сю Мин Ю, принятой на конференции CoNLL 2025, использовались SAE для объединения механистической интерпретируемости с моделями нейронного кодирования. Они создали валидированную человеком таксономию (κ ≥ 0,74), показывающую, что семантические признаки обеспечивают почти всю предсказательную силу, значительно превосходя базовые модели, выровненные по дисперсии (p < 0,001, d = 1,31). Критически важно, что они проверили новую гипотезу: пять семантических подкатегорий, полученных из трех независимых нейронаучных программ, должны соответствовать разным областям мозга. Формальный тест на сходимость подтвердил это соответствие (Spearman ρ = 0,72, p < 0,001; гипергеометрическое p = 0,007). Кроме того, признаки SAE предсказывали время чтения у людей помимо лексических контролей (ΔlogLik = 38,4, p < 0,001), и исследовательский анализ показал, что мозг кодирует неожиданное семантическое содержание. Результаты были обобщены на английский, китайский и французский языки.

Почему это важно

Эта работа — значительный шаг в понимании загадки соответствия мозга и языка. Для всех, кто интересуется когнитивными процессами, она предполагает, что мозг категоризирует смысл высокоорганизованным образом — семантическая топография, параллельная внутренним представлениям ИИ-языковых моделей. Это означает, что ваш мозг может использовать аналогичные «карты признаков» для обработки идей, что может помочь в будущих стратегиях тренировки мозга или обучения, ориентированных на семантическую организацию.

Что вы можете сделать

Чтобы использовать это открытие, попробуйте организовывать новую информацию в семантические категории во время учебы. Например, изучая новое понятие, мысленно помещайте его рядом со связанными идеями. Это поможет согласовать естественную семантическую топографию вашего мозга, потенциально улучшая кодирование и воспроизведение памяти.

Источник: arXiv q-bio.NC

Хотите узнать свой мозг? Пройдите наш бесплатный адаптивный IQ-тест или попробуйте 306 уровней тренировки мозга.

Интересно узнать свой IQ?

Пройдите наш бесплатный научно разработанный адаптивный тест по 7 когнитивным доменам. Без регистрации.

Пройти бесплатный тест