Розріджені автокодувальники розкривають, як LLM віддзеркалюють семантичну карту мозку

25 травня 2026 · 2 хв читання · Дослідження

Команда дослідників з Гонконзького університету знайшла механістичне пояснення, чому проміжні шари великих мовних моделей (LLM) найкраще передбачають активність мозку під час обробки мови. Застосувавши розріджені автокодувальники (SAE) до GPT-2 XL та Llama-3.1-8B, вони розклали ці моделі на 16 000–32 000 інтерпретованих ознак на шар, виявивши, що лише семантичні ознаки відновлюють 94% пікової продуктивності кодування мозку.

Дослідження

У дослідженні Дунсінь Го, Цзікунь Ву та Сю Мін Ю, прийнятому на CoNLL 2025, використовувалися SAE для поєднання механістичної інтерпретованості з нейронними моделями кодування. Вони створили людську валідовану таксономію (κ ≥ 0.74), яка показує, що семантичні ознаки відповідають майже за всю прогностичну здатність, значно перевищуючи базові рівні, узгоджені за дисперсією (p < 0.001, d = 1.31). Критично важливо, що вони перевірили нове передбачення: п'ять семантичних підкатегорій, отриманих з трьох незалежних нейронаукових програм, повинні відображатися на окремих ділянках мозку. Формальний тест конвергенції підтвердив цю відповідність (Spearman ρ = 0.72, p < 0.001; гіпергеометричний p = 0.007). Крім того, ознаки SAE передбачали час читання людини, перевищуючи лексичні контролі (ΔlogLik = 38.4, p < 0.001), а попередній аналіз свідчить, що мозок кодує несподіваний семантичний вміст. Результати узагальнилися для англійської, китайської та французької мов.

Чому це важливо

Ця робота є значним кроком у розумінні загадки відповідності мозку та мови. Для тих, хто цікавиться когнітивістикою, це свідчить, що мозок категоризує значення високоорганізованим способом — семантичною топографією, яка паралельна внутрішнім представленням мовних моделей ШІ. Це означає, що ваш мозок може використовувати подібні «карти ознак» для обробки ідей, що може допомогти в майбутніх стратегіях тренування мозку або навчання, орієнтованих на семантичну організацію.

Що ви можете зробити

Щоб скористатися цим відкриттям, спробуйте організовувати нову інформацію в семантичні категорії під час навчання. Наприклад, коли вивчаєте нове поняття, подумки розміщуйте його поряд із пов'язаними ідеями. Це допомагає узгодити природну семантичну топографію мозку, потенційно покращуючи кодування та відтворення пам'яті.

Джерело: arXiv q-bio.NC

Цікавитесь власним мозком? Пройдіть наш безкоштовний адаптивний IQ-тест або спробуйте 306 рівнів тренування мозку.

Цікавитесь власним IQ?

Пройдіть наш безкоштовний науково розроблений адаптивний тест за 7 когнітивними доменами. Без реєстрації.

Пройти безкоштовний тест

Розріджені автокодувальники розкривають, як LLM віддзеркалюють семантичну карту мозку

Дослідження

Чому це важливо

Що ви можете зробити

Цікавитесь власним IQ?

Схожі публікації

Контекст змінює те, як ваш мозок представляє об'єкти: дослідження

Дорослий мозок використовує пренатальний генетичний посібник для пам'яті

Вчені виявили ділянку мозку, відповідальну за абстрактне мислення та творчість

Синантаптична ефективність, пояснена теорією інформації