Decodificación de la semántica visual a partir de fMRI: el modelo Brain2Text mapea representaciones neuronales

15 junio 2026 · 2 min de lectura · Investigación

Investigadores han desarrollado un modelo de aprendizaje profundo que puede decodificar escáneres cerebrales de fMRI en descripciones escritas de lo que una persona está viendo, identificando las regiones cerebrales responsables de comprender el significado visual. El modelo, llamado Brain2Text, fue entrenado sin información visual y logra un rendimiento de vanguardia en la generación de subtítulos precisos para imágenes naturales complejas.

Qué encontró el estudio

Liderados por Feihan Feng y Jingxin Nie, el equipo utilizó datos de fMRI de participantes que veían imágenes naturales y entrenó una red neuronal para generar descripciones de texto. El modelo produjo subtítulos que capturaban el contenido semántico central, como "un perro corriendo sobre el césped" o "un grupo de personas en una playa". Es importante destacar que el modelo fue entrenado solo con pares de fMRI y texto, no con imágenes reales, lo que lo obligó a aprender la relación entre la actividad neuronal y el significado.

El análisis neuroanatómico reveló que las áreas visuales superiores, incluido el complejo MT+ (procesamiento de movimiento), la corteza visual de la vía ventral (reconocimiento de objetos) y la corteza parietal inferior (atención espacial), desempeñan roles críticos en el procesamiento semántico visual. El análisis por categorías mostró representaciones neuronales matizadas para dimensiones semánticas como animacidad (vivo vs. no vivo) y movimiento (estático vs. en movimiento), lo que sugiere que el cerebro distribuye estas características a través de una red de regiones.

Por qué es importante

Esta investigación une la IA y la neurociencia al proporcionar un marco interpretable para sondear cómo el cerebro construye significado a partir de la entrada visual. Para la persona promedio, entender que diferentes regiones cerebrales se especializan en diferentes aspectos semánticos puede informar estrategias de entrenamiento cognitivo. Por ejemplo, las tareas que involucran procesamiento de movimiento (como ver deportes) o reconocimiento de objetos (como la apreciación del arte) pueden fortalecer las redes neuronales correspondientes. Los hallazgos también son prometedores para desarrollar interfaces cerebro-computadora que restauren la comunicación en personas con parálisis o síndrome de enclaustramiento.

Qué puedes hacer

Para mejorar tu procesamiento semántico visual, participa en actividades que desafíen a tu cerebro a interpretar escenas: describe pinturas en detalle, juega al "Veo, veo" con imágenes complejas, o practica resumir en una oración lo que ves en una fotografía. Los ejercicios regulares de visualización mental también pueden fortalecer las vías neuronales involucradas.

Fuente: arXiv q-bio.NC

¿Sientes curiosidad por tu propio cerebro? Realiza nuestro test de CI adaptativo gratuito o prueba 306 niveles de entrenamiento cerebral.

¿Curioso por conocer tu propio CI?

Realiza nuestro test adaptativo gratuito y científicamente diseñado a través de 7 dominios cognitivos. Sin registro.

Realizar test gratuito

Decodificación de la semántica visual a partir de fMRI: el modelo Brain2Text mapea representaciones neuronales

Qué encontró el estudio

Por qué es importante

Qué puedes hacer

¿Curioso por conocer tu propio CI?

Publicaciones relacionadas

Cómo las Redes Neuronales Recurrentes Lineales Aprenden a Integrar Ruido Blanco: Una Teoría Matemática

Cómo Aprende el Neocórtex: Aprendizaje Predictivo Basado en Errores a través de Circuitos Corticotalámicos

Nuevo modelo de IA revela cómo el cerebro organiza la visión, el sonido y el lenguaje

Nuevo Marco Matemático Revela Ciclos Cerebrales Ocultos en Datos de fMRI