¿Los modelos de lenguaje y visión piensan más como humanos? No siempre, según un nuevo estudio

3 junio 2026 · 2 min de lectura · Investigación

Los modelos de lenguaje grandes (LLM) son herramientas poderosas para comprender cómo los humanos procesan el lenguaje, pero agregar entrenamiento de lenguaje y visión no siempre hace que sus representaciones textuales sean más humanas. En un nuevo estudio publicado en arXiv, los investigadores Jinzhou Wu, Zhengwu Ma, Jixing Li, Baoping Tang y Zitong Lu compararon LLM y modelos de lenguaje y visión (VLM) estrechamente emparejados para ver si el preentrenamiento multimodal mejora la alineación con la actividad cerebral humana y los movimientos oculares durante la lectura natural.

La investigación

El equipo utilizó un conjunto de datos de respuestas de fMRI de toda la corteza y sacadas sincronizadas de seguimiento ocular de humanos leyendo oraciones naturales. Compararon pares de LLM y VLM que eran idénticos excepto por el historial de entrenamiento multimodal, controlando la entrada visual en línea o la fusión intermodal. Los resultados mostraron que los VLM no tienen una ventaja global y uniforme sobre los LLM en la alineación con las respuestas neuronales y conductuales humanas. En cambio, las representaciones internas del lenguaje en los LLM fueron el factor clave para modelar el procesamiento humano del texto. Sin embargo, cuando las oraciones tenían un contenido semántico visual más fuerte, los VLM mostraron mejoras selectivas, con evidencia convergente de las alineaciones de fMRI y seguimiento ocular.

Por qué es importante

Para cualquiera que sienta curiosidad por su propia cognición, este estudio sugiere que, si bien agregar información visual a veces puede ayudar a los modelos de IA a imitar la lectura humana, el núcleo de la comprensión del lenguaje sigue estando en el lenguaje mismo. Destaca la importancia de estudiar cómo los diferentes tipos de aprendizaje —solo con palabras o con palabras e imágenes— moldean nuestras representaciones mentales. En la práctica, significa que si quieres mejorar tu comprensión lectora, centrarte en las habilidades lingüísticas (como el vocabulario y la gramática) podría ser más efectivo que intentar visualizarlo todo.

Qué puedes hacer

Para agudizar tu procesamiento del lenguaje, prueba actividades que desafíen tus habilidades verbales —como leer textos complejos, aprender palabras nuevas o hacer crucigramas. Estos ejercicios fortalecen las redes del lenguaje en tu cerebro, de manera similar a cómo los LLM se benefician de más entrenamiento lingüístico. Y si tiendes a pensar visualmente, ten en cuenta que podrías tener ventaja al procesar contenido descriptivo y rico en imágenes.

Fuente: arXiv q-bio.NC

¿Curioso sobre tu propio cerebro? Haz nuestro test de CI adaptativo gratuito o prueba 306 niveles de entrenamiento cerebral.

¿Curioso por conocer tu propio CI?

Realiza nuestro test adaptativo gratuito y científicamente diseñado a través de 7 dominios cognitivos. Sin registro.

Realizar test gratuito

¿Los modelos de lenguaje y visión piensan más como humanos? No siempre, según un nuevo estudio

La investigación

Por qué es importante

Qué puedes hacer

¿Curioso por conocer tu propio CI?

Publicaciones relacionadas

Un vaso diario de zumo de fruta o batido reduce los puntajes de depresión, según un estudio

Cerebro vs. IA: Por Qué los Mecanismos de Aprendizaje Podrían Ser Fundamentalmente Diferentes

Por qué la IA tiene dificultades para ver el mundo como nosotros: el problema de vinculación

La cafeína le roba a tu cerebro el sueño profundo, incluso si duermes 8 horas