Los modelos de IA con miles de millones de parámetros entrenados en escáneres cerebrales no logran predecir qué tan bien piensas, mientras que una medida estadística simple lo logra, y sin necesidad de GPU ni preentrenamiento. Ese es el hallazgo de un nuevo estudio que descubre un punto ciego fundamental en los modelos cerebrales más avanzados de hoy en día.
La investigación
Giovanni Marraffini y sus colegas del Instituto Nacional Francés de Investigación en Ciencias y Tecnologías Digitales (Inria) probaron tres modelos fundamentales del cerebro (BFM) de última generación —grandes sistemas de IA preentrenados con datos de resonancia magnética funcional de miles de personas. Evaluaron qué tan bien cada modelo podía predecir el rendimiento cognitivo individual, utilizando pruebas cognitivas estándar de grandes conjuntos de datos públicos como el Human Connectome Project.
El resultado fue sorprendente: todos los BFM predijeron la cognición peor que una regresión lineal simple que utiliza la matriz de conectividad funcional (FC) —una matriz de aproximadamente 80,000 números que describen correlaciones por pares entre regiones cerebrales. Peor aún, los modelos más grandes tuvieron un rendimiento inferior: la versión de 650 millones de parámetros de BrainLM rindió menos que su contraparte de 111 millones de parámetros.
El equipo rastreó el problema hasta lo que llaman un problema de asignación de varianza. Los BFM se entrenan para reconstruir la señal de fMRI con la mayor precisión posible, lo que significa que se centran en los componentes de varianza más grandes y dominantes, pero estos son en gran medida ruido para la cognición. Crucialmente, los modelos destruyen la co-asimetría de tercer orden —una medida estadística que captura relaciones asimétricas y no gaussianas entre regiones cerebrales— que resulta ser mucho más predictiva de la cognición que las correlaciones ordinarias.
Para recuperar lo que los BFM pierden, los investigadores diseñaron un pipeline lineal simple: proyectar la señal de fMRI en el subespacio que mejor preserva la co-asimetría, luego calcular la FC en ese subespacio. Este método —que no requiere GPU ni preentrenamiento— superó a la FC bruta y a todos los BFM en todos los conjuntos de datos y parcelaciones cerebrales probados. Incluso igualó el rendimiento máximo del pase directo de BrainLM después de un ajuste fino dirigido.
Por qué es importante
Este hallazgo tiene implicaciones profundas para cómo entendemos y medimos la inteligencia. Las señales cerebrales más relevantes cognitivamente pueden no ser las más fuertes u obvias; son patrones sutiles de orden superior que los modelos de IA convencionales ignoran. Para cualquier persona interesada en sus propias habilidades cognitivas, sugiere que medidas simples y bien elegidas pueden ser más informativas que los complejos algoritmos de caja negra.
Importante, el estudio revela que el cuello de botella en la IA cerebral actual no es la arquitectura o el tamaño del modelo, sino el propio objetivo de preentrenamiento. Al cambiar el enfoque hacia las estadísticas de tercer orden, los modelos futuros podrían volverse más simples y precisos a la vez.
Qué puedes hacer
Aunque no puedas extraer la co-asimetría de tu cerebro en casa, puedes apreciar que la cognición surge de interacciones complejas y no lineales. Participar en actividades que desafíen tu cerebro —como rompecabezas, aprender nuevas habilidades o entrenamiento cognitivo— puede fortalecer estas conexiones sutiles. Y cuando escuches afirmaciones sobre IA que predice la inteligencia, recuerda que a veces menos es más: la medida simple correcta puede superar a un modelo de mil millones de parámetros.
Fuente: arXiv q-bio.NC
¿Curioso acerca de tu propio cerebro? Realiza nuestro test de CI adaptativo gratuito o prueba 306 niveles de entrenamiento cerebral.