Imaginez un ordinateur lisant vos pensées sur une image que vous venez de voir — non pas à partir d'un appareil IRM, mais d'un simple bonnet recouvert d'électrodes. C'est exactement ce qu'a réalisé une nouvelle étude de chercheurs de plusieurs universités chinoises et de l'Université de Cambridge. Leur modèle, appelé MindAlign, peut décoder laquelle de 200 images une personne regarde à partir de ses signaux cérébraux EEG, avec une précision de 54,1 % — bien au-dessus du précédent record de 32,4 %.
La recherche
L'équipe, dirigée par Zexuan Chen et ses collègues, a construit une IA en trois parties qui connecte les enregistrements EEG, les images et les descriptions textuelles dans un espace virtuel partagé. Ils ont d'abord entraîné un encodeur EEG sur des données non étiquetées pour apprendre des modèles cérébraux généraux, puis l'ont aligné avec des représentations visuelles et textuelles à l'aide de l'apprentissage contrastif — enseignant essentiellement au modèle à faire correspondre les signaux cérébraux à l'image correcte et à sa description. Le modèle utilise des composants innovants comme l'adaptation spécifique au sujet (adaptée au cerveau de chaque personne) et l'attention par graphe sur les canaux EEG. Sur le benchmark Things-EEG2, MindAlign a atteint une précision top-5 de 83,4 %, ce qui signifie qu'il incluait souvent l'image correcte parmi ses cinq premières suppositions. Ils ont également testé sur des données MEG, montrant que l'approche se généralise à travers les méthodes d'enregistrement cérébral. Des tests statistiques (Wilcoxon apparié, p < 0,01) ont confirmé que les améliorations n'étaient pas dues au hasard.
Pourquoi c'est important
Cette recherche nous rapproche d'interfaces pensée-texte ou pensée-image qui ne nécessitent pas d'appareils IRM coûteux et encombrants. Les casquettes EEG sont portables et relativement peu coûteuses, ce qui les rend accessibles pour un usage quotidien — pensez à aider les personnes qui ne peuvent pas parler à communiquer, ou à de nouvelles façons d'interagir avec les ordinateurs. La découverte s'aligne également avec les neurosciences connues : les modèles de décodage du modèle correspondent aux premiers stades du traitement visuel, suggérant que l'IA apprend en fait des signatures neuronales significatives, et non du bruit statistique.
Ce que vous pouvez faire
Bien que vous ne puissiez pas encore essayer MindAlign chez vous, vous pouvez explorer votre propre vitesse de traitement visuel avec le test de QI gratuit sur iqgenio.com, qui comprend des tâches qui sollicitent la reconnaissance de formes et la mémoire visuelle — des compétences que cette recherche montre être profondément liées aux signaux cérébraux.
Source : arXiv q-bio.NC
Curieux de connaître votre propre cerveau ? Faites notre test de QI adaptatif gratuit ou essayez 306 niveaux d'entraînement cérébral.