Kann eine fortgeschrittene künstliche Intelligenz wirklich Entscheidungskontrolle ausüben, oder ist sie lediglich in einer Schleife automatischer Nachahmung von Mustern gefangen? Eine kognitionswissenschaftliche Studie mit der psychologischen „Stroop-Aufgabe“ zeigt eine grundlegende Einschränkung der Aufmerksamkeitsmechanismen großer Sprachmodelle (LLMs).
Die Forschung
Unter der Leitung des Forschers Suketu Patel und eines Expertenteams zielte die Studie darauf ab, strukturelle Unterschiede zwischen transformerbasierter maschineller und menschlicher kognitiver Aufmerksamkeit zu untersuchen. Die Forscher nutzten den Stroop-Test, einen klassischen klinischen Test, bei dem Farbwörter in abweichender Tintenfarbe gedruckt sind, um die Exekutivkontrolle und die Fähigkeit, automatische Reaktionen zu unterdrücken, zu bewerten. Getestet wurden führende Modelle wie GPT-5, Claude Opus 4.1 und Gemini 2.5.
Die Ergebnisse zeigten, dass LLMs zwar kurze Sequenzen effizient verarbeiten, ihre Exekutivkontrolle jedoch mit zunehmender Tokenlänge zusammenbricht. Bei einer kurzen Liste von fünf nicht übereinstimmenden Wörtern schnitten die Modelle gut ab. Mit längeren Listen fiel die Genauigkeit jedoch katastrophal ab. Beispielsweise erreichte GPT-4o bei 5 Wörtern 91% Genauigkeit, fiel bei 10 Wörtern auf 57% und bei 40 Wörtern auf nur 15%. Claude 3.5 Sonnet blieb bis zu 20 Wörtern stabil, fiel aber bei 40 Wörtern auf 24%. In gemischten Listen mit sowohl passenden als auch nicht passenden Farben sank die maschinelle Genauigkeit bei nicht passenden Items auf nahezu 0%, was einen vollständigen Verlust der Aufgabenorientierung offenbarte. Identische Muster wurden bei den nächsten Generationen – GPT-5, Claude Opus 4.1 und Gemini 2.5 – bestätigt.
Menschen hingegen können über lange Sequenzen hinweg eine stabile Genauigkeit aufrechterhalten. Sowohl Menschen als auch LLMs sind grundlegend besser im Lesen von Wörtern als im Benennen von Farben trainiert. Doch das menschliche Gehirn kann top-down Exekutivkontrolle ausüben, um den automatischen Impuls des Wortlesens zu unterdrücken und den Fokus rein zu halten. Der totale Leistungsabfall der LLMs offenbart eine grundlegende architektonische Einschränkung synthetischer Aufmerksamkeit im Vergleich zur biologischen Aufmerksamkeit, wie in PNAS Nexus veröffentlicht.
Warum das wichtig ist
Diese Studie hebt eine kognitive Stärke hervor, die Sie täglich nutzen: inhibitorische Kontrolle. Wenn Sie einen ablenkenden Gedanken ignorieren oder einer Gewohnheit widerstehen, nutzen Sie dieselben neuronalen Mechanismen, die es Ihnen erlauben, den Stroop-Test zuverlässig zu absolvieren. Zu verstehen, dass Ihr Gehirn unter kognitiver Belastung den Fokus behalten kann – während selbst die fortschrittlichste KI dazu nicht in der Lage ist – unterstreicht den Wert des Aufmerksamkeitstrainings. Ihre Fähigkeit, bei der Sache zu bleiben, besonders in langen, komplexen Situationen, ist ein echtes kognitives Kapital.
Was Sie tun können
Ihre Exekutivkontrolle lässt sich schärfen. Versuchen Sie Gehirntrainingsübungen, die kognitive Flexibilität betonen, wie das Wechseln zwischen Regeln oder Aufgaben. Spiele wie der Stroop-Test selbst sind online verfügbar; regelmäßiges Üben kann Ihre Fähigkeit verbessern, automatische Reaktionen zu unterdrücken. Kontinuierliches Training mit herausfordernden kognitiven Aufgaben kann helfen, Ihre Aufmerksamkeitsspanne zu erhalten und sogar zu steigern.
Quelle: Neuroscience News
Neugierig auf Ihr eigenes Gehirn? Machen Sie unseren kostenlosen adaptiven IQ-Test oder probieren Sie 306 Gehirntrainings-Level.