Stroop-Test zeigt: KI stößt an ihre Aufmerksamkeitsgrenzen – der menschliche Fokus hält mit

7 Juni 2026 · 2 Min. Lesezeit · Forschung

Kann eine fortgeschrittene künstliche Intelligenz wirklich Entscheidungskontrolle ausüben, oder ist sie lediglich in einer Schleife automatischer Nachahmung von Mustern gefangen? Eine kognitionswissenschaftliche Studie mit der psychologischen „Stroop-Aufgabe“ zeigt eine grundlegende Einschränkung der Aufmerksamkeitsmechanismen großer Sprachmodelle (LLMs).

Die Forschung

Unter der Leitung des Forschers Suketu Patel und eines Expertenteams zielte die Studie darauf ab, strukturelle Unterschiede zwischen transformerbasierter maschineller und menschlicher kognitiver Aufmerksamkeit zu untersuchen. Die Forscher nutzten den Stroop-Test, einen klassischen klinischen Test, bei dem Farbwörter in abweichender Tintenfarbe gedruckt sind, um die Exekutivkontrolle und die Fähigkeit, automatische Reaktionen zu unterdrücken, zu bewerten. Getestet wurden führende Modelle wie GPT-5, Claude Opus 4.1 und Gemini 2.5.

Die Ergebnisse zeigten, dass LLMs zwar kurze Sequenzen effizient verarbeiten, ihre Exekutivkontrolle jedoch mit zunehmender Tokenlänge zusammenbricht. Bei einer kurzen Liste von fünf nicht übereinstimmenden Wörtern schnitten die Modelle gut ab. Mit längeren Listen fiel die Genauigkeit jedoch katastrophal ab. Beispielsweise erreichte GPT-4o bei 5 Wörtern 91% Genauigkeit, fiel bei 10 Wörtern auf 57% und bei 40 Wörtern auf nur 15%. Claude 3.5 Sonnet blieb bis zu 20 Wörtern stabil, fiel aber bei 40 Wörtern auf 24%. In gemischten Listen mit sowohl passenden als auch nicht passenden Farben sank die maschinelle Genauigkeit bei nicht passenden Items auf nahezu 0%, was einen vollständigen Verlust der Aufgabenorientierung offenbarte. Identische Muster wurden bei den nächsten Generationen – GPT-5, Claude Opus 4.1 und Gemini 2.5 – bestätigt.

Menschen hingegen können über lange Sequenzen hinweg eine stabile Genauigkeit aufrechterhalten. Sowohl Menschen als auch LLMs sind grundlegend besser im Lesen von Wörtern als im Benennen von Farben trainiert. Doch das menschliche Gehirn kann top-down Exekutivkontrolle ausüben, um den automatischen Impuls des Wortlesens zu unterdrücken und den Fokus rein zu halten. Der totale Leistungsabfall der LLMs offenbart eine grundlegende architektonische Einschränkung synthetischer Aufmerksamkeit im Vergleich zur biologischen Aufmerksamkeit, wie in PNAS Nexus veröffentlicht.

Warum das wichtig ist

Diese Studie hebt eine kognitive Stärke hervor, die Sie täglich nutzen: inhibitorische Kontrolle. Wenn Sie einen ablenkenden Gedanken ignorieren oder einer Gewohnheit widerstehen, nutzen Sie dieselben neuronalen Mechanismen, die es Ihnen erlauben, den Stroop-Test zuverlässig zu absolvieren. Zu verstehen, dass Ihr Gehirn unter kognitiver Belastung den Fokus behalten kann – während selbst die fortschrittlichste KI dazu nicht in der Lage ist – unterstreicht den Wert des Aufmerksamkeitstrainings. Ihre Fähigkeit, bei der Sache zu bleiben, besonders in langen, komplexen Situationen, ist ein echtes kognitives Kapital.

Was Sie tun können

Ihre Exekutivkontrolle lässt sich schärfen. Versuchen Sie Gehirntrainingsübungen, die kognitive Flexibilität betonen, wie das Wechseln zwischen Regeln oder Aufgaben. Spiele wie der Stroop-Test selbst sind online verfügbar; regelmäßiges Üben kann Ihre Fähigkeit verbessern, automatische Reaktionen zu unterdrücken. Kontinuierliches Training mit herausfordernden kognitiven Aufgaben kann helfen, Ihre Aufmerksamkeitsspanne zu erhalten und sogar zu steigern.

Quelle: Neuroscience News

Neugierig auf Ihr eigenes Gehirn? Machen Sie unseren kostenlosen adaptiven IQ-Test oder probieren Sie 306 Gehirntrainings-Level.

Neugierig auf Ihren eigenen IQ?

Machen Sie unseren kostenlosen, wissenschaftlich konzipierten adaptiven Test über 7 kognitive Bereiche. Keine Anmeldung erforderlich.

Kostenlosen Test starten

Stroop-Test zeigt: KI stößt an ihre Aufmerksamkeitsgrenzen – der menschliche Fokus hält mit

Die Forschung

Warum das wichtig ist

Was Sie tun können

Neugierig auf Ihren eigenen IQ?

Ähnliche Beiträge

Wie die mittleren Schichten von Whisper AI mit der menschlichen Gehirnaktivität beim Sprechen übereinstimmen

54.583 Gehirnscans kartieren Alterung der weißen Substanz und bestätigen die „Last in, First out“-Theorie

Neuromorphe Schaltkreise verbessern KI-Lernen aus wenigen Beispielen – auf dem Niveau des menschlichen Gehirns

Alzheimer und Parkinson teilen eine Gehirnsignatur, wie MRT-Studie zeigt