Die Anthropic-Studie (2025)

didaktische Konsequenzen für Schule und Unterricht

Einordnung der Studie

Gegenstand und Untersuchungsrahmen

Die Anthropic-Studie ist eine empirische Untersuchung der Forscher Judy Hanwen Shen und Alex Tamkin aus dem Forschungsumfeld des KI-Unternehmens Anthropic. Untersucht wurde, wie sich unterschiedliche Formen der Nutzung künstlicher Intelligenz auf den Erwerb neuer fachlicher Kompetenzen auswirken. An der Studie nahmen überwiegend jüngere Softwareentwickler teil, die über grundlegende Programmiererfahrung verfügten, jedoch mit der untersuchten Programmbibliothek nicht vertraut waren.

Die Studienteilnehmer wurden zufällig zwei Gruppen zugeteilt. Eine Gruppe arbeitete beim Lösen der Aufgaben mit KI-Unterstützung, die andere ohne KI allein auf Grundlage von Dokumentation und Recherche. Beide Gruppen bearbeiteten identische Aufgaben unter vergleichbaren Zeitbedingungen. Anschließend wurde ihr Verständnis der zugrunde liegenden Konzepte in einem Wissenstest überprüft.

Untersucht wurde dabei nicht primär die Geschwindigkeit oder formale Korrektheit der Ergebnisse, sondern der begriffliche Lernerfolg sowie die Fähigkeit zur Analyse und zum Umgang mit Fehlern. Die Studie erlaubt damit einen systematischen Vergleich unterschiedlicher Lern- und Arbeitsweisen unter Bedingungen künstlicher Intelligenz und bildet die empirische Grundlage für die folgenden didaktischen Übertragungen.

1. Zentrale Befunde der Studie

KI-Einsatz und Lernerfolg

Die Studie von Anthropic identifiziert drei Befunde, deren Aussagekraft über den Kontext der Softwareentwicklung hinausreicht.

Erstens zeigt sich ein negativer Zusammenhang zwischen delegierendem KI-Einsatz und begrifflichem Lernerfolg:

Lernende, die Aufgaben vollständig oder schrittweise an KI auslagern,
gelangen schneller zu formalen Lösungen,
entwickeln jedoch ein deutlich geringeres tragfähiges Verständnis.

Zweitens hängt der Lernerfolg nicht von der bloßen Nutzung von KI ab, sondern von der Art der Nutzung:

lernhemmend wirkt die KI, wenn sie als Problemlöser fungiert,
lernförderlich bleibt sie, wenn sie erklärend, spiegelnd oder rückfragend eingesetzt wird.

Drittens reduziert KI-Nutzung die produktive Auseinandersetzung mit Fehlern:

weniger eigene Irrtümer,
weniger erzwungene Korrekturen,
geringerer Kompetenzaufbau.

Diese Befunde lassen sich ohne Bruch auf schulische Lernprozesse übertragen.

2. Transfer auf schulische Lernprozesse

Lernprozesse zwischen Ergebnis und Begriffsbildung

Der Transfer auf schulische Lernprozesse erfordert eine Klärung dessen, was Lernen jenseits von Ergebnissen strukturell ausmacht und worin sein eigentlicher Gegenstand liegt.

2.1 Lernen als Aufbau innerer Modelle

Schulisches Lernen zielt nicht primär auf richtige Ergebnisse, sondern auf den Aufbau stabiler innerer Modelle. Dies gilt gleichermaßen für:

mathematische Begriffe,
naturwissenschaftliche Konzepte,
sprachliche Strukturen,
historische Zusammenhänge.

Problematisch wird die KI dort, wo sie kognitive Zwischenschritte ersetzt, die für diesen Modellaufbau notwendig sind:

Hypothesenbildung entfällt,
Irrtümer werden vermieden,
Korrekturen werden delegiert.

Folge ist ein Lernen, das bei äußerer Reproduktion stehen bleibt.

Für die Schule gilt daher:
Die KI kann Ergebnisse liefern, sie kann jedoch keine Abstraktion ersetzen.

2.2 Die Rolle des Fehlers im Lernprozess

Ein besonders aufschlussreicher Befund betrifft den Umgang mit Fehlern. Die Kontrollgruppe ohne KI machte mehr Fehler und lernte gerade dadurch nachhaltiger.

Fehler erfüllen im schulischen Lernen mehrere Funktionen:

Sie erzwingen begriffliche Präzisierungen.
Sie machen implizite Annahmen sichtbar.
Sie erzeugen kognitive Spannung, aus der Lernen entsteht.

Die KI reduziert diese Fehlerhäufigkeit:

durch frühe Korrekturen,
durch fehlerfreie Lösungsvorschläge.

Damit entfällt ein zentraler Motor des Lernens.

Didaktische Konsequenz:
Fehlerarmut ist kein Qualitätsmerkmal von Unterricht, sondern kann ein Warnsignal für ausbleibende Lernprozesse sein.

2.3 Produktivität und Lernen als unterschiedliche Zielgrößen

Die Studie widerlegt die Annahme, Effizienzgewinne gingen automatisch mit Lerngewinnen einher. Beim Erwerb neuer Inhalte zeigt sich ein Zielkonflikt:

hohe Produktivität begünstigt Ergebnisqualität,
hohe kognitive Anstrengung begünstigt Kompetenzaufbau.

Schulisches Lernen ist strukturell auf den zweiten Pol ausgerichtet. Ein KI-Einsatz, der primär auf:

Zeitersparnis oder
Ergebnisoptimierung

zielt, verfehlt den Bildungsauftrag der Schule.

3. Methodische Konsequenzen

Die Unterrichtsebene

Aus diesen Befunden ergeben sich klare methodische Leitlinien.

3.1 KI als Reflexionsinstrument, nicht als Lösungsmaschine

Die KI sollte im Unterricht nicht zur Generierung fertiger Produkte eingesetzt werden, sondern zur:

Erklärung von Lösungswegen,
Begründung von Entscheidungen,
Gegenprüfung eigener Ergebnisse,
Klärung begrifflicher Zusammenhänge.

Geeignet sind Aufgabenformate, bei denen:

die KI zugelassen ist,
der Lernende jedoch gezwungen bleibt,
gezielte Verständnisfragen zu formulieren und
Antworten kritisch einzuordnen.

3.2 Verzögerung statt Beschleunigung

Didaktisch tragfähig ist ein zeitlich gestufter KI-Einsatz:

Phase 1: eigenständige Bearbeitung ohne KI
Phase 2: Vergleich mit KI-Vorschlägen
Phase 3: Analyse von Abweichungen und Fehlern

So bleibt die produktive Irritation erhalten, während die KI eine nachgeordnete Funktion übernimmt.

3.3 Aufgabenformate mit Überprüfungszwang

Die Aufgaben müssen so gestaltet sein, dass die bloße Delegation nicht zum Ziel führt. Besonders geeignet sind:

Begründungsaufgaben,
Transferaufgaben,
Fehleranalysen,
Vergleichs- und Bewertungsformate.

Diese Formate erzwingen eine aktive Auseinandersetzung und entwerten reines Kopieren.

4. Didaktische Konsequenzen

Die strukturelle Ebene

Auf struktureller Ebene betreffen die Konsequenzen des KI-Einsatzes vor allem die Organisation von Leistungsbewertung, Prüfungsformaten und die explizite Rahmung von Lernprozessen.

4.1 Neubewertung von Leistungsnachweisen

Unter Bedingungen einer permanenten KI-Verfügbarkeit verliert das fertige Produkt als Leistungsnachweis an Aussagekraft. In den Vordergrund treten:

der Weg zur Lösung,
die Qualität der Begründung,
die Fähigkeit zur Kritik und Revision,
der reflektierte Einsatz von Hilfsmitteln.

Die Studie liefert damit ein starkes Argument für eine prozessorientierte Leistungsbewertung.

4.2 Explizite KI-Didaktik statt impliziter Nutzung

Das zentrale Risiko liegt nicht im KI-Einsatz selbst, sondern in seiner stillschweigenden Integration. Ohne explizite Reflexion entwickeln die Schülerinnen und Schüler Nutzungsgewohnheiten, die:

kurzfristig entlasten,
langfristig Kompetenz abbauen.

Notwendig ist daher eine systematische Thematisierung:

Wann unterstützt die KI das Lernen?
Wann behindert sie Lernprozesse?
Welche Nutzungsformen sind didaktisch legitim?

Die KI-Kompetenz ist damit Teil der allgemeinen Lernkompetenz.

5. Fazit

Die Frage nach dem Subjekt des Denkens

Die Anthropic-Studie bestätigt eine klassische bildungstheoretische Einsicht unter veränderten technologischen Bedingungen:

Lernen setzt Anstrengung voraus.
Lernen entsteht durch Irritation.
Lernen braucht Fehler.

Die KI kann Lernprozesse unterstützen, wenn sie der Erklärung und Reflexion dient. Sie unterminiert das Lernen dort, wo sie Denkprozesse ersetzt.

Entscheidend ist nicht die Präsenz von KI, sondern die Frage, wer denkt.

Kommentiertes Quellenverzeichnis

1. Empirische Grundlage: Lernen unter KI-Bedingungen

How AI Impacts Skill Formation
Shen, Judy Hanwen; Tamkin, Alex (2026): How AI Impacts Skill Formation. arXiv:2601.20245, Version 2 (eingereicht 28. Januar 2026, revidiert 1. Februar 2026).
DOI: 10.48550/arXiv.2601.20245.

Kommentar:
Die Studie untersucht in einem randomisierten Experimentaldesign, wie sich der Einsatz künstlicher Intelligenz beim Erwerb neuer Fähigkeiten auf begriffliches Verständnis, Analysefähigkeit und Fehlerverarbeitung auswirkt. Zentrales Ergebnis ist die Identifikation unterschiedlicher Lern- und Nutzungswege, die trotz vergleichbarer Ergebnisse zu deutlich divergierenden Kompetenzniveaus führen. Delegierende Nutzungsformen erweisen sich als lernhemmend, erklärungs- und reflexionsorientierte Nutzungsformen hingegen als lernverträglich. Die Studie bildet die empirische Grundlage für die im Text entwickelte Typologie von Lernwegen sowie für die didaktische Neubewertung von Leistungsnachweisen.

2. Bildungstheoretische Grundlagen des Lernbegriffs

Erziehung zur Mündigkeit
Adorno, Theodor W. (1971): Erziehung zur Mündigkeit. Frankfurt am Main.

Kommentar:
Adorno versteht Bildung als aktiven Prozess der Selbstbestimmung, der sich nicht in Ergebnisproduktion erschöpft. Die im Text zentrale Differenz zwischen technischer Ergebniserzeugung und begrifflicher Durchdringung ist an diesen Bildungsbegriff anschlussfähig.

Neue Studien zur Bildungstheorie und Didaktik
Klafki, Wolfgang (1996): Neue Studien zur Bildungstheorie und Didaktik. Weinheim.

Kommentar:
Klafkis Theorie der kategorialen Bildung begründet den Vorrang von Begriffsbildung, Strukturverständnis und Urteilskraft vor bloßer Wissensreproduktion. Sie liefert den bildungstheoretischen Hintergrund für die im Text formulierten didaktischen Konsequenzen.

3. Lernen, Fehler und kognitive Anstrengung

Mind in Society
Vygotsky, Lew S. (1978): Mind in Society. Cambridge, MA.

Kommentar:
Vygotskys Arbeiten zur Zone der nächsten Entwicklung und zur Bedeutung von Irritation und Fehlern stützen die These, dass Lernen durch kognitive Spannung und nicht durch reibungslose Lösungserzeugung voranschreitet.

Making Things Hard on Yourself, but in a Good Way
Bjork, Robert A.; Bjork, Elizabeth L. (2011): Making Things Hard on Yourself, but in a Good Way. In: Psychology and the Real World.

Kommentar:
Die Forschung zu „desirable difficulties“ zeigt, dass Verzögerung, Irrtum und bewusste Anstrengung zentrale Bedingungen nachhaltigen Lernens sind. Diese Befunde stützen die im Text formulierte Kritik an beschleunigungsorientiertem KI-Einsatz.

4. Leistungsbewertung und Prozessperspektive

Unterrichtsqualität und Lehrerprofessionalität
Helmke, Andreas (2017): Unterrichtsqualität und Lehrerprofessionalität. Seelze.

Kommentar:
Helmke liefert eine empirisch fundierte Grundlage für prozessorientierte Leistungsbewertung. Die Verschiebung vom Produkt zur Begründung und zum Lösungsweg ist mit diesem Ansatz vereinbar.

Kultusministerkonferenz
Kultusministerkonferenz (KMK): Bildungsstandards und Kompetenzmodelle (diverse Beschlüsse).

Kommentar:
Die Kompetenzorientierung der KMK bildet den normativen Rahmen für die im Text geforderte Neubewertung von Leistungsnachweisen und Prüfungsformaten.

5. Künstliche Intelligenz als didaktischer Gegenstand

Artificial Intelligence in Education
Holmes, Wayne; Bialik, Maya; Fadel, Charles (2019): Artificial Intelligence in Education. Boston.

Kommentar:
Die Autoren plädieren für eine explizite KI-Didaktik, die technische Unterstützung nicht stillschweigend integriert, sondern zum Gegenstand bewusster Reflexion macht. Diese Perspektive stützt die im Text formulierte Forderung nach transparenter und verantwortlicher KI-Nutzung.

Lernen im KI-Zeitalter