Modelle · 14. April 2026

Claude Mythos: Die KI-Leistungsordnung

Claude Mythos

Die Regulierung der technischen Hochleistungsfähigkeit

I. Der Charakter des Modells

Claude Mythos verkörpert einen neuen Typ des Frontier-Modells, dessen Bedeutung sich aus der Verbindung seiner technischen Leistungsfähigkeit mit der institutionellen Form seiner Bereitstellung ergibt. Anthropic hat Mythos Preview im Rahmen von Project Glasswing auf einen ausgewählten Kreis von Partnern ausgerichtet, zu dem unter anderem Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, die Linux Foundation, Microsoft, NVIDIA und Palo Alto Networks gehören. Hinzu tritt ein weiterer Kreis von mehr als vierzig Organisationen, deren Aufgabe darin besteht, Schwachstellen sowohl im Bereich kritischer Software als auch im Bereich grundlegender Infrastruktur aufzuspüren und zu beheben. Zugleich erklärt das Unternehmen, daß es Mythos Preview vorerst nicht allgemein verfügbar machen will, weil auf dem Weg zu einem späteren sicheren Einsatz von Modellen dieser Klasse zunächst geeignete Schutzmechanismen entwickelt und unter realen Bedingungen erprobt werden müssen.

Damit tritt eine neue Form der Modellpolitik in den Markt ein. Im Zentrum steht nicht mehr allein die technische Überlegenheit eines Modells, sondern die institutionelle Ordnung seiner Bereitstellung. Entscheidend wird, welche Stufen zwischen der höchsten Leistungsfähigkeit und dem breiten Markt liegen, welchen Nutzerkreisen der Zugang eröffnet wird und durch welche Sicherungen sich die Überführung technischer Fähigkeiten in konkrete Anwendungen vollziehen läßt.

II. Die operative Reichweite

Die sicherheitspolitische Schärfe des Modells gründet auf einem deutlichen Fähigkeitsgewinn im Cyber-Bereich. Anthropic schreibt, daß Mythos Preview bereits tausende Zero-Day-Schwachstellen gefunden habe, viele davon mit hoher Schwere, und zwar in allen großen Betriebssystemen und Webbrowsern sowie in weiterer kritischer Software. In einzelnen Fällen handelte es sich um Schwachstellen, die jahrzehntelang unentdeckt geblieben waren. Anthropic nennt unter anderem ein 27 Jahre altes Problem in OpenBSD, eine 16 Jahre alte Schwachstelle in FFmpeg und eine Verkettung mehrerer Lücken im Linux-Kernel, die zu einer vollständigen Systemkontrolle führen konnte.

Besonders aufschlußreich ist die Untersuchung in der simulierten Unternehmensumgebung „The Last Ones“. Diese 32 Schritte umfassende Angriffssimulation bildet den Weg von der ersten Aufklärung bis zur vollständigen Netzwerkübernahme ab und würde nach Einschätzung des AISI für menschliche Fachleute rund zwanzig Stunden beanspruchen.

Mythos Preview war das erste Modell, das die in dieser Umgebung angelegte Angriffskette in 3 von 10 Versuchen vollständig bewältigte. Im Durchschnitt absolvierte es 22 der 32 Schritte, während Claude Opus 4.6 im Mittel 16 Schritte erreichte. Auch in den weiteren Vergleichsmaßstäben zeigt sich ein deutlicher Abstand. Auf CyberGym erreichte Mythos Preview 83,1 Prozent gegenüber 66,6 Prozent für Opus 4.6. Auf SWE-bench Pro lag Mythos bei 77,8 Prozent gegenüber 53,4 Prozent, auf SWE-bench Verified bei 93,9 Prozent gegenüber 80,8 Prozent, auf GPQA Diamond bei 94,6 Prozent gegenüber 91,3 Prozent, auf BrowseComp bei 86,9 Prozent gegenüber 83,7 Prozent und auf OSWorld Verified bei 79,6 Prozent gegenüber 72,7 Prozent. Auf Terminal-Bench 2.0 erreicht Mythos 82,0 Prozent; bei verlängerten Zeitlimits und den Anpassungen von Terminal-Bench 2.1 steigt der Wert auf 92,1 Prozent. Diese Werte beschreiben keinen marginalen Fortschritt, sondern einen Fähigkeitsabstand, der die restriktive Freigabelogik des Unternehmens plausibel macht.

III. Die Architektur des Zugangs

Anthropic ordnet diese Fähigkeit in eine gestufte Architektur der Freigabe ein. Die Partner von Project Glasswing erhalten Zugang zu Mythos Preview für klar bestimmte Aufgabenfelder, zu denen die lokale Schwachstellensuche, Black-Box-Tests von Binärdateien, die Endpunktsicherung und Penetrationstests gehören. Eine allgemeine Marktöffnung schließt das Unternehmen damit vorerst ausdrücklich aus. Ein kommendes Opus-Modell soll vielmehr als vermittelnde Stufe dienen, auf der sich neue Schutzmechanismen unter Bedingungen eines geringeren Risikoniveaus entwickeln und erproben lassen.

Diese vermittelnde Stufe ist nun Claude Opus 4.7. Anthropic beschreibt Opus 4.7 als jenes Modell, an dem die neuen Cyber-Sicherungen erstmals praktisch zur Anwendung kommen. Das Unternehmen hebt hervor, daß die Cyber-Fähigkeiten von Opus 4.7 hinter denen von Mythos Preview zurückbleiben und daß bereits im Training mit Maßnahmen gearbeitet wurde, welche diese Fähigkeiten gezielt dämpfen sollten. Parallel dazu führt Anthropic Systeme zur automatischen Erkennung und Blockierung verbotener oder hochriskanter Cyber-Anfragen ein und öffnet ein Cyber Verification Program für legitime Sicherheitsarbeit, insbesondere für die Schwachstellenforschung, für Penetrationstests und für das Red Teaming. So entsteht eine gegliederte Ordnung des Zugangs, in der die höchste Fähigkeitsstufe einem engen Kreis vorbehalten bleibt, während eine abgestufte Einsatzstufe unter weiter gefaßten, jedoch weiterhin kontrollierten Bedingungen bereitgestellt wird.

IV. Die ökonomische Einbettung

Die Preis- und Förderarchitektur spiegelt die gestufte Zugangsordnung wider: Während Anthropic Project-Glasswing-Teilnehmern 100 Millionen Dollar an Modellguthaben bereitstellt, liegt der spätere Preis für Mythos Preview mit 25 Dollar (Input) bzw. 125 Dollar (Output) je Million Token deutlich über dem Niveau von Opus 4.7, das preislich bei Opus 4.6 (5/25 Dollar) verbleibt.

Flankiert wird diese Architektur durch Sicherheitsinvestitionen. Anthropic hat 2,5 Millionen Dollar an Alpha-Omega und OpenSSF über die Linux Foundation sowie 1,5 Millionen Dollar an die Apache Software Foundation zugesagt, damit Maintainer offener Software ihre Sicherheitsarbeit an die veränderte Lage anpassen können. Zudem will das Unternehmen innerhalb von 90 Tagen öffentlich darlegen, welche Lehren aus Project Glasswing gezogen wurden und welche behobenen Schwachstellen und Verbesserungen sich offenlegen lassen. Auch darin zeigt sich ein charakteristisches Merkmal dieses Modells. Seine Einführung erfolgt nicht allein über Marktkanäle, sondern zugleich über Fördermittel, Offenlegungsregeln und koordinierte Lernprozesse.

V. Die Leistungsrelation zu Opus 4.7

An der Stellung von Opus 4.7 wird der Rang von Mythos sichtbar. Opus 4.7 ist das breit verfügbare Modell des Hauses, das gegenüber Opus 4.6 vor allem bei Coding, agentischen Anwendungen und visueller Verarbeitung zugelegt hat. Anthropic verweist zudem auf Fortschritte bei der visuellen Genauigkeit; XBOW berichtet in den von Anthropic veröffentlichten Testerzitaten von 98,5 Prozent auf seinem Visual-Acuity-Benchmark gegenüber 54,5 Prozent bei Opus 4.6.

Darin zeigt sich die neue Marktordnung. Das leistungsfähigste Modell des Hauses wird dem Markt nicht am weitesten geöffnet; die höchste Fähigkeitsstufe bleibt vielmehr einem kontrollierten Kreis vorbehalten. Damit verändert sich die Logik des Modellmarkts grundlegend.

VI. Die regulatorische Resonanz

Mythos ruft bereits vor einer breiten Marktöffnung regulatorische Vorfeldreaktionen hervor. Die Europäische Kommission teilte am 17. April 2026 mit, daß Anthropic mit ihr über verschiedene Modelle spricht, darunter auch Cyber-Modelle, die in der Europäischen Union noch nicht verfügbar sind. Nach Angaben des Kommissionssprechers verpflichtet der europäische Verhaltenskodex für allgemeine KI dazu, die Risiken eines Dienstes zu bewerten und zu mindern, selbst wenn dieser Dienst in Europa erst in Zukunft angeboten werden könnte.

Diese Vorlaufregulierung ist von grundsätzlicher Bedeutung. Sie zeigt, daß hochfähige Frontier-Modelle eine Aufsicht hervorrufen können, die sich an erwartbaren Wirkungen orientiert und nicht erst an bereits eingetretenen Schäden. Damit verändert sich der Zeithorizont der Regulierung. Sie folgt nicht mehr nur der Innovation, sondern versucht, deren nächste Eskalationsstufe vorwegzunehmen. Damit wird Mythos zum Bezugspunkt einer politischen Logik, in der sich Antizipation, Risikominderung und selektive Freigabe verbinden.

VII. Die Wettbewerbsdynamik

Die marktprägende Kraft von Mythos zeigt sich bereits an der Reaktion eines unmittelbaren Wettbewerbers. Reuters berichtete am 14. April 2026, daß OpenAI mit GPT-5.4-Cyber nur eine Woche nach der Vorstellung von Mythos ein eigenes Cyber-Modell ankündigte. Reuters beschreibt Mythos dabei ausdrücklich als Teil der kontrollierten Initiative Project Glasswing, innerhalb derer ausgewählte Organisationen das noch unveröffentlichte Claude Mythos Preview für defensive Cyber-Zwecke nutzen dürfen. Damit gewinnt Anthropic über das einzelne Modell hinaus Einfluß auf die Freigabelogik des Marktes selbst.

Aus dieser Entwicklung zeichnet sich eine neue Branchenkonvention ab. Frontier-Labore konkurrieren künftig nicht mehr nur um die höchste Leistung, sondern ebenso um die überzeugendste Form ihrer Staffelung, Aufsicht und sicherheitspolitischen Rahmung.

VIII. Die Ökonomie der Leistungsfähigkeit

Claude Mythos bezeichnet eine Lage, in der sich technische Potenz, institutionelle Verantwortung und staatliche Aufmerksamkeit verknüpfen. Anthropic selbst verknüpft Project Glasswing mit der Sicherung kritischer Infrastruktur und mit dem strategischen Interesse der Vereinigten Staaten und ihrer Verbündeten, in der KI-Technologie einen deutlichen Vorsprung zu wahren. Zugleich hat das Unternehmen nach eigenen Angaben detaillierte Gespräche mit Regierungsvertretern in den Vereinigten Staaten über die offensiven und defensiven Cyberfähigkeiten des Modells geführt. Die Entstehung solcher Modelle berührt damit nicht nur die Ökonomie der Softwareentwicklung, sondern auch die Ordnung der Cybersicherheit, die Normbildung der Regulierung und die strategische Balance zwischen Offenheit und Kontrolle.

Gerade darin liegt die eigentliche Bedeutung des Modells. Die technische Hochleistungsfähigkeit wird zum Gegenstand geordneter Zuteilung. Ein Labor entwickelt unter diesen Bedingungen nicht mehr nur Werkzeuge, sondern zugleich die Bedingungen ihrer legitimen Nutzung.

IX. Schlußfolgerung

Claude Mythos ist die erste klar sichtbare Ausprägung einer neuen Ordnung für besonders leistungsfähige KI. Anthropic verbindet hier Frontier-Leistung mit einem gestuften Zugang, ökonomischer Knappheit, regulatorischer Anschlußfähigkeit und sicherheitspolitischer Einbettung. Aus dieser Verbindung erwächst ein Präzedenzfall, der die künftige Freigabe sensibler Modelle voraussichtlich maßgeblich prägen wird.

Seine eigentliche historische Rolle liegt in der Form, die es der KI-Entwicklung geben wird. Mythos macht Hochleistungsfähigkeit zu einem Gegenstand geordneter Zuteilung. Gerade diese Ordnungsleistung könnte sich als der wichtigere Fortschritt erweisen als jeder einzelne Benchmarkwert.

Kommentiertes Quellenverzeichnis

Anthropic, Project Glasswing, 7. April 2026.
Die zentrale Primärquelle für den institutionellen Rahmen von Mythos. Hier finden sich sowohl die Aussagen zur begrenzten Verfügbarkeit als auch die Angaben zu Einsatzfeldern, Tokenpreisen, Fördermitteln und zur sicherheitspolitischen Einbettung.
Anthropic, Introducing Claude Opus 4.7, 16. April 2026.
Die maßgebliche Primärquelle für die Rolle von Opus 4.7 als öffentlich verfügbare Zwischenstufe mit Cyber-Sicherungen, für das Cyber Verification Program und für das Preisniveau des breit verfügbaren Schwestermodells.
UK AI Security Institute, Our evaluation of Claude Mythos Preview’s cyber capabilities, 13. April 2026.
Die wichtigste externe staatliche Evaluierung. Von besonderem Gewicht sind die Ergebnisse zur Angriffssimulation „The Last Ones“ sowie die 73-Prozent-Erfolgsquote bei Expert-Level-CTFs.
Reuters, Anthropic touts AI cybersecurity project with Big Tech partners, 7. April 2026.
Diese Quelle bestätigt aus unabhängiger Perspektive zentrale Angaben zu den gefundenen Schwachstellen, zum Umfang des Partnerkreises und zur politischen Aufmerksamkeit in den USA.
Reuters, AI-boosted hacks with Anthropic’s Mythos could have dire consequences for banks, 13. April 2026.
Wichtig für die Einordnung der finanziellen und infrastrukturellen Risiken, die mit Mythos für Banken und andere Betreiber älterer Systeme verbunden sind.
Reuters, OpenAI unveils GPT-5.4-Cyber a week after rival’s announcement, 14. April 2026.
Diese Quelle ist für die Wettbewerbsdynamik entscheidend. Sie zeigt, daß Mythos bereits innerhalb weniger Tage auf die Produkt- und Freigabepolitik eines zentralen Konkurrenten ausstrahlte.
Reuters, Anthropic talks to EU, including on its cyber security models, Commission says, 17. April 2026.
Die Schlüsselquelle für die regulatorische Resonanz in Europa. Sie verdeutlicht, daß Mythos bereits vor einer breiteren Verfügbarkeit in die europäische Risikodiskussion eintritt.