Anthropics internes Top-Modell findet tausende Zero-Day-Lücken, bringt Regierungen in Alarmbereitschaft – und wird bewusst zurückgehalten. Was Mythos über die nächste Phase der KI-Entwicklung verrät.

Anthropics Mythos findet tausende Zero-Day-Lücken autonom – darunter eine 27 Jahre alte OpenBSD-Schwachstelle. Statt das Modell zu verkaufen, investiert Anthropic 100 Millionen Dollar in ein Defensiv-Konsortium mit Apple, Microsoft und Google.
Im Februar 2026 öffnete Nicholas Carlini – Sicherheitsforscher bei Anthropic – auf Bali seinen Laptop, um ein neues Modell zu testen. Was er fand, nannte er laut Bloomberg «staggering»: Mythos identifizierte und exploitete Zero-Day-Schwachstellen in praktisch jedem grossen Betriebssystem und Browser. Darunter eine 27 Jahre alte Lücke in OpenBSD – einem System, das für seine Sicherheit bekannt ist.
Die Zahlen aus Anthropics eigenem Sicherheitsbericht sprechen für sich: Mythos Preview erzeugte 181 funktionierende Firefox-JavaScript-Exploits – gegenüber 2 beim Vorgänger Opus 4.6. Das Modell konstruierte autonom mehrstufige Exploit-Ketten: JIT-Heap-Sprays mit vier verketteten Schwachstellen, ROP-Chains über 20 Gadgets hinweg, Privilege-Escalation-Ketten mit KASLR-Bypass.
Die Kosten für die Entdeckung der OpenBSD-Lücke? Unter 20.000 Dollar über tausend Testläufe. Einzelne Exploits kosteten zwischen 50 und 2.000 Dollar. In der Welt der Cybersecurity ist das praktisch nichts.
Statt Mythos auf den Markt zu bringen, lancierte Anthropic am 7. April «Project Glasswing» – ein Defensiv-Konsortium mit Amazon, Apple, Microsoft, CrowdStrike, Google, JPMorgan Chase, Intel, Nvidia und weiteren. 100 Millionen Dollar an Credits fliessen in die Initiative. Das Ziel: Die kritischste Software der Welt absichern, bevor das Modell breit verfügbar wird.
Für legitime Sicherheitsforscher gibt es das neue Cyber Verification Program. Penetrationstester und Red-Teamer können sich verifizieren lassen, um Zugang zu Mythos' vollen Fähigkeiten zu erhalten.
Die politischen Reaktionen kamen innerhalb von Tagen. Am 14. April schrieb OMB-CIO Gregory Barbaccia per Memo an die US-Kabinettsdepartemente: Die Regierung bereite Schutzmassnahmen vor, um Behörden Zugang zu Mythos zu ermöglichen – trotz Einwänden des Pentagon. Bloomberg berichtet, das Memo ging an Verteidigung, Finanzministerium, Handel, Homeland Security, Justiz und Aussenministerium.
Am selben Tag berief die EZB die Chief Risk Officers der Eurozone-Banken zu einem Sonder-Call ein. Das Thema: Wie verwundbar ist das europäische Finanzsystem gegenüber Mythos-gestützten Angriffen? In den USA hatte Treasury Secretary Bessent bereits letzte Woche Wall-Street-CEOs zusammengerufen. Bloomberg nennt es «eine der schnellsten behördenübergreifenden Reaktionen auf eine KI-Fähigkeit in der Geschichte».
Die Schweiz wird in den Berichten nicht direkt erwähnt. Aber: Die UBS ist über ihre Eurozone-Operationen indirekt vom EZB-Call betroffen. Die Mythos-Exploits betreffen universelle Systeme – Linux, OpenBSD, FreeBSD, Firefox –, die auch in Schweizer Infrastrukturen laufen. Und das ETH Zürich Quantum Center kooperiert mit IQM, einem der frühen Glasswing-Tester.
Mythos markiert einen Wendepunkt: Zum ersten Mal hält ein KI-Unternehmen sein stärkstes Modell bewusst zurück – nicht wegen mangelnder Nachfrage, sondern wegen der Risiken. Der Entscheid, 100 Millionen Dollar in Verteidigung zu investieren statt in Monetarisierung, ist beispiellos. Er zeigt aber auch: Die Fähigkeitskurve bei KI-Modellen hat einen Punkt erreicht, an dem Veröffentlichung allein keine verantwortungsvolle Option mehr ist.

Neun Claude-Opus-4.6-Agenten übertrafen menschliche Forscher auf einem Alignment-Problem – aber die Methode generalisierte nicht auf Produktionsmodelle.
KI kann Forschung beschleunigen, aber Generalisierung und Reward-Hacking bleiben die zentralen Hürden.

Der Stanford AI Index 2026 zeigt: KI-Rechenzentren verbrauchen so viel Strom wie die Schweiz. Benchmarks fallen im Rekordtempo, Transparenz sinkt, und das Apertus-Modell von ETH/EPFL leuchtet als Open-Source-Kontrapunkt.
KI skaliert schneller, als wir Governance, Benchmarks oder Stromnetze hinterherziehen können – und die Schweiz ist mittendrin.

Anthropic bestätigt: Claude Mythos ist das leistungsstärkste KI-Modell – wird aber nicht öffentlich freigegeben. Es kann autonom Zehntausende Software-Schwachstellen finden und ausnutzen.
Erstmals wird ein Frontier-Modell bewusst zurückgehalten, weil seine Fähigkeiten als zu gefährlich für den öffentlichen Einsatz eingestuft werden.