Anthropic hat sein stärkstes KI-Modell vorgestellt. Claude Opus 4.6 bringt ein Kontextfenster von 1 Million Tokens, parallele Agent-Teams fürs Coding und schlägt GPT-5.2 auf mehreren Benchmarks. Gleichzeitig sorgt das Modell für Unruhe an der Wall Street.

Claude Opus 4.6 verschiebt den Fokus von KI-Assistenz hin zu autonomer Wissensarbeit – mit 1 Million Tokens Kontext, parallelen Agent-Teams und branchenführenden Benchmark-Ergebnissen.
Nur gut zwei Monate nach Opus 4.5 legt Anthropic nach – und zwar kräftig. Das neue Flaggschiff-Modell Claude Opus 4.6 bringt ein massiv erweitertes Kontextfenster, eine neue Funktion für parallele KI-Agenten und Benchmark-Ergebnisse, die die Konkurrenz alt aussehen lassen.
Die wichtigsten Neuerungen auf einen Blick:
Die Benchmark-Ergebnisse sind beeindruckend: Beim ARC-AGI-2-Test – einem Benchmark für Aufgaben, die für Menschen einfach, für KI aber schwer sind – springt der Wert von 37,6 auf 68,8 Prozent. Zum Vergleich: OpenAIs GPT-5.2 liegt bei 54,2 Prozent. Auf dem GDPval-AA-Benchmark, der Leistung bei wirtschaftlich relevanter Wissensarbeit misst (Finanzen, Recht), liegt Opus 4.6 rund 144 Elo-Punkte vor GPT-5.2.
"Wir denken, dass Opus 4.6 ein Wendepunkt für Wissensarbeit sein wird." – Dianne Penn, Head of Product Management Research, Anthropic
Bemerkenswert auch: Anthropics Sicherheitsteam liess Opus 4.6 vor dem Release nach Schwachstellen in Open-Source-Software suchen. Das Ergebnis: über 500 bisher unbekannte Zero-Day-Sicherheitslücken – jede einzelne von Sicherheitsforschern bestätigt.
Anthropic positioniert sich klar als Enterprise-KI-Anbieter – rund 80 Prozent des Geschäfts entfallen auf Firmenkunden. Scott White, Head of Product für Enterprise, sprach bei der Vorstellung vom Übergang zum „Vibe Working" – einer Arbeitswelt, in der KI nicht nur assistiert, sondern autonom Aufgaben übernimmt.
An der Wall Street sorgte das für Nervosität: Aktien von Finanz- und Rechtssoftware-Firmen wie FactSet und S&P Global gaben deutlich nach. Der Nasdaq verzeichnete seinen stärksten Zwei-Tages-Rückgang seit April.
Für dich als Claude-Nutzer: Opus 4.6 ist ab sofort auf claude.ai, über die API und auf AWS, Azure und Google Cloud verfügbar. Die Preise bleiben unverändert bei 5/25 Dollar pro Million Tokens. OpenAI konterte übrigens am gleichen Tag mit GPT-5.3-Codex – das Rennen um die beste Arbeits-KI wird 2026 nochmals intensiver.

Das mysteriöse KI-Modell «Hunter Alpha», das seit dem 11. März die OpenRouter-Rangliste dominierte, gehört nicht zu DeepSeek – sondern zu Xiaomi. Mit rund 1 Billion Parametern und einem 1-Million-Token-Kontextfenster positioniert der Smartphone-Riese sein MiMo-V2-Pro als «Gehirn für KI-Agenten».
Xiaomis anonymer «Stealth Release» auf OpenRouter zeigt: Chinas KI-Ökosystem reicht weit über DeepSeek hinaus – und der Smartphone-Riese meint es ernst mit KI-Agenten.

NVIDIA stellt zwei neue KI-Modell-Familien vor: Nemotron 3 Super für agentische Systeme mit fünfmal höherem Durchsatz und Alpamayo für autonomes Fahren. Beide sind Open Source.
NVIDIA setzt mit zwei Open-Source-Modell-Familien auf ein Ökosystem-Spiel — Nemotron für Agenten, Alpamayo für selbstfahrende Autos.

OpenAI hat GPT-5.4 vorgestellt – erstmals vereint ein Modell Coding, Reasoning und native Computerbedienung. Auf dem OSWorld-Benchmark übertrifft es mit 75% sogar den menschlichen Referenzwert. Was das für ChatGPT-Nutzer und Entwickler bedeutet.
GPT-5.4 ist das erste OpenAI-Modell, das Computer besser bedient als Menschen – und verschiebt den KI-Wettbewerb von «klugstes Modell» hin zu «beste KI-Arbeitskraft».