Anthropic hat sein stärkstes KI-Modell vorgestellt. Claude Opus 4.6 bringt ein Kontextfenster von 1 Million Tokens, parallele Agent-Teams fürs Coding und schlägt GPT-5.2 auf mehreren Benchmarks. Gleichzeitig sorgt das Modell für Unruhe an der Wall Street.

Claude Opus 4.6 verschiebt den Fokus von KI-Assistenz hin zu autonomer Wissensarbeit – mit 1 Million Tokens Kontext, parallelen Agent-Teams und branchenführenden Benchmark-Ergebnissen.
Nur gut zwei Monate nach Opus 4.5 legt Anthropic nach – und zwar kräftig. Das neue Flaggschiff-Modell Claude Opus 4.6 bringt ein massiv erweitertes Kontextfenster, eine neue Funktion für parallele KI-Agenten und Benchmark-Ergebnisse, die die Konkurrenz alt aussehen lassen.
Die wichtigsten Neuerungen auf einen Blick:
Die Benchmark-Ergebnisse sind beeindruckend: Beim ARC-AGI-2-Test – einem Benchmark für Aufgaben, die für Menschen einfach, für KI aber schwer sind – springt der Wert von 37,6 auf 68,8 Prozent. Zum Vergleich: OpenAIs GPT-5.2 liegt bei 54,2 Prozent. Auf dem GDPval-AA-Benchmark, der Leistung bei wirtschaftlich relevanter Wissensarbeit misst (Finanzen, Recht), liegt Opus 4.6 rund 144 Elo-Punkte vor GPT-5.2.
"Wir denken, dass Opus 4.6 ein Wendepunkt für Wissensarbeit sein wird." – Dianne Penn, Head of Product Management Research, Anthropic
Bemerkenswert auch: Anthropics Sicherheitsteam liess Opus 4.6 vor dem Release nach Schwachstellen in Open-Source-Software suchen. Das Ergebnis: über 500 bisher unbekannte Zero-Day-Sicherheitslücken – jede einzelne von Sicherheitsforschern bestätigt.
Anthropic positioniert sich klar als Enterprise-KI-Anbieter – rund 80 Prozent des Geschäfts entfallen auf Firmenkunden. Scott White, Head of Product für Enterprise, sprach bei der Vorstellung vom Übergang zum „Vibe Working" – einer Arbeitswelt, in der KI nicht nur assistiert, sondern autonom Aufgaben übernimmt.
An der Wall Street sorgte das für Nervosität: Aktien von Finanz- und Rechtssoftware-Firmen wie FactSet und S&P Global gaben deutlich nach. Der Nasdaq verzeichnete seinen stärksten Zwei-Tages-Rückgang seit April.
Für dich als Claude-Nutzer: Opus 4.6 ist ab sofort auf claude.ai, über die API und auf AWS, Azure und Google Cloud verfügbar. Die Preise bleiben unverändert bei 5/25 Dollar pro Million Tokens. OpenAI konterte übrigens am gleichen Tag mit GPT-5.3-Codex – das Rennen um die beste Arbeits-KI wird 2026 nochmals intensiver.
Claude Opus 4.6 verschiebt den Fokus von KI-Assistenz hin zu autonomer Wissensarbeit – mit 1 Million Tokens Kontext, parallelen Agent-Teams und branchenführenden Benchmark-Ergebnissen.

Mistral hat Medium 3.5 ausgerollt – ein dichtes 128B-Modell mit 256k Kontext, das Chat, Reasoning und Coding in einem einzigen Set Gewichte vereint. 77,6 Prozent auf SWE-Bench, offene Gewichte unter modifizierter MIT-Lizenz und neue Cloud-Agenten in Vibe und Le Chat.
Mistral Medium 3.5 schlägt Devstral 2 und positioniert Europa mit offenen Gewichten und kompakter 4-GPU-Architektur als Coding-Frontier-Alternative zu OpenAI und Anthropic.

Das britische AI Safety Institute hat OpenAIs GPT-5.5 einem harten Cyber-Stresstest unterzogen. Das Ergebnis: Das Modell schliesst auf Anthropics Mythos auf – und löst die nächste Welle von Sicherheitsfragen aus. Was Schweizer CISOs jetzt wissen müssen.
Mit GPT-5.5 erreicht ein zweites Frontier-Modell das Cyber-Offensiv-Niveau von Mythos – defensive Vorbereitung muss sich an der ganzen Modellklasse ausrichten, nicht mehr an einzelnen Anbietern.

Zwei Tage, zwei Meilensteine: DeepSeek liefert das grösste Open-Weights-Modell der Geschichte, Alibabas Qwen3.6 schlägt mit 27 Milliarden Parametern ein 15-mal grösseres Modell beim Coding.
DeepSeek V4-Pro ist mit 1,6 Billionen Parametern das grösste Open-Weights-Modell der Geschichte, während Qwen3.6-27B beweist, dass ein kompaktes Modell auf einer einzelnen GPU Flagship-Coding-Performance liefern kann – der Druck auf proprietäre Labs war nie grösser.