Anthropic hat in 48 Stunden drei grosse Ankündigungen gemacht — vom Cloud-Agenten-Service über Desktop-Tools bis hin zu einem neuen API-Paradigma.

Die Advisor Strategy invertiert das klassische Sub-Agent-Pattern: Das kleine Modell führt, das grosse berät.
Anthropic hat in 48 Stunden drei grosse Ankündigungen gemacht — vom Cloud-Agenten-Service über Desktop-Tools bis hin zu einem neuen API-Paradigma.
Am 8. April lancierte Anthropic Claude Managed Agents in der Public Beta — ein Cloud-Service zum Bauen und Deployen von KI-Agenten im grossen Massstab. Das Angebot umfasst Sandboxed Code Execution, Authentifizierung, Checkpointing, Session-Persistenz, Tool-Orchestrierung, Fehlerwiederherstellung und Multi-Agent-Koordination (als Research Preview).
Der Preis: $0,08 pro Agent-Laufzeit-Stunde plus die regelmässigen Claude-Modellkosten. Erste Nutzer sind Notion, Rakuten, Asana, Sentry und Vibecode.
Managed Agents sollen den Sprung von «KI als Chat-Partner» zu «KI als autonomer Mitarbeiter» deutlich vereinfachen.
Am 9. April wurde Claude Cowork für alle zahlenden Abonnenten auf macOS und Windows verfügbar. Sechs neue Enterprise-Features kamen hinzu:
Ebenfalls am 9. April stellte Anthropic die Advisor Strategy API vor (advisor_20260301). Das Konzept: Opus 4.6 wird als Berater mit Sonnet 4.6 oder Haiku 4.5 als «Executor» gekoppelt — innerhalb eines einzigen API-Aufrufs.
Die Resultate: +2,7 Prozentpunkte auf SWE-bench Multilingual gegenüber Sonnet solo, bei 11,9 % geringeren Kosten pro Task. Claude Haiku mit Opus-Advisor sprang auf BrowseComp von 19,7 % auf 41,2 %. Das invertiert das klassische Sub-Agent-Pattern: Das kleine Modell führt und eskaliert nur bei Bedarf zum grossen.

AMD-Ingenieurin analysiert 6.852 Claude-Code-Sessions und dokumentiert einen massiven Rückgang der Denktiefe. Anthropic bestätigt zwei Produktänderungen – bestreitet aber gezieltes «Nerfing».
Anthropic bestätigt, dass zwei Produktänderungen die Denktiefe von Claude reduzierten – bestreitet aber gezieltes Nerfing. Eine AMD-Ingenieurin belegt den Leistungseinbruch mit 6.852 analysierten Sessions.

Anthropic hat am 16. April sein neues Flaggschiff-Modell vorgestellt. Claude Opus 4.7 übertrifft GPT-5.4 und Gemini 3.1 Pro in den wichtigsten Coding-Benchmarks – und bringt Features mit, die den Alltag von Entwicklern verändern dürften.
Claude Opus 4.7 setzt mit 87,6 Prozent auf SWE-bench Verified einen neuen Bestwert und überholt GPT-5.4 und Gemini 3.1 Pro – für Entwickler der bisher grösste Sprung zwischen zwei Claude-Generationen.

Neun Claude-Opus-4.6-Agenten übertrafen menschliche Forscher auf einem Alignment-Problem – aber die Methode generalisierte nicht auf Produktionsmodelle.
KI kann Forschung beschleunigen, aber Generalisierung und Reward-Hacking bleiben die zentralen Hürden.