Claude unter Beschuss: Wurde das Modell heimlich verschlechtert?

Die Datenlage

Stella Laurenzo, Senior Director in AMDs AI-Gruppe, hat den bisher detailliertesten Beleg für Claudes angeblichen Leistungsrückgang vorgelegt. Ihre Analyse umfasst 6.852 Claude-Code-Sessions mit 17.871 Thinking Blocks und 234.760 Tool Calls. Das Ergebnis: Die geschätzte Denktiefe fiel ab Februar drastisch. Der Reads-per-Edit-Wert – wie oft Claude eine Datei liest, bevor es sie ändert – sank von 6,6× (Ende Januar) auf 2,0× (Mitte März). Edits an nicht-gelesenen Dateien stiegen von 6,2 auf 33,7 Prozent.

Was Anthropic zugibt – und was nicht

Anthropics Boris Cherny bestätigte zwei konkrete Änderungen: Am 9. Februar wurde «Adaptive Thinking» für Opus 4.6 eingeführt, am 3. März das Standard-Effort-Level von «high» auf «medium» gesenkt. Beide Entscheide optimierten für Latenz und Kosten – auf Kosten tiefer Reasoning-Sessions.

Cherny räumte auch einen Bug ein: Adaptive Thinking vergab in bestimmten Turns null Reasoning-Tokens, was zu Halluzinationen wie erfundenen GitHub-SHAs und fiktiven Package-Namen führte. Der oft zitierte redact-thinking-2026-02-12-Header sei dagegen ein reiner UI-Change, der die Thinking-Anzeige verstecke, aber die Denkprozesse selbst nicht beeinflusse.

Warum der Zeitpunkt brisant ist

Der Backlash trifft Anthropic in einer heiklen Phase: Genau am Tag des Fortune-Artikels (14. April) lancierte das Unternehmen Opus 4.7 – das die Kritik teilweise adressiert. Das neue Modell bietet ein «xhigh»-Effort-Level und ein grösseres Kontextfenster. Ob das die Power-User zurückgewinnt, die sich vom Medium-Default betrogen fühlen, bleibt offen.

Claude unter Beschuss: Wurde das Modell heimlich verschlechtert?

Die Datenlage

Was Anthropic zugibt – und was nicht

Warum der Zeitpunkt brisant ist

Quellen

Claude unter Beschuss: Wurde das Modell heimlich verschlechtert?

Die Datenlage

Was Anthropic zugibt – und was nicht

Warum der Zeitpunkt brisant ist

Quellen

Claude unter Beschuss: Wurde das Modell heimlich verschlechtert?

Die Datenlage

Was Anthropic zugibt – und was nicht

Warum der Zeitpunkt brisant ist

Quellen

WEITERLESENDas könnte dich auch interessieren.

Anthropic bringt Claude Opus 4.8 – und macht das Modell vor allem ehrlicher

Qwen3.7-Max läuft 35 Stunden autonom – und optimiert Code für Alibabas eigenen Chip

DeepSeek macht 75-Prozent-Rabatt permanent – und ist 34-mal günstiger als GPT-5.5

Claude unter Beschuss: Wurde das Modell heimlich verschlechtert?

Die Datenlage

Was Anthropic zugibt – und was nicht

Warum der Zeitpunkt brisant ist

Quellen

WEITERLESENDas könnte dich auch interessieren.

Anthropic bringt Claude Opus 4.8 – und macht das Modell vor allem ehrlicher

Qwen3.7-Max läuft 35 Stunden autonom – und optimiert Code für Alibabas eigenen Chip

DeepSeek macht 75-Prozent-Rabatt permanent – und ist 34-mal günstiger als GPT-5.5