NewsKategorienNewsletter-ArchivÜber unsKostenlos abonnieren

Der wöchentliche KI-Newsletter für die Schweiz. Kompakt, relevant, zero Bullshit. 5 Minuten lesen, 1 Woche informiert.

FOLGE UNS
LIXIG
NAVIGATION
Alle NewsNewsletter-ArchivAutorenÜber unsKontakt
KATEGORIEN
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
RECHTLICHES
ImpressumDatenschutzAGB
© 2026 Inoo GmbH · Altstätten SG · Schweiz
Ein Produkt von InooSwiss Made Software
HOME·NEWS·NEUE MODELLE

Claude unter Beschuss: Wurde das Modell heimlich verschlechtert?

AMD-Ingenieurin analysiert 6.852 Claude-Code-Sessions und dokumentiert einen massiven Rückgang der Denktiefe. Anthropic bestätigt zwei Produktänderungen – bestreitet aber gezieltes «Nerfing».

Pascal Eugster
Pascal Eugster
GRÜNDER & ENTWICKLER
17. APRIL 2026
2 MIN. LESEZEIT
Illustration eines Thermometers mit fallendem Quecksilber und zerbrochenen Zahnrädern, kinewsletter.ch Stil
Illustration eines Thermometers (Dark Mode), kinewsletter.ch Stil
INHALT
01Die Datenlage02Was Anthropic zugibt – und was nicht03Warum der Zeitpunkt brisant ist
INHALT
01Die Datenlage02Was Anthropic zugibt – und was nicht03Warum der Zeitpunkt brisant ist
in
PARTNER · INOO GMBH
Wie viel KI verträgt dein Betrieb? In 30 Minuten Klartext.

Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.

Gespräch buchen →
DAS WICHTIGSTE IN KÜRZE

Anthropic bestätigt, dass zwei Produktänderungen die Denktiefe von Claude reduzierten – bestreitet aber gezieltes Nerfing. Eine AMD-Ingenieurin belegt den Leistungseinbruch mit 6.852 analysierten Sessions.

Die Datenlage

Stella Laurenzo, Senior Director in AMDs AI-Gruppe, hat den bisher detailliertesten Beleg für Claudes angeblichen Leistungsrückgang vorgelegt. Ihre Analyse umfasst 6.852 Claude-Code-Sessions mit 17.871 Thinking Blocks und 234.760 Tool Calls. Das Ergebnis: Die geschätzte Denktiefe fiel ab Februar drastisch. Der Reads-per-Edit-Wert – wie oft Claude eine Datei liest, bevor es sie ändert – sank von 6,6× (Ende Januar) auf 2,0× (Mitte März). Edits an nicht-gelesenen Dateien stiegen von 6,2 auf 33,7 Prozent.

Was Anthropic zugibt – und was nicht

Anthropics Boris Cherny bestätigte zwei konkrete Änderungen: Am 9. Februar wurde «Adaptive Thinking» für Opus 4.6 eingeführt, am 3. März das Standard-Effort-Level von «high» auf «medium» gesenkt. Beide Entscheide optimierten für Latenz und Kosten – auf Kosten tiefer Reasoning-Sessions.

Cherny räumte auch einen Bug ein: Adaptive Thinking vergab in bestimmten Turns null Reasoning-Tokens, was zu Halluzinationen wie erfundenen GitHub-SHAs und fiktiven Package-Namen führte. Der oft zitierte redact-thinking-2026-02-12-Header sei dagegen ein reiner UI-Change, der die Thinking-Anzeige verstecke, aber die Denkprozesse selbst nicht beeinflusse.

Warum der Zeitpunkt brisant ist

Der Backlash trifft Anthropic in einer heiklen Phase: Genau am Tag des Fortune-Artikels (14. April) lancierte das Unternehmen Opus 4.7 – das die Kritik teilweise adressiert. Das neue Modell bietet ein «xhigh»-Effort-Level und ein grösseres Kontextfenster. Ob das die Power-User zurückgewinnt, die sich vom Medium-Default betrogen fühlen, bleibt offen.

Quellen

Fortune – Anthropic Claude Backlash↗ EXTERNER LINKVentureBeat – Is Anthropic Nerfing Claude?↗ EXTERNER LINKAxios – Anthropic Claude Power User Complaints↗ EXTERNER LINK
TEILEN
LinkedIn→X / Twitter→E-Mail→
KOSTENLOS ABONNIEREN
Diese News jeden Freitag in dein Postfach?

WEITERLESENDas könnte dich auch interessieren.

Skizze eines freundlichen Roboters am Schreibtisch, der eine Hand mit einer kleinen Warnflagge hebt, davor ein Laptop mit Code und eine Lupe
Skizze eines freundlichen Roboters am Schreibtisch, der eine Hand mit einer kleinen Warnflagge hebt, davor ein Laptop mit Code und eine Lupe (Dark)
NEUE MODELLE·29. MAI 2026

Anthropic bringt Claude Opus 4.8 – und macht das Modell vor allem ehrlicher

Anthropic hat am 28. Mai Claude Opus 4.8 vorgestellt. Das neue Spitzenmodell ist beim Programmieren und bei agentischen Aufgaben stärker – vor allem aber rund viermal seltener bereit, eigene Fehler unkommentiert durchgehen zu lassen.

Skizze Qwen3.7-Max Roboter optimiert blau leuchtenden Chip auf Workbench mit Sanduhr
Skizze Qwen3.7-Max Roboter optimiert blau leuchtenden Chip auf Workbench mit Sanduhr (Dark)
NEUE MODELLE·26. MAI 2026

Qwen3.7-Max läuft 35 Stunden autonom – und optimiert Code für Alibabas eigenen Chip

Alibabas neues Top-Modell arbeitet 35 Stunden ohne Unterbruch an einer Kernel-Optimierung. Auf Standard-Benchmarks zieht es mit Claude Opus 4.6 gleich.

Skizze DeepSeek Preisschild mit Walfisch und wankenden Konkurrenz-Türmen
Skizze DeepSeek Preisschild Dark Mode, kinewsletter.ch Stil
NEUE MODELLE·25. MAI 2026

DeepSeek macht 75-Prozent-Rabatt permanent – und ist 34-mal günstiger als GPT-5.5

Der chinesische Anbieter DeepSeek macht den 75-Prozent-Rabatt auf sein Flaggschiff V4-Pro dauerhaft. Output-Tokens kosten 34-mal weniger als GPT-5.5 – mit Compliance-Haken für die Schweiz.