NewsKategorienNewsletter-ArchivÜber unsKostenlos abonnieren

Der wöchentliche KI-Newsletter für die Schweiz. Kompakt, relevant, zero Bullshit. 5 Minuten lesen, 1 Woche informiert.

FOLGE UNS
LIXIG
NAVIGATION
Alle NewsNewsletter-ArchivAutorenÜber unsKontakt
KATEGORIEN
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
RECHTLICHES
ImpressumDatenschutzAGB
© 2026 Inoo GmbH · Altstätten SG · Schweiz
Ein Produkt von InooSwiss Made Software
HOME·NEWS·NEUE MODELLE

Claude Opus 4.7 ist da – und holt sich die Coding-Krone zurück

Anthropic hat am 16. April sein neues Flaggschiff-Modell vorgestellt. Claude Opus 4.7 übertrifft GPT-5.4 und Gemini 3.1 Pro in den wichtigsten Coding-Benchmarks – und bringt Features mit, die den Alltag von Entwicklern verändern dürften.

Pascal Eugster
Pascal Eugster
GRÜNDER & ENTWICKLER
17. APRIL 2026
3 MIN. LESEZEIT
Illustration einer Schaltzentrale mit Monitoren und Servern, kinewsletter.ch Stil
Illustration einer Schaltzentrale mit Monitoren und Servern (Dark Mode), kinewsletter.ch Stil
INHALT
0187,6 Prozent auf SWE-bench – ein neuer Bestwert02Vom Code-Assistenten zum autonomen Kollegen03Dreimal schärfer sehen04Der neue Tokenizer – und sein Haken05Cyber-Sicherheit: Bewusst gebremst06Einordnung: Was bedeutet das für dich?
INHALT
0187,6 Prozent auf SWE-bench – ein neuer Bestwert02Vom Code-Assistenten zum autonomen Kollegen03Dreimal schärfer sehen04Der neue Tokenizer – und sein Haken05Cyber-Sicherheit: Bewusst gebremst06Einordnung: Was bedeutet das für dich?
in
PARTNER · INOO GMBH
Wie viel KI verträgt dein Betrieb? In 30 Minuten Klartext.

Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.

Gespräch buchen →
DAS WICHTIGSTE IN KÜRZE

Claude Opus 4.7 setzt mit 87,6 Prozent auf SWE-bench Verified einen neuen Bestwert und überholt GPT-5.4 und Gemini 3.1 Pro – für Entwickler der bisher grösste Sprung zwischen zwei Claude-Generationen.

87,6 Prozent auf SWE-bench – ein neuer Bestwert

Die Zahlen sind eindrücklich: Auf SWE-bench Verified, dem Standardtest für reale Software-Engineering-Aufgaben, erreicht Opus 4.7 87,6 Prozent – gegenüber 80,8 Prozent beim Vorgänger Opus 4.6 und 80,6 Prozent bei Googles Gemini 3.1 Pro. Auf dem härteren SWE-bench Pro liegt Opus 4.7 bei 64,3 Prozent, deutlich vor GPT-5.4 (57,7 Prozent) und Gemini 3.1 Pro (54,2 Prozent).

Besonders bemerkenswert: Auf dem neuen MCP-Atlas-Benchmark, der Agenten-Fähigkeiten über mehrere Tools hinweg misst, erreicht Opus 4.7 mit 77,3 Prozent den Bestwert aller getesteten Modelle. Bei GPQA Diamond, dem Test für naturwissenschaftliches Expertenwissen, kommt es auf 94,2 Prozent – praktisch gleichauf mit den Topmodellen von OpenAI und Google.

Vom Code-Assistenten zum autonomen Kollegen

Was die nackten Zahlen nicht zeigen: Opus 4.7 löst laut Anthropic viele Aufgaben, die sein Vorgänger und Sonnet 4.6 schlicht nicht schafften – vier komplexe Tasks auf einem internen 93-Aufgaben-Test, die zuvor keinem Claude-Modell gelangen. Auf CursorBench steigt die Erfolgsrate von 58 auf 70 Prozent, und bei Rakutens Produktions-Benchmark löst das neue Modell dreimal so viele Tickets wie sein Vorgänger.

Dazu kommen praktische Neuerungen: Das xhigh-Effort-Level bietet einen neuen Kompromiss zwischen Qualität und Geschwindigkeit. Der /ultrareview-Befehl in Claude Code simuliert eine Senior-Entwicklerin, die nicht bloss Syntaxfehler findet, sondern subtile Designfehler und Logiklücken aufspürt. Task Budgets – aktuell in Public Beta – geben Entwicklern Kontrolle über den Token-Verbrauch bei längeren Agenten-Sessions. Und der Auto-Mode für Max-Plan-Abonnenten lässt Claude eigenständig entscheiden, wann es nachdenken, Dateien lesen oder Code ausführen soll.

Dreimal schärfer sehen

Die Vision-Fähigkeiten machen einen grossen Sprung: Opus 4.7 verarbeitet Bilder bis 2.576 Pixel an der langen Kante – rund 3,3-mal so viel wie Opus 4.6. Für dich konkret: Screenshots von ganzen Dashboards, dichte Architekturdiagramme oder mehrseitige PDFs lassen sich jetzt deutlich detaillierter analysieren.

Der neue Tokenizer – und sein Haken

Opus 4.7 nutzt einen neuen Tokenizer, der Text effizienter verarbeitet. Dieselbe Eingabe erzeugt je nach Inhalt 1,0- bis 1,35-mal mehr Tokens als bisher. Das heisst: Bei gleichem Text zahlst du unter Umständen etwas mehr – obwohl die Preise auf dem Papier bei 5 Dollar (Input) und 25 Dollar (Output) pro Million Tokens stabil bleiben. Anthropic empfiehlt Entwicklern, ihre Token-Budgets zu überprüfen.

Cyber-Sicherheit: Bewusst gebremst

Interessant ist, was Opus 4.7 nicht kann: Anthropic hat die Cybersecurity-Fähigkeiten bewusst unter das Niveau von Mythos Preview gesenkt. Verdächtige Angriffs-Prompts werden automatisch blockiert. Gleichzeitig gibt es ein neues Cyber Verification Program für legitime Sicherheitsforscher – Penetrationstester, Red-Teamer und Vulnerability-Forscher können sich verifizieren lassen, um Zugriff auf die vollen Fähigkeiten zu erhalten.

Einordnung: Was bedeutet das für dich?

Opus 4.7 ist sofort verfügbar über claude.ai, die API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry und GitHub Copilot. Für Entwickler, die Claude Code nutzen, dürfte der Sprung spürbar sein – insbesondere bei komplexen Refactorings und mehrstündigen Agenten-Workflows. Die Kombination aus höherer Erfolgsrate, grösserem Kontextfenster (1 Million Tokens) und dem neuen Effort-Level macht Opus 4.7 zum aktuell stärksten allgemein verfügbaren Coding-Modell auf dem Markt.

Quellen

Anthropic – Claude Opus 4.7↗ EXTERNER LINKCNBC – Anthropic Claude Opus 4.7↗ EXTERNER LINK9to5Mac – Anthropic Opus 4.7↗ EXTERNER LINKThe Next Web – Opus 4.7 Benchmarks↗ EXTERNER LINKVellum – Opus 4.7 Benchmarks erklärt↗ EXTERNER LINK
TEILEN
LinkedIn→X / Twitter→E-Mail→
KOSTENLOS ABONNIEREN
Diese News jeden Freitag in dein Postfach?

WEITERLESENDas könnte dich auch interessieren.

Skizze einer Werkbank, an der eine Person eine Reihe kleiner elektroblauer Roboterfiguren zusammenbaut, offener Werkzeugkasten, Bauplan an der Wand, Fenster mit Morgenlicht
Skizze einer Werkbank, an der eine Person eine Reihe kleiner elektroblauer Roboterfiguren zusammenbaut, offener Werkzeugkasten, Bauplan an der Wand, Fenster mit Morgenlicht (Dark)
NEUE MODELLE·3. JUNI 2026

Microsoft baut sieben eigene KI-Modelle – und löst sich von OpenAI

An der Build 2026 hat Microsoft sieben eigene MAI-Modelle vorgestellt – fürs Schlussfolgern, Programmieren, Sprache und Bild. Das erklärte Ziel: weniger Abhängigkeit von Partner OpenAI.

Skizze eines freundlichen Roboters am Schreibtisch, der eine Hand mit einer kleinen Warnflagge hebt, davor ein Laptop mit Code und eine Lupe
Skizze eines freundlichen Roboters am Schreibtisch, der eine Hand mit einer kleinen Warnflagge hebt, davor ein Laptop mit Code und eine Lupe (Dark)
NEUE MODELLE·29. MAI 2026

Anthropic bringt Claude Opus 4.8 – und macht das Modell vor allem ehrlicher

Anthropic hat am 28. Mai Claude Opus 4.8 vorgestellt. Das neue Spitzenmodell ist beim Programmieren und bei agentischen Aufgaben stärker – vor allem aber rund viermal seltener bereit, eigene Fehler unkommentiert durchgehen zu lassen.

Skizze Qwen3.7-Max Roboter optimiert blau leuchtenden Chip auf Workbench mit Sanduhr
Skizze Qwen3.7-Max Roboter optimiert blau leuchtenden Chip auf Workbench mit Sanduhr (Dark)
NEUE MODELLE·26. MAI 2026

Qwen3.7-Max läuft 35 Stunden autonom – und optimiert Code für Alibabas eigenen Chip

Alibabas neues Top-Modell arbeitet 35 Stunden ohne Unterbruch an einer Kernel-Optimierung. Auf Standard-Benchmarks zieht es mit Claude Opus 4.6 gleich.