kinewsletter.chkinewsletter.ch
News
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
Newsletter-Archiv
Search
News
Kategorien
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
Newsletter-ArchivÜber unsSuche
Kostenlos abonnieren
kinewsletter.chkinewsletter.ch

Der wöchentliche KI-Newsletter für die Schweiz. Kompakt, relevant, zero Bullshit. 5 Minuten lesen, 1 Woche informiert.

Navigation

Alle NewsNewsletter-ArchivAutorenÜber unsKontakt

Rechtliches

ImpressumDatenschutzAGB

© 2026Inoo GmbH · Altstätten SG · Schweiz

Swiss Made SoftwareEin Produkt vonInooInoo
  1. Home
  2. KI-News
  3. Regulierung & Ethik
  4. AISI prüft GPT-5.5: OpenAIs Frontier zieht mit Mythos auf Cyber-Niveau gleich
Regulierung & EthikNeue Modelle

AISI prüft GPT-5.5: OpenAIs Frontier zieht mit Mythos auf Cyber-Niveau gleich

Das britische AI Safety Institute hat OpenAIs GPT-5.5 einem harten Cyber-Stresstest unterzogen. Das Ergebnis: Das Modell schliesst auf Anthropics Mythos auf – und löst die nächste Welle von Sicherheitsfragen aus. Was Schweizer CISOs jetzt wissen müssen.

Samstag, 2. Mai 2026~4 Min. Lesezeit
Pascal Eugster
Pascal EugsterGründer & Entwickler
Illustration einer Schaltzentrale mit Monitor, kinewsletter.ch Stil
Illustration einer Schaltzentrale mit Monitor, kinewsletter.ch Stil
Das Wichtigste

Mit GPT-5.5 erreicht ein zweites Frontier-Modell das Cyber-Offensiv-Niveau von Mythos – defensive Vorbereitung muss sich an der ganzen Modellklasse ausrichten, nicht mehr an einzelnen Anbietern.

Das AI Safety Institute (AISI) – die staatliche KI-Sicherheitsbehörde Grossbritanniens – hat OpenAIs neues Modell GPT-5.5 einer harten Cyber-Prüfung unterzogen. Das Ergebnis wirft ein neues Licht auf die Bedrohungslage: GPT-5.5 erreicht in offensiven Cyber-Tasks dieselbe Liga wie Anthropics geheimes Modell Mythos – und schliesst damit eine Lücke, die seit Wochen für Nervosität bei Behörden und Banken sorgt.

Die Veröffentlichung am 30. April war kein gewöhnlicher Benchmark-Bericht. Sie ist die zweite öffentliche Cyber-Evaluation überhaupt, in der ein Frontier-Modell die anspruchsvollste Test-Suite des AISI knackt. Was das konkret heisst und warum die Schweizer Finanzaufsicht jetzt genauer hinschauen sollte, liest du hier.

Zweites Modell schafft den 32-Stufen-Angriff

Das Herzstück der AISI-Evaluation ist eine Test-Range namens «The Last Ones» – ein simulierter, 32-stufiger Angriff auf ein virtuelles Firmennetzwerk. Eine Aufgabe, für die ein menschlicher Cyber-Experte rund 20 Stunden braucht. Bisher hatte nur ein Modell diese Kette eigenständig durchgespielt: Claude Mythos Preview – in 3 von 10 Versuchen.

Mit GPT-5.5 hat nun ein zweites Modell aus einem anderen Labor die Schwelle durchbrochen. OpenAIs Frontier schafft den Durchgang in 2 von 10 Versuchen. Auf den Expert-Tier-Aufgaben des AISI – einer Sammlung kurzer, harter Cyber-Aufgaben auf dem Niveau erfahrener Penetration-Tester – liegt GPT-5.5 mit einer Trefferquote von 71,4 % sogar leicht vor Mythos Preview (68,6 %).

  • GPT-5.5: 71,4 % auf AISI Expert-Tier, 2/10 auf «The Last Ones»
  • Claude Mythos Preview: 68,6 % Expert-Tier, 3/10 auf «The Last Ones»
  • GPT-5.4: 52,4 % Expert-Tier
  • Claude Opus 4.7: 48,6 % Expert-Tier

Der Sprung zwischen GPT-5.4 und GPT-5.5 ist also massiv – rund 19 Prozentpunkte in einer einzigen Modellgeneration.

Cyber-Skill als Nebeneffekt allgemeiner Fähigkeiten

Die spannendere Beobachtung steckt in der Einordnung des AISI selbst: Offensive Cyber-Fähigkeiten entstehen nicht primär, weil die Labore explizit darauf trainieren. Sie entstehen als Nebenprodukt allgemeiner Fortschritte in Long-Horizon-Planung, Reasoning und Coding. Jedes Modell, das besser über lange agentische Aufgaben hinweg denkt, wird damit auch zwangsläufig zu einem besseren simulierten Angreifer.

Wenn Cyber-Skill als Nebeneffekt von Long-Horizon-Autonomie kommt, sollten weitere Sprünge in den nächsten Modellen erwartet werden. – AI Safety Institute, 30. April 2026

Das hat eine unangenehme Konsequenz: Defensive Vorbereitungen können nicht mehr modellweise geplant werden. Was im Mai noch das Niveau von Mythos und GPT-5.5 ist, könnte im Sommer schon der Standard kleinerer Open-Weight-Modelle sein.

Universal-Jailbreak in sechs Stunden

Auf der Sicherheits-Seite gibt es zwei Schlagzeilen, die zusammengehören. Erstens: AISI-Red-Teamer fanden in nur sechs Stunden einen Universal-Jailbreak, der alle vom Institut getesteten Cyber-Anfragen aus GPT-5.5 herausholte – auch in mehrstufigen agentischen Settings. Zweitens: OpenAI hat darauf reagiert und das Safeguard-System überarbeitet. Wegen einer Konfigurationspanne in der ans AISI gelieferten Version konnte das Institut den Fix aber nicht final verifizieren.

Konkret heisst das: GPT-5.5 ist mit hoher Wahrscheinlichkeit weniger ausbruchssicher, als die offiziell veröffentlichte Version vermuten lässt – und Anthropics Mythos hat ein vergleichbares Profil. Beide Modelle sind in den USA und Grossbritannien deshalb nicht frei erhältlich, sondern nur über kontrollierte Enterprise- und Behörden-Kanäle.

Was das für die Schweiz bedeutet

Die Schweiz ist von dieser Lage doppelt betroffen. Die FINMA hatte den Schweizer Finanzplatz bereits Ende April vor Mythos-Risiken gewarnt und Swisscoms Threat Radar entsprechend ergänzt. Mit der AISI-Evaluation ist nun klar: Diese Warnung gilt nicht mehr nur für ein einzelnes Modell, sondern für eine ganze Klasse von Frontier-LLMs.

Für Schweizer CISOs heisst das vor allem dreierlei:

  • Phishing- und Social-Engineering-Erkennung muss damit rechnen, dass Angreifer agentische Modelle für Long-Horizon-Kampagnen einsetzen, nicht mehr nur für einzelne Mails.
  • Privilegierte Konten und Service-Accounts gehören in Audit und MFA-Ausnahmen ganz nach oben – Mythos und GPT-5.5 sind in den AISI-Tests gerade dort am erfolgreichsten.
  • Vendor-Risiko: Wer Mythos oder GPT-5.5 über Bedrock, Azure oder Workspace bezieht, sollte vertraglich klären, welche Safety-Updates wann eingespielt werden.

Der nächste Datenpunkt steht im Kalender

AISI hat angekündigt, weitere Modelle nach demselben Schema zu testen. Spannend wird, wann das erste Open-Weight-Modell – etwa aus China – die Schwelle zum erfolgreichen «Last Ones»-Durchgang knackt. Sobald das passiert, ist der Mythos-Vorsprung als Defensivargument vom Tisch und die Diskussion verschiebt sich endgültig in Richtung Hardening, Detection und regulatorischer Leitplanken.

Bis dahin gilt: Die zwei Modelle, die heute Cyber-Operationen auf Expertenniveau durchspielen können, kommen aus San Francisco. Beide stehen unter Aufsicht. Beide sind in Europa nur über Enterprise-Verträge erhältlich. Und beide werden in den nächsten Wochen wieder Massstäbe setzen – nicht nur für Angreifer, sondern auch für die, die ihnen einen Schritt voraus sein wollen.

Fazit

Mit GPT-5.5 erreicht ein zweites Frontier-Modell das Cyber-Offensiv-Niveau von Mythos – defensive Vorbereitung muss sich an der ganzen Modellklasse ausrichten, nicht mehr an einzelnen Anbietern.

Quellen

  • AISI – Our evaluation of OpenAI's GPT-5.5 cyber capabilities(wird in neuem Tab geöffnet)
  • AISI – Our evaluation of Claude Mythos Preview's cyber capabilities(wird in neuem Tab geöffnet)
  • The Decoder – GPT-5.5 matches Claude Mythos in cyber attack tests(wird in neuem Tab geöffnet)
  • Decrypt – GPT-5.5 Matches Claude Mythos in Cyberattack Capabilities(wird in neuem Tab geöffnet)
  • Simon Willison – Our evaluation of OpenAI's GPT-5.5 cyber capabilities(wird in neuem Tab geöffnet)
  • OpenAI Deployment Safety Hub – GPT-5.5(wird in neuem Tab geöffnet)
Teilen:

Das könnte dich auch interessieren

Illustration zweier Hochhäuser mit Aktentaschen und Verträgen, kinewsletter.ch Stil
Illustration zweier Hochhäuser mit Aktentaschen und Verträgen, kinewsletter.ch Stil
KI-Business
5. Mai 2026

Anthropic gegen OpenAI: Beide Labs zünden am selben Tag ein PE-Vehikel für Enterprise-KI

Anthropic und OpenAI haben am selben Tag konkurrierende Enterprise-Vehikel mit Wall Street verkündet. Anthropic baut mit Blackstone, Goldman und Hellman & Friedman eine 1,5-Mrd.-Firma; OpenAI startet mit TPG, Bain und SoftBank «The Deployment Company» mit 10 Mrd. Bewertung – und garantiert Investoren 17,5% Rendite pro Jahr.

Beide Labs schalten die KI-Beratungsindustrie aus und verkaufen ein Stück ihrer Enterprise-Marge an Private-Equity-Häuser, um direkten Zugang zu deren Portfolio-Firmen zu bekommen.

Weiterlesen
Illustration: Keksdose mit Krümeln und Lupe, kinewsletter.ch Stil
Illustration: Keksdose mit Krümeln und Lupe, kinewsletter.ch Stil
Regulierung & Ethik
4. Mai 2026

OpenAI macht ChatGPT-Free zur Werbe-Pipeline – per Default

OpenAI aktiviert für Free-Konten standardmässig Marketing-Cookies. Cookie-IDs und E-Mail-Adressen wandern an Werbepartner – Plus- und Enterprise-Accounts bleiben verschont. Was das für dich heisst und wie du den Schalter umlegst.

OpenAI dreht den Datenschutz-Default um: Free-Nutzer werden ohne aktive Zustimmung zur Werbe-Pipeline – Plus und Enterprise nicht.

Weiterlesen
Illustration einer Code-Datei mit Schweizer Kreuz-Schloss und Magnifier, der Schwachstellen markiert, kinewsletter.ch Stil
Illustration einer Code-Datei mit Schweizer Kreuz-Schloss und Magnifier, der Schwachstellen markiert, kinewsletter.ch Stil
KI-Tools & Apps
1. Mai 2026

Claude Security in Public Beta – Anthropic kontert die Mythos-getriebene Bedrohungslage

Anthropic hat Claude Security als Public Beta für Enterprise-Kunden gestartet. Das auf Opus 4.7 basierende Tool scannt Code-Repositories, validiert Schwachstellen und liefert Patch-Vorschläge – die direkt in Claude Code übernommen werden können. CrowdStrike, Microsoft Security, Palo Alto, SentinelOne, TrendAI und Wiz integrieren parallel Opus 4.7.

Wenn Mythos die Offensive industrialisiert, ist Claude Security die Defensive – Anthropics Antwort auf die eigene Zero-Day-Welle und ein neuer Standard für Software-Security-Workflows in 2026.

Weiterlesen