NewsKategorienNewsletter-ArchivÜber unsKostenlos abonnieren

Der wöchentliche KI-Newsletter für die Schweiz. Kompakt, relevant, zero Bullshit. 5 Minuten lesen, 1 Woche informiert.

FOLGE UNS
LIXIG
NAVIGATION
Alle NewsArchivNewsletter-ArchivAutorenÜber unsKontakt
KATEGORIEN
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
RECHTLICHES
ImpressumDatenschutzAGB
© 2026 Inoo GmbH · Altstätten SG · Schweiz
Ein Produkt von InooSwiss Made Software
HOME·NEWS·NEUE MODELLE

Chinas GLM-5.2 schlägt Claude beim Bug-Hunting

Ein offenes chinesisches Modell hat im unabhängigen Sicherheits-Test mehr Schwachstellen gefunden als Anthropics Claude – zu einem Sechstel der Kosten und frei zum Herunterladen. Das stellt die US-Exportkontrollen für KI infrage.

Pascal Eugster
Pascal Eugster
GRÜNDER & ENTWICKLER
30. JUNI 2026
3 MIN. LESEZEIT
Handgezeichnete Skizze einer grossen Lupe ueber einem Block Programmcode, die einen versteckten Software-Bug aufdeckt, mit elektroblauem Akzent
Handgezeichnete Skizze einer grossen Lupe ueber einem Block Programmcode, die einen versteckten Software-Bug aufdeckt, mit elektroblauem Akzent (Dark Mode)
INHALT
01Was der Test zeigt02Warum GLM-5.2 anders ist03Die politische Sprengkraft04Was du im Kopf behalten solltest
INHALT
01Was der Test zeigt02Warum GLM-5.2 anders ist03Die politische Sprengkraft04Was du im Kopf behalten solltest
in
PARTNER · INOO GMBH
Wie viel KI verträgt dein Betrieb? In 30 Minuten Klartext.

Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.

Gespräch buchen →
DAS WICHTIGSTE IN KÜRZE

Zhipu AIs frei verfügbares GLM-5.2 schlägt Claude beim Aufspüren von Software-Lücken – und untergräbt damit die Logik der US-Exportbeschränkungen.

Ein kleines chinesisches Modell hat gerade etwas geschafft, das man in Washington nur ungern hört: In einem unabhängigen Sicherheits-Test fand GLM-5.2 von Zhipu AI mehr Schwachstellen als Anthropics Claude – zu einem Sechstel der Kosten und frei zum Herunterladen.

Was der Test zeigt

Die Sicherheitsfirma Semgrep liess mehrere Modelle auf denselben Datensatz los: Sie sollten sogenannte IDOR-Lücken aufspüren – Zugriffsfehler, bei denen eine App nicht prüft, ob du wirklich auf fremde Daten zugreifen darfst. Solche Lücken sind tückisch, weil es keinen verdächtigen Code gibt, sondern nur eine fehlende Prüfung.

Das Ergebnis überraschte selbst die Tester. GLM-5.2 erreichte einen F1-Wert von 39 Prozent und schlug damit Claude Code (37 respektive 28 Prozent) – und das mit nichts als einem Prompt, ohne jede zusätzliche Hilfsstruktur. Pro gefundener Schwachstelle kostete der Lauf rund 17 US-Cent.

«Unter den Modellen, die nur einen Prompt bekamen, schlug die beste Open-Weight-Option Claude Opus 4.8.» – Semgrep Security Research

Warum GLM-5.2 anders ist

Das Modell von Zhipu AI (Z.ai) wurde Mitte Juni veröffentlicht – und zwar open weight unter einer freien MIT-Lizenz. Heisst: Jede und jeder kann die Gewichte herunterladen, lokal betreiben und anpassen. Für Sicherheitsteams, die mit sensiblen Daten arbeiten, ist genau das attraktiv, weil das Modell vollständig im eigenen Haus laufen kann.

Technisch ist GLM-5.2 ein Mixture-of-Experts-Modell mit rund 750 Milliarden Parametern, von denen pro Anfrage nur etwa 40 Milliarden aktiv sind. Das hält die Kosten tief. Auf gängigen Coding-Benchmarks liefert es die stärksten Open-Weight-Werte: 81,0 Punkte auf Terminal-Bench 2.1 (Claude Opus 4.8: 85,0) und 62,1 auf SWE-bench Pro.

Die politische Sprengkraft

Die Pointe liegt im Timing. Genau jene Fähigkeit – eigenständig Software-Lücken finden – hatte die US-Regierung zum Anlass genommen, Anthropics Spitzenmodelle Mythos und Fable mit Exportbeschränkungen zu belegen. Die Idee: Wer Gegnern den Zugang zu solchen Modellen verwehrt, verhindert offensive Cyber-Fähigkeiten.

GLM-5.2 stellt diese Annahme infrage. Während Claude reguliert ist, lässt sich das chinesische Modell weltweit frei herunterladen. Eine Exportkontrolle bringt wenig, wenn vergleichbare Fähigkeit längst offen verfügbar ist.

Was du im Kopf behalten solltest

Der Test betrifft eine einzige Aufgabe, einen einzigen Datensatz – kein Gesamturteil über die Modelle. Semgreps eigene, spezialisierte Pipeline lag mit 53 bis 61 Prozent klar vorn; gute Werkzeuge schlagen also nach wie vor das blanke Modell. Und Zhipu räumt selbst ein, dass GLM-5.2 zu «Reward-Hacking» neigt, also im Training gerne mal die Bewertung austrickste.

Trotzdem bleibt die Botschaft: Open-Weight-Modelle haben eine Schwelle überschritten. Für Schweizer Firmen, die KI sicher und kostenbewusst einsetzen wollen, lohnt sich ein zweiter Blick auf Alternativen jenseits der teuren Frontier-Modelle.

Quellen

Semgrep – We have Mythos at Home: GLM 5.2 beats Claude in our Cyber Benchmarks↗ EXTERNER LINKTech Times – AI Export Controls Fail Their First Real Test: GLM-5.2 Cybersecurity Benchmarks↗ EXTERNER LINKForbes – The bad guys now have a model as powerful as Mythos↗ EXTERNER LINK
TEILEN
LinkedIn→X / Twitter→E-Mail→
KOSTENLOS ABONNIEREN
Diese News jeden Freitag in dein Postfach?

WEITERLESENDas könnte dich auch interessieren.

Handgezeichnete Skizze eines Tischkalenders, dessen Blatt von Juni auf Juli umblaettert, daneben eine pausierte Stoppuhr und kleine Zahnraeder, mit elektroblauem Akzent
Handgezeichnete Skizze eines Tischkalenders, dessen Blatt von Juni auf Juli umblaettert, daneben eine pausierte Stoppuhr und kleine Zahnraeder, mit elektroblauem Akzent (Dark Mode)
NEUE MODELLE·29. JUNI 2026

Google verschiebt Gemini 3.5 Pro auf Juli

Google verschiebt sein neues Spitzenmodell Gemini 3.5 Pro auf Juli. Eigentlich war der Start für Juni geplant – doch das Modell bleibt vorerst in einer geschlossenen Vorschau. Die Verzögerung trifft den Konzern mitten in einer turbulenten Woche mit Forscher-Abgängen und Börsenverlusten.

Handgezeichnete Skizze von drei unterschiedlich grossen Kugeln auf Podesten in einer Observatoriumshalle, davor eine Absperrkordel, mit elektroblauem Akzent
Handgezeichnete Skizze von drei unterschiedlich grossen Kugeln auf Podesten in einer Observatoriumshalle, davor eine Absperrkordel, mit elektroblauem Akzent (Dark Mode)
NEUE MODELLE·27. JUNI 2026

OpenAI zeigt GPT-5.6 – aber fast niemand darf ran

OpenAI hat GPT-5.6 vorgestellt – drei Modelle namens Sol, Terra und Luna. Doch statt für alle gibt es zunächst nur eine «Limited Preview» für wenige Partner, auf Wunsch der US-Regierung. OpenAI selbst hält diese behördliche Vorab-Freigabe für keinen guten Dauerzustand.

Handgezeichnete Skizze eines Blatt Papiers, auf dem sich aus einer Wolke verstreuter Tintenpunkte Textzeilen bilden, daneben ein Füllfederhalter und ein kleiner Computer
Handgezeichnete Skizze eines Blatt Papiers, auf dem sich aus einer Wolke verstreuter Tintenpunkte Textzeilen bilden, daneben ein Füllfederhalter und ein kleiner Computer (Dark Mode)
NEUE MODELLE·12. JUNI 2026

Googles Modell schreibt Text, wie ein Bild entsteht

Googles neues, offenes Modell DiffusionGemma erzeugt Text nicht Wort für Wort, sondern ganze Blöcke auf einmal – wie ein Bildgenerator aus Rauschen ein Motiv schärft. Das macht es bis zu viermal schneller und lässt es lokal auf dem eigenen Rechner laufen.

Handgezeichnete Skizze eines grossen Notbremshebels an einem Schaltpult mit einem Schmetterling und elektroblauem Akzent
Handgezeichnete Skizze eines grossen Notbremshebels an einem Schaltpult mit einem Schmetterling und elektroblauem Akzent
NEUE MODELLE·10. JUNI 2026

Claude Fable 5: Anthropics stärkstes Modell – mit Notbremse

Anthropic hat am 9. Juni Claude Fable 5 veröffentlicht – das fähigste Modell, das je für alle zugänglich war. Bei heiklen Themen wie Cybersecurity übergibt es heimlich an das schwächere Opus 4.8. Parallel kommt Mythos 5 für Cyber-Verteidiger.

Handgezeichnete Skizze eines elektroblau leuchtenden Computerchips auf einem Holzschreibtisch, daneben eine Sanduhr, aufgefaecherte Buchseiten und eine Schreibtischlampe
Handgezeichnete Skizze eines elektroblau leuchtenden Computerchips auf einem Holzschreibtisch, daneben eine Sanduhr, aufgefaecherte Buchseiten und eine Schreibtischlampe (Dark Mode)
NEUE MODELLE·5. JUNI 2026

MiniMax M3: viel Kontext, wenig Rechenaufwand

Das chinesische Labor MiniMax bringt mit M3 ein offenes Modell, das eine Million Token verarbeitet – und dafür nur ein Zwanzigstel der Rechenleistung des Vorgängers braucht. Gewichte folgen in zehn Tagen.

Skizze einer Werkbank, an der eine Person eine Reihe kleiner elektroblauer Roboterfiguren zusammenbaut, offener Werkzeugkasten, Bauplan an der Wand, Fenster mit Morgenlicht
Skizze einer Werkbank, an der eine Person eine Reihe kleiner elektroblauer Roboterfiguren zusammenbaut, offener Werkzeugkasten, Bauplan an der Wand, Fenster mit Morgenlicht (Dark)
NEUE MODELLE·3. JUNI 2026

Microsoft baut sieben eigene KI-Modelle – und löst sich von OpenAI

An der Build 2026 hat Microsoft sieben eigene MAI-Modelle vorgestellt – fürs Schlussfolgern, Programmieren, Sprache und Bild. Das erklärte Ziel: weniger Abhängigkeit von Partner OpenAI.

Mehr aus Neue Modelle →