Neue KI-Modelle, Releases, Benchmarks und Fähigkeiten – Claude, GPT, Gemini, Llama und mehr.

OpenAI hat drei neue Voice-Modelle veröffentlicht: GPT-Realtime-2 mit GPT-5-Reasoning, GPT-Realtime-Translate für Live-Übersetzung in 70 Sprachen und GPT-Realtime-Whisper für Streaming-Transkription. Voice ist damit nicht mehr Demo-Feature, sondern operativer Bauklotz für Produkte.
Drei API-Endpunkte – Reasoning-Voice, Live-Translation und Streaming-Transkription – die das Voice-Modell zum echten Produkt-Bauklotz machen.

Anthropic hat einen Compute-Deal mit SpaceX über die volle Kapazität des Colossus-1-Datacenters in Memphis verkündet: 300 Megawatt, über 220'000 NVIDIA-GPUs. Parallel verdoppeln sich die 5h-Limits in Claude Code, die Peak-Hour-Drosselung fällt weg, und API-Limits für Opus steigen massiv. Im Vertrag versteckt: Interesse an orbitaler Compute-Kapazität.
Mehr Compute, weniger Limits, härteres Statement im Compute-Wettrüsten – und Musks SpaceX als unerwarteter Lieferant.

OpenAI hat GPT-5.5 Instant ausgerollt: 52,5 % weniger Halluzinationen bei heiklen Themen und ein neues Memory-Sources-Feature, das endlich offenlegt, woran sich ChatGPT erinnert. Das Modell ist neuer Default in ChatGPT.
GPT-5.5 Instant ist der neue ChatGPT-Default mit 52,5 % weniger Halluzinationen und transparentem «Memory Sources»-Feature.

Das Miami-Startup Subquadratic ist mit einer 29-Mio.-Dollar-Seed-Runde gestartet und stellt SubQ 1M-Preview vor – ein Sprachmodell mit 12 Mio. Token Kontext und einer neuen Aufmerksamkeits-Architektur (SSA), die Compute linear statt quadratisch skaliert. CEO ist Justin Dangel, CTO Alex Whedon (Ex-Meta).
Wenn die Sparse-Attention-Architektur unabhängig verifiziert wird, ist das der grösste Architektur-Sprung seit dem Transformer – aber bisher fehlen Weights, Peer-Review und API-Pricing.

Mistral hat Medium 3.5 ausgerollt – ein dichtes 128B-Modell mit 256k Kontext, das Chat, Reasoning und Coding in einem einzigen Set Gewichte vereint. 77,6 Prozent auf SWE-Bench, offene Gewichte unter modifizierter MIT-Lizenz und neue Cloud-Agenten in Vibe und Le Chat.
Mistral Medium 3.5 schlägt Devstral 2 und positioniert Europa mit offenen Gewichten und kompakter 4-GPU-Architektur als Coding-Frontier-Alternative zu OpenAI und Anthropic.

Das britische AI Safety Institute hat OpenAIs GPT-5.5 einem harten Cyber-Stresstest unterzogen. Das Ergebnis: Das Modell schliesst auf Anthropics Mythos auf – und löst die nächste Welle von Sicherheitsfragen aus. Was Schweizer CISOs jetzt wissen müssen.
Mit GPT-5.5 erreicht ein zweites Frontier-Modell das Cyber-Offensiv-Niveau von Mythos – defensive Vorbereitung muss sich an der ganzen Modellklasse ausrichten, nicht mehr an einzelnen Anbietern.

Zwei Tage, zwei Meilensteine: DeepSeek liefert das grösste Open-Weights-Modell der Geschichte, Alibabas Qwen3.6 schlägt mit 27 Milliarden Parametern ein 15-mal grösseres Modell beim Coding.
DeepSeek V4-Pro ist mit 1,6 Billionen Parametern das grösste Open-Weights-Modell der Geschichte, während Qwen3.6-27B beweist, dass ein kompaktes Modell auf einer einzelnen GPU Flagship-Coding-Performance liefern kann – der Druck auf proprietäre Labs war nie grösser.

Sechs Wochen nach GPT-5.4 legt OpenAI nach: GPT-5.5 soll das smarteste Modell des Unternehmens sein – mit doppeltem API-Preis, aber deutlich höherer Token-Effizienz.
OpenAIs GPT-5.5 «Spud» ist schneller und token-effizienter als sein Vorgänger, verdoppelt aber den API-Preis – sechs Wochen nach GPT-5.4 ein Signal, dass das KI-Wettrüsten keine Pause kennt.

AMD-Ingenieurin analysiert 6.852 Claude-Code-Sessions und dokumentiert einen massiven Rückgang der Denktiefe. Anthropic bestätigt zwei Produktänderungen – bestreitet aber gezieltes «Nerfing».
Anthropic bestätigt, dass zwei Produktänderungen die Denktiefe von Claude reduzierten – bestreitet aber gezieltes Nerfing. Eine AMD-Ingenieurin belegt den Leistungseinbruch mit 6.852 analysierten Sessions.

Anthropic hat am 16. April sein neues Flaggschiff-Modell vorgestellt. Claude Opus 4.7 übertrifft GPT-5.4 und Gemini 3.1 Pro in den wichtigsten Coding-Benchmarks – und bringt Features mit, die den Alltag von Entwicklern verändern dürften.
Claude Opus 4.7 setzt mit 87,6 Prozent auf SWE-bench Verified einen neuen Bestwert und überholt GPT-5.4 und Gemini 3.1 Pro – für Entwickler der bisher grösste Sprung zwischen zwei Claude-Generationen.

Neun Claude-Opus-4.6-Agenten übertrafen menschliche Forscher auf einem Alignment-Problem – aber die Methode generalisierte nicht auf Produktionsmodelle.
KI kann Forschung beschleunigen, aber Generalisierung und Reward-Hacking bleiben die zentralen Hürden.

Eine Woche nach Anthropics Project Glasswing schlägt OpenAI zurück: GPT-5.4-Cyber ist für defensive Cybersecurity entwickelt und nur für verifizierte Security-Profis zugänglich.
Das Wettrüsten um KI-gestützte Cyberverteidigung hat offiziell begonnen – mit direkten Folgen für Schweizer Infrastruktur.