Neue Modelle
Neue KI-Modelle, Releases, Benchmarks und Fähigkeiten – Claude, GPT, Gemini, Llama und mehr.
Neue KI-Modelle, Releases, Benchmarks und Fähigkeiten – Claude, GPT, Gemini, Llama und mehr.
Googles neues, offenes Modell DiffusionGemma erzeugt Text nicht Wort für Wort, sondern ganze Blöcke auf einmal – wie ein Bildgenerator aus Rauschen ein Motiv schärft. Das macht es bis zu viermal schneller und lässt es lokal auf dem eigenen Rechner laufen.
Anthropic hat am 9. Juni Claude Fable 5 veröffentlicht – das fähigste Modell, das je für alle zugänglich war. Bei heiklen Themen wie Cybersecurity übergibt es heimlich an das schwächere Opus 4.8. Parallel kommt Mythos 5 für Cyber-Verteidiger.
Das chinesische Labor MiniMax bringt mit M3 ein offenes Modell, das eine Million Token verarbeitet – und dafür nur ein Zwanzigstel der Rechenleistung des Vorgängers braucht. Gewichte folgen in zehn Tagen.
An der Build 2026 hat Microsoft sieben eigene MAI-Modelle vorgestellt – fürs Schlussfolgern, Programmieren, Sprache und Bild. Das erklärte Ziel: weniger Abhängigkeit von Partner OpenAI.
Anthropic hat am 28. Mai Claude Opus 4.8 vorgestellt. Das neue Spitzenmodell ist beim Programmieren und bei agentischen Aufgaben stärker – vor allem aber rund viermal seltener bereit, eigene Fehler unkommentiert durchgehen zu lassen.
Alibabas neues Top-Modell arbeitet 35 Stunden ohne Unterbruch an einer Kernel-Optimierung. Auf Standard-Benchmarks zieht es mit Claude Opus 4.6 gleich.
Der chinesische Anbieter DeepSeek macht den 75-Prozent-Rabatt auf sein Flaggschiff V4-Pro dauerhaft. Output-Tokens kosten 34-mal weniger als GPT-5.5 – mit Compliance-Haken für die Schweiz.
Google hat an der I/O 2026 sein erstes Omni-Modell vorgestellt. Es generiert aus Text, Bild und Audio gleichzeitig ein 10-Sekunden-Video – ab sofort in YouTube Shorts mit SynthID-Watermark.
Google hat an der I/O 2026 mit Gemini 3.5 Flash ein mittleres Modell vorgestellt, das den eigenen Gemini 3.1 Pro auf praktisch jedem agentischen Benchmark schlägt – zu einem Drittel des Preises. Auf dem unabhängigen Intelligence Index liegt es nur zwei Punkte hinter Claude Opus 4.7, kostet aber rund ein Drittel pro Token.
Um 19 Uhr Schweizer Zeit startet Google I/O 2026. Erwartet: ein neuer Gemini-Sprung, proaktive Agenten, Android-XR-Brillen zum Anfassen und das ChromeOS-Nachfolge-System Aluminium OS.
Google hat am 8. Mai Gemini 3.1 Flash-Lite auf der Gemini Enterprise Agent Platform GA gemacht. Mit 0,25 Dollar pro Million Input-Tokens und 2,5-mal schnellerer Time-to-First-Token zielt das Modell auf Hochvolumen-Workflows – und unterbietet OpenAI sowie Anthropic im Preis.
OpenAI hat drei neue Voice-Modelle veröffentlicht: GPT-Realtime-2 mit GPT-5-Reasoning, GPT-Realtime-Translate für Live-Übersetzung in 70 Sprachen und GPT-Realtime-Whisper für Streaming-Transkription. Voice ist damit nicht mehr Demo-Feature, sondern operativer Bauklotz für Produkte.