Google DeepMind hat ein neues Embodied-Reasoning-Modell veröffentlicht, das Robotern räumliches Denken und Instrumentenablesung beibringt – entwickelt in Partnerschaft mit Boston Dynamics.
Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.
DeepMinds Gemini Robotics-ER 1.6 bringt Robotern räumliches Denken und präzise Instrumentenablesung bei – Boston Dynamics' Spot nutzt es bereits in Industrieanlagen weltweit.
Gemini Robotics-ER 1.6 ist das kognitive Gehirn für Roboter: ein Reasoning-Modell, das komplexe Aufgaben in Teilschritte zerlegt, externe Tools aufruft und entscheidet, wann ein Schritt wiederholt werden muss. Die Architektur folgt dem Dual-System-Ansatz – ER als Stratege, Vision-Language-Action-Modelle (VLAs) als Ausführende.
Die wichtigste Neuerung ist Instrument Reading: Roboter wie Boston Dynamics' Spot können nun Druckmesser, Sichtgläser und digitale Anzeigen in Industrieanlagen autonom ablesen. Dafür nutzt das Modell «Agentic Vision» – es zoomt zunächst in das Bild, schätzt Proportionen per Code-Ausführung und interpretiert den Messwert mit Weltwissen. Die Erfolgsrate stieg von 23 Prozent (ER 1.5) über 67 Prozent (Gemini 3.0 Flash) auf 86 Prozent – und mit Agentic Vision auf 93 Prozent.
Neben der Instrumentenablesung verbessert ER 1.6 die räumliche Logik, Multi-View-Wahrnehmung und Sicherheitsinstruktions-Befolgung. Bei der Erkennung von Sicherheitsrisiken in Videos liegt das Modell 10 Prozent über Gemini 3.0 Flash. Boston Dynamics hat ER 1.6 bereits in sein Produkt Orbit AIVI-Learning integriert – seit dem 8. April für alle Kunden verfügbar. Das Modell ist auch über Google AI Studio und die Gemini API zugänglich.
Die ETH Zürich bleibt Europas Referenzadresse für Laufroboter. Marco Hutters Robotic Systems Lab hat mit ANYbotics eines der erfolgreichsten Deep-Tech-Spinoffs hervorgebracht – das Unternehmen skaliert autonome Inspektionsroboter mit über 150 Millionen Dollar Gesamtfinanzierung global. Im August 2026 findet in Zürich ein Robotics-Hackathon statt, organisiert unter anderem von ETH RSL und ANYbotics, bei dem LLMs und multimodale KI mit Roboterhardware verbunden werden.