Mistral hat OCR 4 veröffentlicht: ein Dokumenten-KI-Modell, das Texte samt Struktur – Position, Typ und Konfidenz jedes Blocks – ausliest. Das Modell läuft in einem einzigen Container vollständig selbst gehostet, sodass sensible Daten das eigene Rechenzentrum nie verlassen. Für regulierte Schweizer Branchen wie Banken, Versicherungen und Behörden ist genau das der entscheidende Punkt.
Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.
Mistrals OCR 4 liefert strukturierte Dokumentenerkennung, die komplett im eigenen Rechenzentrum laufen kann – ideal für datensensible Schweizer Branchen.
Mistral hat OCR 4 vorgestellt – ein KI-Modell, das Dokumente nicht nur in Text verwandelt, sondern ihre Struktur gleich mitliefert. Und das Wichtigste für Schweizer Firmen: Es läuft komplett im eigenen Rechenzentrum.
OCR (Optical Character Recognition, also Texterkennung aus Bildern und PDFs) gibt es seit Jahrzehnten. Neu ist, was OCR 4 zusätzlich ausgibt: Für jeden Block auf einer Seite liefert das Modell eine Bounding Box (die genaue Position), eine Typ-Klassifizierung (Titel, Tabelle, Formel, Unterschrift) und einen Konfidenzwert pro Seite und pro Wort. Damit weiss ein nachgelagertes System nicht nur, was auf der Seite steht, sondern auch wo es steht, welche Rolle es spielt und wie sicher sich das Modell ist.
Konkret heisst das: Aus einer Rechnung werden saubere Felder, aus einem Vertrag zitierfähige Abschnitte, aus einem Archiv durchsuchbare Daten – ohne dass jemand die Seiten von Hand abtippt.
Für viele Schweizer Branchen ist das nächste Detail entscheidender als jeder Benchmark. OCR 4 ist klein genug, um in einem einzigen Container zu laufen – also vollständig selbst gehostet, im eigenen Rechenzentrum. Sensible Dokumente verlassen die eigene Infrastruktur gar nicht erst.
Genau das ist für Banken, Versicherungen, Spitäler und Behörden oft die Bedingung, überhaupt mit KI-Dokumentenverarbeitung zu starten. Wer Kundendaten, Patientenakten oder Verfahrensakten nicht in eine fremde Cloud schicken darf, bekommt hier eine Option, die Datenschutz und Datenresidenz von Haus aus mitdenkt.
Mistral liess unabhängige Prüfer das Modell blind gegen die Konkurrenz antreten: Auf über 600 echten Dokumenten in mehr als zwölf Sprachen bevorzugten die Tester OCR 4 im Schnitt in 72 Prozent der Fälle. Auf dem öffentlichen Benchmark OlmOCRBench erreicht es mit 85,20 Punkten den Spitzenplatz.
Bemerkenswert offen: Mistral relativiert die eigenen Benchmark-Zahlen gleich selbst. Viele vermeintliche Fehler seien gar keine, sondern Eigenheiten der Testverfahren – etwa fehlerhafte Referenzdaten oder mathematisch identische, aber unterschiedlich geschriebene Formeln.
«Wir haben gleichwertige Genauigkeit bei rund 8-mal tieferen Kosten und 17-mal tieferer Latenz erreicht.» – Aidan Donohue, AI Engineer bei Rogo
Über die API kostet OCR 4 4 US-Dollar pro 1'000 Seiten, im Batch-Betrieb die Hälfte. Verfügbar ist es ab sofort über Mistrals Studio, Amazon SageMaker und Microsoft Foundry; Snowflake soll folgen. Unterstützt werden 170 Sprachen sowie gängige Formate wie PDF, Word, PowerPoint und OpenDocument.
Einordnung: Der eigentliche Trend hinter OCR 4 ist nicht bessere Texterkennung, sondern die Verlagerung von KI dorthin, wo die Daten liegen. Für regulierte Schweizer Unternehmen ist «läuft bei uns im Haus» oft das stärkste Verkaufsargument überhaupt.