NewsKategorienNewsletter-ArchivÜber unsKostenlos abonnieren

Der wöchentliche KI-Newsletter für die Schweiz. Kompakt, relevant, zero Bullshit. 5 Minuten lesen, 1 Woche informiert.

FOLGE UNS
LIXIG
NAVIGATION
Alle NewsNewsletter-ArchivAutorenÜber unsKontakt
KATEGORIEN
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
RECHTLICHES
ImpressumDatenschutzAGB
© 2026 Inoo GmbH · Altstätten SG · Schweiz
Ein Produkt von InooSwiss Made Software
HOME·NEWS·KI-FORSCHUNG

12 Mio. Token in einem Prompt: Subquadratic startet mit 29 Mio. Dollar – und ein paar mahnenden Stimmen

Das Miami-Startup Subquadratic ist mit einer 29-Mio.-Dollar-Seed-Runde gestartet und stellt SubQ 1M-Preview vor – ein Sprachmodell mit 12 Mio. Token Kontext und einer neuen Aufmerksamkeits-Architektur (SSA), die Compute linear statt quadratisch skaliert. CEO ist Justin Dangel, CTO Alex Whedon (Ex-Meta).

Pascal Eugster
Pascal Eugster
GRÜNDER & ENTWICKLER
6. MAI 2026
4 MIN. LESEZEIT
Illustration einer Bibliothek mit Bücherregalen, Leiter und Lupe auf Lesetisch, kinewsletter.ch Stil
Illustration einer Bibliothek mit Bücherregalen, Leiter und Lupe auf Lesetisch, kinewsletter.ch Stil
INHALT
01Was bei Transformern nicht skaliert02Was an Zahlen kommuniziert wurde03Wer dahintersteckt – und woher das Geld kommt04Der Kleingedruckte: Skepsis aus der Forschungs-Community05Schweiz-Bezug06Einordnung
INHALT
01Was bei Transformern nicht skaliert02Was an Zahlen kommuniziert wurde03Wer dahintersteckt – und woher das Geld kommt04Der Kleingedruckte: Skepsis aus der Forschungs-Community05Schweiz-Bezug06Einordnung
in
PARTNER · INOO GMBH
Wie viel KI verträgt dein Betrieb? In 30 Minuten Klartext.

Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.

Gespräch buchen →
DAS WICHTIGSTE IN KÜRZE

Wenn die Sparse-Attention-Architektur unabhängig verifiziert wird, ist das der grösste Architektur-Sprung seit dem Transformer – aber bisher fehlen Weights, Peer-Review und API-Pricing.

Ein Startup aus Miami namens Subquadratic ist heute mit einer 29-Mio.-Dollar-Seed-Runde aus dem Stealth-Modus getreten und behauptet, das gelöst zu haben, woran Transformer-Modelle seit Jahren scheitern: ein Sprachmodell, dessen Aufmerksamkeits-Compute nicht quadratisch, sondern linear mit der Eingabe wächst. Das Resultat heisst SubQ 1M-Preview, hat ein 12-Millionen-Token-Kontextfenster und kostet laut Hersteller ein Fünftel von Frontier-Modellen wie Claude Opus oder GPT-5.5. Die Forschung-Community ist gespalten – zwischen «grösster Architektur-Durchbruch seit dem Transformer» und «AI Theranos».

Was bei Transformern nicht skaliert

Die Aufmerksamkeit (engl. attention) – das Herzstück jedes modernen Sprachmodells – wächst bei Transformern quadratisch mit der Tokenzahl: Wer den Kontext von 1 auf 2 Mio. Tokens verdoppelt, vervierfacht den Compute-Bedarf. Bei 12 Mio. Tokens ist das schlicht zu teuer für die Praxis. Genau hier setzt Subquadratics neue Architektur an: Subquadratic Sparse Attention (SSA). Statt jeden Token mit jedem zu vergleichen, wählt SSA für jede Anfrage nur eine kleine Untermenge relevanter Positionen aus und rechnet exakte Aufmerksamkeit nur dort. Bei 12 Mio. Tokens reduziert das den Attention-Compute laut Subquadratic um fast das Tausendfache. Komplexitätstheoretisch verschiebt sich die Skalierung von O(n²) auf O(n).

Was an Zahlen kommuniziert wurde

Die Hersteller-Benchmarks vergleichen SubQ 1M-Preview gegen Claude Opus 4.6 / 4.7, Gemini 3.1 Pro und GPT-5.4 / 5.5:

  • SWE-Bench Verified (Coding-Aufgaben): 81,8% bei SubQ, 87,6% bei Opus 4.7
  • RULER @ 128K (Long-Context): 95,0% bei SubQ, 94,8% bei Opus 4.6 (intern evaluiert)
  • MRCR v2 8-needle, 1M (Multi-round Coreference): 65,9% bei SubQ, 78,3% bei Opus 4.6, 74,0% bei GPT-5.5

Subquadratic spricht zusätzlich von 52× schneller als FlashAttention bei 1 Mio. Tokens und einem Output von 150 Tokens pro Sekunde. Die Architektur ist auf zwei Produkte gemappt: SubQ API (OpenAI-kompatible Endpoints, Streaming, Tool-Use) und SubQ Code – ein CLI-Coding-Agent, der ganze Repositories in einen Kontext lädt und mit Claude Code, OpenAI Codex und Cursor zusammenarbeitet.

Wer dahintersteckt – und woher das Geld kommt

CEO ist Justin Dangel, fünffacher Gründer mit Exits in Health-Tech, Insurtech und Consumer-Goods. CTO ist Alex Whedon, früher Software-Engineer bei Meta und Head of Generative AI bei TribeAI. Die Forscher kommen laut eigener Angabe aus Meta, Google, Oxford, Cambridge und der Brigham Young University.

Die 29-Mio.-Seed-Runde bewertet das Unternehmen laut The New Stack mit 500 Mio. Dollar. Mit dabei: Justin Mateen (Tinder-Mitgründer, JAM Fund), Javier Villamizar (ehemaliger Partner SoftBank Vision Fund) und Frühinvestoren von Anthropic, OpenAI, Stripe und Brex. Parallel hat SubQ am 4. Mai einen 24-monatigen GPU-Mietvertrag über 19,6 Mio. Dollar mit dem Compute-Anbieter Digi Power X geschlossen – Inbetriebnahme am 15. Mai 2026.

Der Kleingedruckte: Skepsis aus der Forschungs-Community

VentureBeat fasst die Reaktionen pointiert zusammen: «SubQ ist entweder der grösste Durchbruch seit dem Transformer – oder AI Theranos.» Drei Punkte stehen im Raum:

  • Benchmark-Methodik: Jedes Modell wurde nur einmal durchlaufen wegen hoher Inferenzkosten. Ohne Konfidenzintervalle bleibt Raum für Varianz.
  • Lab-zu-Produktion-Lücke: Im internen Labor-Run schaffte SubQ auf MRCR v2 stolze 83 Punkte – die per Drittanbieter verifizierte Produktionsversion 65,9. Die 17-Punkte-Differenz ist nicht erklärt.
  • Keine Weights, kein vollständiger Technical Report: Bisher nur ein Blogpost zur Architektur. Pricing-Details für die API sind ebenfalls nicht öffentlich – das macht den «50× günstiger»-Claim aktuell unprüfbar.

Schweiz-Bezug

Lange Kontextfenster sind genau die Eigenschaft, die Schweizer Banken, Pharma-Unternehmen und Treuhand-Häuser interessiert. Wer einen kompletten Kreditakte-Stack, eine ganze klinische Studie oder mehrere Jahre Buchhaltungsdaten in einen Prompt packen kann, spart die ganze Komplexität von Retrieval-Augmented-Generation-Pipelines (RAG) und vermeidet die typischen Fehlerquellen beim Chunking. Für Coding-Teams bei Swisscom, Logitech, Postfinance oder ETH-Spin-offs ist SubQ Code interessant, weil es die ständige Verschiebung zwischen Repository-Kontext und Modell-Antwort eliminiert. Dass Schweizer Forschung an dem Thema arbeitet, ist bekannt: Apertus aus dem ETH-EPFL-Verbund und State-Space-Modelle wie Mamba haben verwandte Ideen verfolgt. SubQ ist das US-Pendant, das jetzt zuerst ein Produkt am Markt hat – wenn die Behauptungen halten.

Einordnung

Wenn die SSA-Architektur in unabhängigen Reproduktionen bestätigt wird, ist das tatsächlich der grösste Architektur-Sprung seit dem Transformer von 2017. Die Frage ist, wie schnell. Bisher hat Subquadratic einen Blog-Post, einen Investorenkreis und einen Compute-Vertrag – aber keine Weights und keinen Peer-Review. Wer im Enterprise-Umfeld auf SubQ setzt, sollte kurzfristig Pilot-Workloads laufen lassen und längerfristig auf das Technical-Paper warten. Der Underdog-Trade ist klar: Eine kleine Wette, dass die Branche sich in zwei Jahren nicht mehr nur über Modellgrössen, sondern über Aufmerksamkeits-Sparsamkeit unterhält.

Quellen

Subquadratic launches with $29M to bring 12M-token context windows to AI – SiliconANGLE↗ EXTERNER LINKThe context window has been shattered: Subquadratic debuts a 12-million-token window – The New Stack↗ EXTERNER LINKMiami startup Subquadratic claims 1,000x AI efficiency gain – VentureBeat↗ EXTERNER LINKIntroducing SubQ: The First Fully Subquadratic LLM – subq.ai↗ EXTERNER LINKHow SSA Makes Long Context Practical – subq.ai↗ EXTERNER LINKDigi Power X Signs First AI Revenue Contract – $19.6M, 24-Month SubQ AI Agreement – StockTitan↗ EXTERNER LINKSubQ Review: The First Subquadratic LLM – FelloAI↗ EXTERNER LINK
TEILEN
LinkedIn→X / Twitter→E-Mail→
KOSTENLOS ABONNIEREN
Diese News jeden Freitag in dein Postfach?

WEITERLESENDas könnte dich auch interessieren.

Illustration eines Mikroskops im Labor, kinewsletter.ch Stil
Dark Illustration, kinewsletter.ch Stil
KI-FORSCHUNG·19. JUNI 2026

KI besteht nur jede dritte Forschungsaufgabe

OpenAIs neuer Test LifeSciBench prüft KI an 750 echten Aufgaben aus der Life-Science-Forschung. Das beste Modell löst nur 36 Prozent – ein nützlicher Dämpfer für überzogene Erwartungen an KI im Labor.

Handgezeichnete Skizze eines Bildschirms mit einer kurvigen Strasse in eine Berglandschaft, davor ein Spielzeugauto und eine Kamera auf einem Stativ
Handgezeichnete Skizze eines Bildschirms mit einer kurvigen Strasse in eine Berglandschaft, davor ein Spielzeugauto und eine Kamera auf einem Stativ (Dark Mode)
KI-FORSCHUNG·12. JUNI 2026

Diese KI träumt sich Strassen für Roboterautos

Das Startup Decart hat mit Oasis 3 ein Weltmodell vorgestellt, das fotorealistische Strassenszenen in Echtzeit erfindet – ein endloser Fahrsimulator, um selbstfahrende Autos auch mit seltenen Situationen zu trainieren. Noch fahren die Autos aber durch Wände.

Handgezeichnete Skizze eines Computerchips auf einer Werkbank mit elektroblau leuchtenden aufsteigenden Blasen, Druckmanometer und Kühlschlauch
Handgezeichnete Skizze eines Computerchips auf einer Werkbank mit elektroblau leuchtenden aufsteigenden Blasen, Druckmanometer und Kühlschlauch (Dark Mode)
KI-FORSCHUNG·11. JUNI 2026

Kühlen wie im Atomreaktor – KI-Server ohne Wasser

Ein MIT-Spin-off namens Ferveret kühlt KI-Chips mit einem Trick aus der Kernreaktor-Physik – ganz ohne Wasser und mit deutlich weniger Strom. Im Test holte das System 35 Prozent mehr Rechenleistung aus derselben Energie.