Jensen Huang hat an der GTC 2026 NVIDIAs ambitionierteste Roadmap vorgestellt: Die Vera-Rubin-GPU mit 336 Milliarden Transistoren liefert 50 Petaflops bei Inferenz, NemoClaw öffnet Enterprise-KI-Agenten als Open Source, und mit dem N1X-Chip greift NVIDIA erstmals den Laptop-Markt an – mit mehr GPU-Power als Apples M3 Max.


Anthropic verpflichtet sich gegenüber Google Cloud zu Ausgaben von 200 Milliarden Dollar über fünf Jahre – plus 40 Milliarden Direktinvestment von Alphabet. Die grösste Cloud-Verpflichtung, die je publik wurde.
Anthropic verpflichtet sich zu 200 Mrd. Dollar Ausgaben bei Google Cloud über 5 Jahre – die grösste Cloud-Verpflichtung der KI-Geschichte.

Anthropic hat einen Compute-Deal mit SpaceX über die volle Kapazität des Colossus-1-Datacenters in Memphis verkündet: 300 Megawatt, über 220'000 NVIDIA-GPUs. Parallel verdoppeln sich die 5h-Limits in Claude Code, die Peak-Hour-Drosselung fällt weg, und API-Limits für Opus steigen massiv. Im Vertrag versteckt: Interesse an orbitaler Compute-Kapazität.
Mehr Compute, weniger Limits, härteres Statement im Compute-Wettrüsten – und Musks SpaceX als unerwarteter Lieferant.

Das Miami-Startup Subquadratic ist mit einer 29-Mio.-Dollar-Seed-Runde gestartet und stellt SubQ 1M-Preview vor – ein Sprachmodell mit 12 Mio. Token Kontext und einer neuen Aufmerksamkeits-Architektur (SSA), die Compute linear statt quadratisch skaliert. CEO ist Justin Dangel, CTO Alex Whedon (Ex-Meta).
Wenn die Sparse-Attention-Architektur unabhängig verifiziert wird, ist das der grösste Architektur-Sprung seit dem Transformer – aber bisher fehlen Weights, Peer-Review und API-Pricing.