Mit RTX Spark will Nvidia Windows-Geräte stärker für lokale KI-Anwendungen positionieren. Der neue Chip richtet sich nicht an klassische Linux-Workstations, sondern an Windows-Laptops und kompakte Desktops für Endkunden. Damit tritt Nvidia in ein Segment ein, das bisher vor allem von Apple Silicon, Qualcomms Snapdragon-Plattformen sowie klassischen x86-Systemen von Intel und AMD geprägt wird.
Vorgestellt wurde RTX Spark auf der GTC Taipei. Im Top-Ausbau nutzt Nvidia denselben GB10 Grace Blackwell Superchip, der bereits in der DGX Spark steckt. Die neue Variante ist jedoch auf Windows-Geräte zugeschnitten. Geplant sind mehrere Ausführungen mit unterschiedlicher Kern- und SM-Zahl sowie Speicheroptionen zwischen 16 und 128 GB.
Die stärkste Ausführung kombiniert eine Blackwell-RTX-GPU mit 6.144 CUDA-Kernen und Tensor Cores der fünften Generation mit einer 20-Kern-Grace-CPU auf Arm-Basis. CPU und GPU sind über NVLink-C2C verbunden, MediaTek war laut Nvidia am CPU-Design beteiligt. Der gemeinsame Speicher von bis zu 128 GB kann von CPU und GPU genutzt werden. Die angegebene Spitzenleistung von 1 Petaflop bezieht sich auf FP4-Präzision mit Sparsity und ist damit ein theoretischer Idealwert. Die GPU-Leistung soll je nach Anwendung in der Nähe einer GeForce RTX 5070 Laptop GPU liegen.
Strategisch erinnert RTX Spark an den Ansatz von Apple: Arm-CPU, GPU und Speichercontroller sitzen auf einem Package, der Speicher wird gemeinsam genutzt statt in klassischen CPU- und GPU-Speicher getrennt. Apples M4 Max bietet ebenfalls bis zu 128 GB gemeinsamen Speicher bei 546 GB/s Bandbreite, kommt aber auf eine 38-TOPS-Neural-Engine in INT8. RTX Spark erreicht rechnerisch rund 1.000 TOPS, allerdings in FP4 mit Sparsity. Ein direkter Vergleich ist deshalb nur eingeschränkt möglich, der Abstand bei reiner KI-Rechenleistung dürfte dennoch deutlich ausfallen.
Gegenüber Qualcomm setzt Nvidia auf ein anderes Profil. Snapdragon-X-Elite-Systeme haben Windows-on-Arm-Laptops etabliert, der X2 Elite soll bis zu 80 TOPS und 18 Oryon-Kerne erreichen. Diese Plattformen zielen jedoch vor allem auf Microsofts Copilot+-Funktionen. Nvidia will RTX Spark stärker für lokale KI-Inferenz mit Modellen im zweistelligen Milliarden-Parameter-Bereich positionieren. Ein wichtiges Unterscheidungsmerkmal bleibt dabei der native CUDA-Stack mit TensorRT und RTX.
Für lokale KI-Agenten verweist Nvidia zusätzlich auf neue Sicherheitsmechanismen. Windows-Bausteine sollen Identität, Abschottung einzelner Agenten und Richtlinien-Durchsetzung ermöglichen. Die Nvidia OpenShell Runtime ergänzt diese Ebene, indem sie festlegt, was Agenten dürfen, Anfragen je nach Datenschutzeinstellung an lokale oder Cloud-Modelle weiterleitet und persönliche Daten bei Cloud-Anfragen verschleiert. Die Open-Source-Projekte Hermes Agent und OpenClaw sollen diese Schicht bereits in ihre Windows-Apps integrieren.
Auch Adobe bereitet seine Anwendungen auf diese Geräteklasse vor. Premiere soll eine neue Video-Pipeline mit Nvidia-TensorRT-Integration erhalten, Photoshop eine Engine mit GPU-beschleunigtem Compositing. Auf RTX Spark soll Premiere zusätzlich vom gemeinsamen Speicher profitieren. Adobe nennt bis zu doppelt so schnelle KI-, Editing- und Effekt-Workflows als Ziel.
Neben RTX Spark stellte Nvidia die DGX Station for Windows vor. Sie basiert auf dem GB300 Grace Blackwell Ultra Desktop Superchip, bietet bis zu 748 GB gemeinsamen Speicher und erreicht laut Nvidia 20 Petaflops FP4-Leistung. Damit sollen Modelle mit bis zu einer Billion Parametern lokal ausgeführt werden können. Die DGX Station for Windows ist für das vierte Quartal 2026 geplant.
RTX-Spark-Geräte sollen ab Herbst 2026 von ASUS, Dell, HP, Lenovo, Microsoft Surface und MSI erhältlich sein. Für Unternehmen, Entwickler und Power-User wird damit vor allem relevant, ob lokale KI-Agenten künftig nicht mehr nur Spezialhardware oder Cloud-Infrastruktur benötigen, sondern direkt auf Windows-Hauptgeräten praktikabel werden.
