Hintergründe: Die GPU
Die GA104-GPU wurde im 8-Nanometer-Verfahren (Turing: 12 nm) produziert und umfasst 17,4 Mrd. Transistoren (RTX 3080: 28 Mrd. Transistoren). Sie besteht aus drei Bereichen: der Streaming-Prozessor (CUDA) für die "normalen" und häufig anfallenden Rechenoperationen im Grafiksektor, die RT-Kerne für die Hardware-beschleunigte Berechnung von Raytracing in Echtzeit sowie die Tensor-Kerne, die vor allem bei KI-Anwendungen auf Basis von neuronalen Netzwerken zum Einsatz kommen sollen.
Nvidias "Deep Learning Super Sampling" (DLSS) nutzt z.B. diese Tensor-Kerne: Das ist eine wirklich beeindruckende, KI-gestützte Methode zur Hochskalierung von Grafiken mit einem beträchtlichen Zugewinn bei der Bildwiederholrate ohne große optische Abstriche. Stellenweise schafft es DLSS sogar, die Schärfe und die Qualität der Grafik paradoxerweise zu erhöhen, obwohl die Grafik ja im eigentlichen Sinne hochskaliert und mit KI nachgeschärft wird. DLSS unterstützen z.B. Minecraft RTX, Death Stranding, Watch Dogs Legion, War Thunder, Control, Metro Exodus, Battlefield 5, MechWarrior 5, Wolfenstein: Youngblood etc. Oftmals ist DLSS in Kombination mit dem Raytracing-Einsatz dringend erforderlich, um den notwendigen Performance-Schub zu erhalten, da Raytracing für gewöhnlich sehr viel Rechenleistung trotz dedizierter Raytracing-Kerne kostet. In den Bereichen KI-Nutzung zur Bildoptimierung (DLSS) und Raytracing liegt Nvidia weiterhin deutlich vor AMD. Obgleich AMD an einer "eigenen Super-Sampling-Variante" arbeitet, die aber ohne Deep Learning daherkommen soll.
Nvidia will im Vergleich zu Turing die Anzahl der normalen Berechnungen (programmierbare Shader) um den Faktor Zwei gesteigert haben, gerade im Bereich der 32-Bit-Fließkommaoperationen, die vor allem beim Raytracing-Rendering und bei aufwändigen Shadern erforderlich sind (RTX 2060 Super FE: 7,2 Shader TFLOPS; RTX 3060 Ti FE: 16,2 Shader TFLOPS; RTX 3070: 20,3 Shader TFLOPS). Die zweite Generation der RT-Kerne sollen die mehrstufigen Raytracing-Operationen 1,7 Mal so schnell wie beim Vorgänger berechnen können (RTX 2070 Super FE: 21,7 RT TFLOPS; RTX 3060 Ti FE: 31,6 RT TFLOPS; RTX 3070: 39,7 RT TFLOPS). Die dritte Generation des Tensor-Cores verspricht ebenfalls eine Leistungssteigerung um mehr als das Zweifache, da automatisch weniger wichtiger Elemente entfernt und "Sparse Networks" schneller berechnet werden können (RTX 2070 Super FE: 57,4 Tensor-TFLOPS; RTX 3060 Ti FE: 129,6 Shader Tensor-TFLOPS; RTX 3070: 162,6 Shader Tensor-TFLOPS; bei "Sparse Networks").
RTX I/O-Zukunft
Die RTX 3060 Ti wird "in Zukunft" RTX I/O unterstützen - eine Technologie, die das Laden bzw. Nachladen von neuen Daten enorm beschleunigen soll. Für diejenigen, die eine NVMe-SSD mit einer RTX-3000er-Karte nutzen, dürfte RTX I/O auch dafür sorgen, dass der Videospeicher kein so stark limitierender Faktor für die Leistung sein wird - allerdings muss zunächst die Software-Schnittstelle (DirectStorage) die entsprechenden Technologien unterstützen und das kann noch bis zu ein Jahr dauern.
Nvidia Reflex, Studio und Broadcast
Zu den Neuerungen, die mit der 3000er-Reihe eingeführt werden, gehört ebenfalls Nvidia Reflex zur Senkung der Systemlatenz in kompetitiven eSports-Titeln, sofern die Spiele den Low-Latency-Modus nutzen (Apex Legends, Call of Duty: Warzone, Call of Duty: Black Ops Cold War, Destiny 2, Fortnite und Valorant). Reflex soll die Systemlatenz durch die GPU und spezielle Spieleoptimierungen verbessern und dadurch die Latenzzeiten senken, was der Genauigkeit und und der Reaktionsschnelligkeit zugutekommen soll (
Details). Laut Hersteller wird die Latenz um bis zu 50 Prozent reduziert, dieser Aspekt soll an dieser Stelle nur erwähnt werden. Getestet haben wir Nvidia Reflex nicht, auch mangels vergleichbaren Messmethoden.
Des Weiteren verspricht die RTX-30-Serie eine Zeitersparnis bei Multi-App-Workflows, 8K-HDR-Videobearbeitung und der Arbeit mit großen 3D-Modellen - sowie bei der Anwendung von Raytracing. Live-Streamer sollen von Nvidia Broadcast profitieren, z.B. von der automatischen Entfernung von Störgeräuschen, Hintergrundeffekte und einen virtuellen Kameramann. Nvidia Broadcast läuft übrigens auf jeder RTX-GPU.