Nvidia-GeForce-20-Serie

Serie von Grafikkarten

Die GeForce-20-Serie ist eine Serie von Grafikchips des Unternehmens Nvidia und Nachfolger der GeForce-10-Serie. Die GeForce-20-Serie wurde im September 2020 von der GeForce-30-Serie abgelöst.

Logo der Nvidia-GeForce-20-Serie
ASUS GeForce RTX 2070 ROG STRIX Advanced - 8GB GDDR6

Im Vorfeld der Gamescom stellte Nvidia die GeForce-20-Serie am 20. August 2018 vor. Die unter dem Codenamen „Turing“ (nach dem britischen Mathematiker Alan Turing) laufende Serie legte erstmals den Schwerpunkt auf Raytracing. Um diesen Aspekt zu unterstreichen, änderte Nvidia das bisher in Verkaufsnamen meist verwendete Präfix GTX in RTX um. Eine weitere Neuerung besteht in der Verwendung von GDDR6-Speicher. Verkaufsstart war der 20. September 2018.

Turing-Architektur

Die Turing-Architektur ist die direkte Weiterentwicklung der Volta-Architektur, welche aber nie bei den Grafikkarten der GeForce-Serie zum Einsatz kam. Die Volta-Architektur kam nur bei der Titan-Serie, sowie bei den professionellen Serien, Quadro und Tesla, zum Einsatz. Bei den GeForce-Grafikkarten löst die Turing-Architektur die Pascal-Architektur der GeForce-10-Serie ab.

Die Grafikprozessoren, welche auf der Turing-Architektur basieren, setzen sich aus sogenannten Graphics-Processing-Cluster (GPC) zusammen, welche teilweise auch als Raster-Engines bezeichnet werden. Jeder Graphics-Processing-Cluster enthält je 4 oder 6 Texture-Processing-Cluster (TPC), die teilweise nicht komplett aktiviert sind. Ein Texture-Processing-Cluster besteht dabei aus zwei Shader-Clustern, welche von Nvidia als Streaming-Multiprozessoren (SM) bezeichnet werden. Diese Streaming-Multiprozessoren, der Funktionsblock, der die wichtigsten Einheiten umfasst, weisen gegenüber der Pascal-Architektur erhebliche Veränderungen auf und sind teilweise neu geordnet worden.[1] Dabei sind jedem Streaming-Multiprozessor zugeordnet:

  • 64 FP32-Einheiten für 32-bit-Gleitkomma-Zahlen und 2 FP64-Einheiten für 64-bit-Gleitkomma-Zahlen
  • 64 INT32-Einheiten für 32-bit-Ganzzahlen, die parallel zu den Gleitkommaeinheiten arbeiten können
  • 4 Textureinheiten, bestehend aus je einer Texture Mapping Unit und einer Texture Address Unit
  • 16 Load/Store-Einheiten
  • 16 Special-Function-Units
  • 8 Tensoreinheiten
  • 1 Raytracing-Einheit

Bei Pascal bestand ein Streaming-Multiprozessor noch aus 128 FP32-Einheit welche entweder 32-bit-Gleitkomma-Zahlen (Floating Point) oder 32-bit-Ganzzahlen (Integer) ausgeben können. Bei Turing wurde dieses System aufgegeben und stattdessen die FP32-Einheit auf 64 reduziert, sowie neu 64 INT32-Einheiten hinzugefügt. Dadurch können beide Operationen parallel ausgeführt werden.[1] Alternativ können die FP32-Einheiten auch 16-bit-Gleitkomma-Zahlen (halbe Genauigkeit) im Verhältnis 2:1 berechnen (Pascal 1:1).[1]

Von der Volta-Architektur übernommen wurden die Tensor-Kerne für KI-Berechnungen. Dabei handelt es sich laut Nvidia um FP16-Einheiten für Matrizen-Berechnungen. Sie können aber auch FP32-, INT4- und INT8-Befehle ausführen, was aber nur bei professionellen Anwendungen von Bedeutung ist. Bei 3D-Anwendungen sind laut Nvidia nur die FP16-Berechnungen der Tensorkerne von Bedeutung.[1]

Die von Nvidias Marketing am stärksten hervorgehobene Neuerung der Turing-Architektur ist die hardwareseitige Raytracing-Unterstützung. Dazu verfügt jeder Streaming-Multiprozessor über eine Raytracing-Einheit, teilweise auch als RT Core bezeichnet. Da Nvidia keine Angaben macht, wie diese funktionieren, lässt sich derzeit auch nicht rekonstruieren, was eine RT-Einheit genau tut. Nvidia gibt lediglich die Anzahl an RT-Einheiten pro Modell, sowie eine Füllrate von Gigarays pro Sekunde an.

Datenübersicht

Grafikprozessoren

Grafik-
chip
FertigungEinheitenL2-
Cache
API-SupportVideo-
pro-
zessor
Bus-
Schnitt-
stelle
NV-
Link
Pro-
zess
Transis-
toren
Die-
Fläche
ROPsUnified-ShaderTextur-
einheiten
Tensor-
Kerne
RT-
Kerne
DirectXOpenGLOpenCLCUDAVulkan
GPCSMALUs
TU10212 nm18,6 Mrd.754 mm²966724608288576726 MB12.24.63.07.51.2VP10PCIe 3.0
TU10413,6 Mrd.545 mm²646483072192384484 MB
TU10610,6 Mrd.445 mm²643362304144288364 MB

Desktop-Modelldaten

ModellOffizieller
Launch
Grafikprozessor (GPU)GrafikspeicherLeistungsdaten[Anm. 1]Leistungsaufnahme
TypAktive EinheitenChiptakt[Anm. 2] 
Größe
 
Takt
[Anm. 2]
 
Inter-
face
Rechenleistung
(in TFlops)
FüllrateSpeicher-
bandbreite

(in GB/s)
MGCP
[Anm. 3]
Messwerte[Anm. 4]
ROPsSMALUsTextur-
einheiten
Tensor-
Kerne
RT-
Kerne
BasisBoostPixel
(GP/s)
Texel
(GT/s)
Rays
(GR/s)
Idle3D-
Last
32 bit64 bit16 bit
GeForce RTX 2060[2]7. Jan. 2019TU10648301920120240301365 MHz1680 MHz06 GB GDDR67001 MHz192 Bit06,450,20051,6080,6201,60≈5336160 W9 W[3]160 W[3]
7. Dez. 2021342176136272341470 MHz1650 MHz12 GB GDDR607,180,22057,4479,2224,40≈6184 Wk. A.k. A.
GeForce RTX 2060 Super[4]9. Jul. 201964342176136272341470 MHz1650 MHz08 GB GDDR67001 MHz256 Bit07,180,22057,44105,6224,40≈6448175 W8 W[3]176 W[3]
GeForce RTX 2070[5]17. Okt. 2018362304144288361410 MHz1620 MHz7001 MHz07,460,23059,72103,7233,30≈6175 / 185 W11 W[3]185 W[3]
GeForce RTX 2070 Super[6]9. Jul. 2019TU10464402560160320401605 MHz1770 MHz7001 MHz09,060,28072,48113,3283,20≈7215 W10 W[3]215 W[3]
GeForce RTX 2080[7]20. Sep. 2018462944184368461515 MHz1710 MHz7001 MHz10,070,32080,56109,4314,60≈8215 / 225 W11 W[3]228 W[3]
GeForce RTX 2080 Super[8]23. Jul. 2019483072192384481650 MHz1815 MHz7751 MHz11,150,35089,20116,2348,50≈8496250 W9 W[3]246 W[3]
GeForce RTX 2080 Ti[9]27. Sep. 2018TU10288684352272544681350 MHz1545 MHz11 GB GDDR67001 MHz352 Bit13,450,42107,60136420,2≈10616250 / 260 W13 W[3]272 W[3]
Titan RTX[10]18. Dez. 201896724608288576721350 MHz1770 MHz24 GB GDDR67001 MHz384 Bit16,310,51130,48169,9509,8≈11672280 W13 W[3]290 W[3]

Notebook-Modelldaten

ModellOffizieller
Launch
Grafikprozessor (GPU)GrafikspeicherLeistungsdaten[Anm. 1]MGCP
[Anm. 3]
TypAktive EinheitenChiptakt
[Anm. 2]
Speicher-
größe
Speicher-
takt[Anm. 2]
Speicher-
interface
Rechenleistung
(in TFlops)
FüllrateSpeicher-
bandbreite

(in GB/s)
ROPsSMALUsTextur-
einheiten
Tensor-
Kerne
RT-
Kerne
BasisBoost32 bit64 bitPixel
(GP/s)
Texel
(GT/s)
Rays
(GR/s)
GeForce RTX 2050 Max-Q17. Dez. 2021GA10732162048646432832 MHz1155 MHz4 GB GDDR61475 MHz64 Bit4,550,1436,937,9k. A.94,430 W
GeForce RTX 2050 Mobile17. Dez. 2021GA10732162048646432735 MHz1245 MHz1750 MHz192 Bit5,100,1539,879,7k.A.112,030 W
GeForce RTX 2060 Max-Q29. Jan. 2019TU1064830192012024030975 MHz1185 MHz6 GB GDDR65500 MHz4,730,1456,9142,2k. A.94,430 W
GeForce RTX 2060 Mobile29. Jan. 2019TU1064830192012024030960 MHz1200 MHz5500 MHz4,60,1456,9144k. A.26465 W
GeForce RTX 2060 Super Mobile10. Apr. 2020TU10664342176136272341305 MHz1485 MHz8 GB GDDR67001 MHz256 Bit6,460,295202k. A.448100 W
GeForce RTX 2070 Max-Q29. Jan. 2019TU1066436230414428836885 MHz1185 MHz7001 MHz5,460,1775,8170,6k. A.44890 W
GeForce RTX 2070 Mobile29. Jan. 2019TU10664362304144288361215 MHz1440 MHz7001 MHz6,640,2192,2207,4k. A.448115 W
GeForce RTX 2070 Super Max-Q2. Apr. 2020TU1046440256016032040930 MHz1155 MHz5500 MHz5,910,1873,9184,8k. A.35280 W
GeForce RTX 2070 Super Mobile2. Apr. 2020TU10464402560160320401140 MHz1380 MHz7001 MHz7,070,2288,3220,8k. A.448115 W
GeForce RTX 2080 Max-Q29. Jan. 2019TU1046446294418436846735 MHz1095 MHz6000 MHz6,450,270,1201,5k. A.38490 W
GeForce RTX 2080 Mobile29. Jan. 2019TU10464462944184368461380 MHz1590 MHz6000 MHz9,360,29101,8292,6k. A.384150 W
GeForce RTX 2080 Super Max-Q2. Apr. 2020TU1046448307219238448735 MHz975 MHz5500 MHz5,990,1962,4187,2k. A.35280 W
GeForce RTX 2080 Super Mobile2. Apr. 2020TU10464483072192384481365 MHz1560 MHz7001 MHz9,590,399,8299,5k. A.448150 W

Anmerkungen

Weblinks

Commons: Nvidia-GeForce-20-Serie – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise