FLOPS

Trong máy tính, FLOPS (FLoating-point Operations Per Second) là một thước đo hiệu suất máy tính, đặc biệt là trong lĩnh vực tính toán khoa học sử dụng nhiều các tính toán thập phân trong một giây.

1 tflops, hay 1 teraflops hay one trillion flops, là một nghìn tỷ con tính trong một giây, thường dùng để đo sức mạnh (performance) một hệ thống siêu máy tính song song. Đây là một khái niệm thường được sử dụng trong phép so sánh nhanh hay chậm giữa các phần cứng của máy tính trong quá trình huấn luyện của mạng neuron trong lĩnh vực trí tuệ nhân tạo.

FLOPs của một số bộ xử lý

Vi kiến trúcISAFP64FP32FP16
Intel CPU
Intel 80486x87 (32-bit)?0.128[1]?
Intel P5 Pentium
Intel P6 Pentium Pro
x87 (32-bit)?0.5[1]?
Intel P5 Pentium MMX
Intel P6 Pentium II
MMX (64-bit)?1[2]?
Intel P6 Pentium IIISSE (64-bit)?2[2]?
Intel Netburst Pentium 4 (Willamette, Northwood)SSE2 (64-bit)24?
Intel P6 Pentium MSSE2 (64-bit)12?
Intel Netburst Pentium 4 (Prescott, Cedar Mill)
Intel Netburst Pentium D (Smithfield, Presler)
Intel P6 Core (Yonah)
SSE3 (64-bit)24?
Intel Core (Merom, Penryn)
Intel Nehalem[3] (Nehalem, Westmere)
SSSE3 (128-bit)
SSE4 (128-bit)
48?
Intel Atom (Bonnell, Saltwell, Silvermont and Goldmont)SSE3 (128-bit)24?
Intel Sandy Bridge (Sandy Bridge, Ivy Bridge)AVX (256-bit)8160
Intel Haswell[3] (Haswell, Devil's Canyon, Broadwell)
Intel Skylake (Skylake, Kaby Lake, Coffee Lake, Comet Lake, Whiskey Lake, Amber Lake)
AVX2 & FMA (256-bit)16320
Intel Xeon Phi (Knights Corner)SSE & FMA (256-bit)16320
Intel Skylake-X (Skylake-X, Cascade Lake)
Intel Xeon Phi (Knights Landing, Knights Mill)

Intel Ice Lake, Tiger Lake and Rocket Lake

AVX-512 & FMA (512-bit)32640
AMD CPU
AMD BobcatAMD64 (64-bit)240
AMD Jaguar
AMD Puma
AVX (128-bit)480
AMD K10SSE4/4a (128-bit)480
AMD Bulldozer[3] (Piledriver, Steamroller, Excavator)AVX (128-bit) Bulldozer-Steamroller

AVX2 (128-bit) Excavator

FMA3 (Bulldozer)[4]

FMA3/4 (Piledriver-Excavator)

480
AMD Zen (Ryzen 1000 series, Threadripper 1000 series, Epyc Naples)
AMD Zen+[3][5][6][7] (Ryzen 2000 series, Threadripper 2000 series)
AVX2 & FMA (128-bit, 256-bit decoding)[8]8160
AMD Zen 2[9] (Ryzen 3000 series, Threadripper 3000 series, Epyc Rome))
AMD Zen 3 (Ryzen 5000 series)
AVX2 & FMA (256-bit)16320
ARM CPU
ARM Cortex-A7, A9, A15ARMv7180
ARM Cortex-A32, A35, A53, A55, A72, A73, A75ARMv8280
ARM Cortex-A57[3]ARMv8480
ARM Cortex-A76, A77, A78ARMv88160
ARM Cortex-X1ARMv81632?
Qualcomm KraitARMv8180
Qualcomm Kryo (1xx - 3xx)ARMv8280
Qualcomm Kryo (4xx - 5xx)ARMv88160
Samsung Exynos M1 and M2ARMv8280
Samsung Exynos M3 and M4ARMv83120
IBM PowerPC A2 (Blue Gene/Q)?88 (as FP64)0
Hitachi SH-4[10][11]SH-4170
Nvidia GPU
Nvidia Curie (GeForce 6 series and GeForce 7 series)PTX?8?
Nvidia Tesla 2.0 (GeForce GTX 260-295)PTX?2?
Nvidia Fermi (chỉ tính GeForce GTX 465–480, 560 Ti, 570-590)PTX1/4 (locked by driver, 1 in hardware)20
Nvidia Fermi (chỉ tính Quadro 600-2000)PTX1/820
Nvidia Fermi (chỉ tính Quadro 4000–7000, Tesla)PTX120
Nvidia Kepler (GeForce (trừTitan and Titan Black), Quadro (except K6000), Tesla K10)PTX1/12 (for GK11020
Nvidia Kepler (GeForce GTX Titan and Titan Black, Quadro K6000, Tesla (trừ K10))PTX2/320
Nvidia Maxwell
Nvidia Pascal (không tính Quadro GP100 and Tesla P100)
PTX1/1621/32
Nvidia Pascal (chỉ tính Quadro GP100 and Tesla P100)PTX124
Nvidia Volta[12]PTX12 (FP32) + 2 (INT32)16
Nvidia Turing (chỉ tính GeForce 16XX)PTX1/162 (FP32) + 2 (INT32)4
Nvidia Turing (không tính GeForce 16XX)PTX1/162 (FP32) + 2 (INT32)16
Nvidia Ampere[13][14] (chỉ tính Tesla A100/A30)PTX22 (FP32) + 2 (INT32)32
Nvidia Ampere (gồm GeForce và Quadro, Tesla A40/A10)PTX1/322 (FP32) + 0 (INT32) or 1 (FP32) + 1 (INT32)8
AMD GPU
AMD TeraScale 1 (Radeon HD 4000 series)TeraScale 10.42?
AMD TeraScale 2 (Radeon HD 5000 series)TeraScale 212?
AMD TeraScale 3 (Radeon HD 6000 series)TeraScale 314?
AMD GCN (chỉ tính Radeon Pro W 8100-9100)GCN12?
AMD GCN (không tính Radeon Pro W 8100-9100, Vega 10-20)GCN1/824
AMD GCN Vega 10GCN1/824
AMD GCN Vega 20 (chỉ tính Radeon VII)GCN24
AMD GCN Vega 20 (chỉ tính Radeon Instinct MI50 / MI60 and Radeon Pro VII)GCN124
AMD RDNA[15][16]
AMD RDNA 2
RDNA1/824
AMD CDNACDNA14 (Tenxơ)[17]16
AMD CDNA 2CDNA 24 (Tenxơ)4 (Tenxơ)16
Qualcomm GPU
Qualcomm Adreno 5x0Adreno 5xx124
Qualcomm Adreno 6x0Adreno 6xx124
Graphcore
Graphcore Colossus GC2[18][19][20] (values estimated)?01872
Graphcore Colossus GC200 Mk2[21] (values estimated)?036144
Supercomputer
ENIAC @ 100 Khz with 385 Flops[22]
48-bit processor @ 208 kHz in CDC 1604 in 1960
60-bit processor @ 10 Mhz in CDC6600 in 19640.3 (FP60)
60-bit processor @ 10 Mhz in CDC7600 in 19671.0 (FP60) [23]
Cray-1 @ 80 Mhz in 19762
CDC Cyber 205 @ 50 Mhz in 1981FORTRAN compiler

(ANSI 77 with vector extensions)

816
Vi kiến trúcISAFP64FP32FP16

Source:[24]

Tham khảo