NVIDIA B200 vs AMD Instinct MI100

NVIDIA B200

AMD Instinct MI100

AMD Instinct MI100

18944 Shaders 192GB HBM3e 1980MHz	7680 Shaders 32GB HBM2 1502MHz
Peak AI Performance 18 PFLOPS FP4 Tensor Sparse	Peak AI Performance 184.57 TFLOPS FP16 Tensor (FP16 Accumulate)
FP32 75.02 TFLOPS	FP32 23.07 TFLOPS
FP16 150.04 TFLOPS	FP16 46.14 TFLOPS
Form Factor SXM6 -	Form Factor PCIe Card 2.0-Slots
TDP 1000W	TDP 300W
- - - - -	Power Connectors - 2x 8-Pin - -

Highlights

Benchmarks

Geekbench 6

GB6 OpenCL N/A 0%	GB6 OpenCL 123,425 32%
GB6 Metal N/A 0%	GB6 Metal N/A 0%
GB6 Vulkan N/A 0%	GB6 Vulkan N/A 0%

Geekbench 5

GB5 OpenCL N/A 0%	GB5 OpenCL N/A 0%
GB5 CUDA N/A 0%	GB5 CUDA N/A 0%
GB5 Metal N/A 0%	GB5 Metal N/A 0%
GB5 Vulkan N/A 0%	GB5 Vulkan N/A 0%

OctaneBench

OCT 2020.1 N/A 0%	OCT 2020.1 N/A 0%
OCT Metal N/A 0%	OCT Metal N/A 0%

Tech Specs

Theoretical Performance

Peak AI Performance 18 PFLOPS FP4 Tensor Sparse	Peak AI Performance 184.57 TFLOPS FP16 Tensor (FP16 Accumulate)
FP4 9 PFLOPS Tensor 18 PFLOPS Tensor Sparse	- - -
FP8 - 4.5 PFLOPS Tensor (FP16 Accumulate) 9 PFLOPS Tensor (FP16 Accumulate) Sparse 4.5 PFLOPS Tensor (FP32 Accumulate) 9 PFLOPS Tensor (FP32 Accumulate) Sparse	- - - - - -
FP16 150.04 TFLOPS 2.25 PFLOPS Tensor (FP16 Accumulate) 4.5 PFLOPS Tensor (FP16 Accumulate) Sparse 2.25 PFLOPS Tensor (FP32 Accumulate) 4.5 PFLOPS Tensor (FP32 Accumulate) Sparse	FP16 46.14 TFLOPS 184.57 TFLOPS Tensor (FP16 Accumulate) - 184.57 TFLOPS Tensor (FP32 Accumulate) -
FP32 75.02 TFLOPS - -	FP32 23.07 TFLOPS 46.14 TFLOPS Tensor -
FP64 37.51 TFLOPS 35.16 TFLOPS Tensor	FP64 11.54 TFLOPS -
BF16 150.04 TFLOPS 2.25 PFLOPS Tensor 4.5 PFLOPS Tensor Sparse	BF16 - 92.28 TFLOPS Tensor -
TF32 1.13 PFLOPS Tensor 2.25 PFLOPS Tensor Sparse	- - -
- - -	INT4 92.28 TOPS Tensor -
INT8 - 4.5 POPS Tensor 9 POPS Tensor Sparse	INT8 - 92.28 TOPS Tensor -
INT32 75.02 TOPS	- -
- -	- -
Pixel Fillrate 63.36 GPixel/s	Pixel Fillrate -
- -	- -
Texture Fillrate 1172.16 GTexel/s	Texture Fillrate 720.96 GTexel/s

Chip

Manufacturer NVIDIA	Manufacturer AMD
Chip Designer NVIDIA	Chip Designer AMD
Architecture Blackwell	Architecture CDNA 1
Family Server	Family Instinct
Codename NV190 GB100 Variant Miranda	Codename Arcturus - Variant Arcturus XL
Market Segment Server	Market Segment Server
Release Date 3/18/2024	Release Date 11/16/2020

Fabrication

Foundry TSMC -	Foundry TSMC -
Fabrication Node 4NP -	Fabrication Node N7 -
Die Size 2x 810 mm² -	Die Size 750 mm² -
Transistor Count 2x 104 Billion -	Transistor Count 25.6 Billion -
Transistor Density 128.40M/mm² -	Transistor Density 34.13M/mm² -

Form

Form

SXM6

Form

PCIe Card

Core Configuration

Shading Units 18944 Shaders -	Shading Units 7680 Shaders -
Texture Mapping Units 592 TMUs	Texture Mapping Units 480 TMUs
Render Output Units 32 ROPs	Render Output Units -
Tensor Cores 592 T-Cores	Tensor Cores 480 T-Cores
- -	- -
Streaming Multiprocessors 148 SMs	- -
- -	Compute Units 120 CUs
- -	- -
- -	- -

Clock Speeds

1856MHz Tensor

-

-

1980MHz

-

-

1000MHz Base

1502MHz

Cache

- -	- -
L1 64KB/SM Tex 256KB/SM - -	L1 - - 16KB/CU -
L2 64MB Shared	L2 8MB Shared
- - -	- - -

Memory

192GB HBM3e -	32GB HBM2 ECC
Bus Width 8192Bit	Bus Width 4096Bit
Clock 3760MHz Transfer Rate 7.5GT/s Bandwidth 7700.5GB/s	Clock 1200MHz Transfer Rate 2.4GT/s Bandwidth 1228.8GB/s
- - - - - - - - -	- - - - - - - - -

Power & Thermals

TDP 1000W	TDP 300W
- -	- -

Ports

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

No Ports

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

No Ports

Video Output

Max Resolution Unknown	Max Resolution Unknown
Max Resolution Refresh Rate -	Max Resolution Refresh Rate -
Variable Refresh Rate G-Sync FreeSync -	Variable Refresh Rate - - -
Display Stream Compression (DSC) Not Supported	Display Stream Compression (DSC) Not Supported
Multi Monitor Support Unknown	Multi Monitor Support Unknown
- -	- -

Video Encoder

No Encoders -	Model VCN 2.5
- - - - - - - - - - - - - - -	Codec - - - - - - - - AVC (H.264) HEVC (H.265) - - - -

Video Decoder

Model 7x NVDEC 6	Model VCN 2.5
Codec MPEG-1 MPEG-2 MPEG-4 - VC-1 VP8 VP9 - AVC (H.264) HEVC (H.265) - AV1 - -	Codec MPEG-1 MPEG-2 MPEG-4 JPEG VC-1 - VP9 - AVC (H.264) HEVC (H.265) - - - -

API Support

- - - -	- - - -
- - OpenCL 3.0 - -	- - OpenCL 2.1 - -
- - CUDA 10.0 - - PureVideo HD VP13 VDPAU Feature Set M	- - - - GFX 9.4 - - - -

Card

Not a Card - - -	- - - -
- - - - - - - -	Power Connectors - - - 2x 8-Pin - - -
- - PCIe Version 6.0 PCIe Lanes 16	Slots Required 2.0 PCIe Version 4.0 PCIe Lanes 16
Multi GPU Support Supported Type NVLink	Multi GPU Support Supported Type Infinity Fabric
- - - - - -	Height 111 mm (4.37 in) Width 267 mm (10.51 in) Depth 37 mm (1.46 in)

Competitors

NVIDIA B200

NVIDIA B100

NVIDIA B200 vs NVIDIA B100

AMD Instinct MI100

NVIDIA A100X

AMD Instinct MI100 vs NVIDIA A100X

AMD Instinct MI100

NVIDIA A100 40GB

AMD Instinct MI100 vs NVIDIA A100 40GB

AMD Instinct MI100

NVIDIA A100

AMD Instinct MI100 vs NVIDIA A100

AMD Instinct MI100

NVIDIA A800 40GB

AMD Instinct MI100 vs NVIDIA A800 40GB

AMD Instinct MI100

NVIDIA A800

AMD Instinct MI100 vs NVIDIA A800

AMD Instinct MI100

AMD Radeon Pro V620

AMD Instinct MI100 vs AMD Radeon Pro V620

AMD Instinct MI100

AMD Instinct MI210

AMD Instinct MI100 vs AMD Instinct MI210

Change Comparison

Copy Link