NVIDIA TESLA V100: GAHAR BANGET SOB
GTC terakhir, NVIDIA mengumumkan GPU GP100 berbasis Pascal. Saat itulah, chip grafis tercepat yang dirancang untuk superkomputer. Tahun ini, NVIDIA mengambil lompatan berikutnya dalam kinerja grafis dan mengumumkan GPU GV100 berbasis Volta. Kami akan melihat secara mendalam GPU generasi berikutnya yang dirancang untuk AI Deep LearningGTC terakhir, NVIDIA mengumumkan GPU GP100 berbasis Pascal. Saat itulah, chip grafis tercepat yang dirancang untuk superkomputer. Tahun ini, NVIDIA mengambil lompatan berikutnya dalam kinerja grafis dan mengumumkan GPU GV100 berbasis Volta. Kami akan melihat secara mendalam GPU generasi berikutnya yang dirancang untuk AI Deep Learning
Tesla V100 Accelerator akan hadir dengan dua model PCIe yang berbeda, untuk model 150W memiliki single slot dengan ukuran setengah dari 300W yang memiliki memiliki dual slot. Kedua VGA card ini akan menggunakan arsitektur generasi terbaru dari Nvidia yaitu GV100 yang memberikan 5120 CUDA Core dengan 16GB HBM2.
Berikut spesifikasi lengkapnya :
Tesla Product | Tesla K40 | Tesla M40 | Tesla P100 | Tesla V100 |
GPU | GK110 (Kepler) | GM200 (Maxwell) | GP100 (Pascal) | GV100 (Volta) |
SMs | 15 | 24 | 56 | 80 |
TPCs | 15 | 24 | 28 | 40 |
FP32 Cores / SM | 192 | 128 | 64 | 64 |
FP32 Cores / GPU | 2880 | 3072 | 3584 | 5120 |
FP64 Cores / SM | 64 | 4 | 32 | 32 |
FP64 Cores / GPU | 960 | 96 | 1792 | 2560 |
Tensor Cores / SM | NA | NA | NA | 8 |
Tensor Cores / GPU | NA | NA | NA | 640 |
GPU Boost Clock | 810/875 MHz | 1114 MHz | 1480 MHz | 1455 MHz |
Peak FP32 TFLOP/s* | 5.04 | 6.8 | 10.6 | 15 |
Peak FP64 TFLOP/s* | 1.68 | 2.1 | 5.3 | 7.5 |
Peak Tensor Core TFLOP/s* | NA | NA | NA | 120 |
Texture Units | 240 | 192 | 224 | 320 |
Memory Interface | 384-bit GDDR5 | 384-bit GDDR5 | 4096-bit HBM2 | 4096-bit HBM2 |
Memory Size | Up to 12 GB | Up to 24 GB | 16 GB | 16 GB |
L2 Cache Size | 1536 KB | 3072 KB | 4096 KB | 6144 KB |
Shared Memory Size / SM | 16 KB/32 KB/48 KB | 96 KB | 64 KB | Configurable up to 96 KB |
Register File Size / SM | 256 KB | 256 KB | 256 KB | 256KB |
Register File Size / GPU | 3840 KB | 6144 KB | 14336 KB | 20480 KB |
TDP | 235 Watts | 250 Watts | 300 Watts | 300 Watts |
Transistors | 7.1 billion | 8 billion | 15.3 billion | 21.1 billion |
GPU Die Size | 551 mm² | 601 mm² | 610 mm² | 815 mm² |
Manufacturing Process | 28 nm | 28 nm | 16 nm FinFET+ | 12 nm FFN |
Nvidia Tesla V100 Accelerator memiliki chip 815mm persegi dengan lebih dari 21 miliar transistor yang dibangun dengan 12nm TSMC yang baru. Dengan boost clock 1455MHz Tesla V100 mampu menghasilkan 15 TFLOPS dengan perhitungan presisi tunggal dan 7,5 TFLOPS dengan perhitungan presisi ganda pada 300W. Yang perlu diketahui adalah GV100 memiliki 5376 CUDA core namun yang berfungsi pada Tesla V100 hanya 5120 saja.
Arsitektur baru yang dibuat oleh Nvidia ini berhasil memberikan kinerja 40% lebih baik dibanding dengan Pascal dan memiliki CUDA core 7% lebih banyak /mm /segi dan kinerja 6% lebih baik /mm /segi, hal ini mampu dihasilkan dati FinFET 12nm yang lebih efisien lebih tinggi dan berkat penyempurnaan arsitektur Pascal.
Nvidia belum memberikan informasi mengenai harga yang akan dibandrol untuk VGA enthusias ini, namun Nvidia pasti memiliki kejutan untuk pasar enthusias dengan mengeluarkannya VGA card dengan generasi terbarunya ini.
Comments
Post a Comment