Разработчики: | Nvidia (Нвидиа) |
Дата премьеры системы: | 2017/05/11 |
Технологии: | Процессоры |
Содержание |
Volta – архитектура GPU.
Процессор на платформе Volta – GPU для дата-центров Tesla V100 обеспечивает высокую скорость и масштабируемость обучения и вывода данных нейронных сетей, ускоряет производительные и графические вычисления.
Каждый GPU Nvidia V100 включает 21 млрд транзисторов (обеспечивающих производительность задачах в глубокого обучения, эквивалентную 100 CPU), 640 Tensor-ядер, технологию NVLink и DRAM 900ГБ/с HBM2, что обеспечивает 50%-ый прирост производительности по сравнению с GPU предыдущего поколения. Пиковая производительность Volta в пять раз выше архитектуры Pascal - действующей графической архитектуры NVIDIA, и в 15 раз выше Maxwell.
GPU V100 идут в комплекте с оптимизированным под Volta программным обеспечением, включая CUDA 9.0 и SDK для глубокого обучения, в который входят TensorRT 3, DeepStream SDK и cuDNN 7, а также все основные ИИ-фреймворки. По информации Nvidia, доступны сотни тысяч GPU-ускоренных приложений для различных тяжелых задач, включая обучение нейросетей и инференс, высокопроизводительные вычисления, графику и сложных анализ данных.
Таблица результатов производительности Tesla V100 в сравнении с ускорителями Tesla предыдущего поколения.
Tesla Product | Tesla K40 | Tesla M40 | Tesla P100 | Tesla V100 |
---|---|---|---|---|
GPU | GK110 (Kepler) | GM200 (Maxwell) | GP100 (Pascal) | GV100 (Volta) |
SMs | 15 | 24 | 56 | 80 |
TPCs | 15 | 24 | 28 | 40 |
FP32 Cores / SM | 192 | 128 | 64 | 64 |
FP32 Cores / GPU | 2880 | 3072 | 3584 | 5120 |
FP64 Cores / SM | 64 | 4 | 32 | 32 |
FP64 Cores / GPU | 960 | 96 | 1792 | 2560 |
Tensor Cores / SM | NA | NA | NA | 8 |
Tensor Cores / GPU | NA | NA | NA | 640 |
GPU Boost Clock | 810/875 MHz | 1114 MHz | 1480 MHz | 1455 MHz |
Peak FP32 TFLOP/s* | 5.04 | 6.8 | 10.6 | 15 |
Peak FP64 TFLOP/s* | 1.68 | 2.1 | 5.3 | 7.5 |
Peak Tensor Core TFLOP/s* | NA | NA | NA | 120 |
Texture Units | 240 | 192 | 224 | 320 |
Memory Interface | 384-bit GDDR5 | 384-bit GDDR5 | 4096-bit HBM2 | 4096-bit HBM2 |
Memory Size | Up to 12 GB | Up to 24 GB | 16 GB | 16 GB |
L2 Cache Size | 1536 KB | 3072 KB | 4096 KB | 6144 KB |
Shared Memory Size / SM | 16 KB/32 KB/48 KB | 96 KB | 64 KB | Configurable up to 96 KB |
Register File Size / SM | 256 KB | 256 KB | 256 KB | 256KB |
Register File Size / GPU | 3840 KB | 6144 KB | 14336 KB | 20480 KB |
TDP | 235 Watts | 250 Watts | 300 Watts | 300 Watts |
Transistors | 7.1 billion | 8 billion | 15.3 billion | 21.1 billion |
GPU Die Size | 551 mm² | 601 mm² | 610 mm² | 815 mm² |
Manufacturing Process | 28 nm | 28 nm | 16 nm FinFET+ | 12 nm FFN |
2017
Решения партнеров на базе Nvidia Volta для ИИ
Nvidia и партнеры компании Dell EMC, Hewlett Packard Enterprise, IBM и Supermicro 28 сентября 2017 года представили более десятка серверов на базе GPU-ускорителей Tesla V100 с архитектурой Nvidia Volta. Мультипроцессорные системы вендоров на базе V100 откроют пользователям широкие возможности GPU Nvidia для ускорения исследований в области ИИ и создания продуктов и услуг в этой области.
Как указали в Nvidia, графические процессоры Nvidia V100, производительность которых в задачах глубокого обучения превышает 120 терафлопс, созданы специально для глубокого обучения нейросетей и инференса, высокопроизводительных вычислений, ускорения аналитики и других ресурсоемких вычислительных задач. Один GPU Volta обеспечивает производительность, эквивалентную 100 CPU, позволяя ученым, исследователям и инженерам решать задачи, решение которых ранее представлялось слишком сложным или невозможным.«Группа Астра» в свободном доступе опубликовала курс по российской службе каталога ALD Pro для обучения администраторов
Анонсированы следующие системы на базе V100:
- Dell EMC — PowerEdge R740 с поддержкой до трех GPU V100 для PCIe, PowerEdge R740XD с поддержкой до трех GPU V100 для PCIe и PowerEdge C4130 с поддержкой до четырех V100 для PCIe или четырех GPU V100 для Nvidia NVLink в форм-факторе SXM2;
- HPE — HPE Apollo 6500 с поддержкой до восьми GPU V100 для PCIe и HPE ProLiant DL380 с поддержкой до трех GPU V100 для PCIe;
- IBM — серверы следующего поколения IBM Power Systems на базе процессора Power9 с поддержкой нескольких GPU V100 и технологией NVLink с супербыстрым интерконнектом GPU-to-GPU и CPU-to-GPU OpenPOWER для быстрой передачи данных;
- Supermicro — линейка продуктов с поддержкой новых GPU Volta включает рабочую станцию 7048GR-TR для высокопроизводительных GPU-вычислений, серверы 4028GR-TXRT, 4028GR-TRT и 4028GR-TR2 для самых требовательных приложений глубокого обучения и серверы 1028GQ-TRT для, например, сложных аналитических задач.
Кроме того, ряд партнерских систем пополнился решениями китайских производителей, включая Inspur, Lenovo и Huawei, которые анонсировали системы на базе архитектуры Volta для дата-центров интернет-компаний.
Анонс
10 мая 2017 года компания Nvidia представила архитектуру графических процессоров Volta и серию аппаратно-программных разработок, ориентированных на ускорение работы с системами искусственного интеллекта.
Согласно заявлению Дженсена Хуанга CEO Nvidia, Volta станет стандартом высокопроизводительных вычислений. Объединением ядер CUDA и Volta Tensor в унифицированной архитектуре, один сервер на платформе GPU Tesla V100 сможет заменить сотни центральных процессоров в сфере высокопроизводительных вычислений.
Подрядчики-лидеры по количеству проектов
Т1 Интеграция (ранее Техносерв) (4)
МЦСТ (4)
Микрон (Mikron) (4)
Lenovo (4)
Национальный центр информатизации (НЦИ) (3)
Другие (48)
Байкал Электроникс (Baikal Electronics) (1)
МЦСТ (1)
Cloud4Y (ООО Флекс) (1)
Huawei Россия (Хуавэй) (1)
Intel (1)
Другие (4)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
МЦСТ (8, 22)
Микрон (Mikron) (2, 9)
Oracle (1, 7)
Nvidia (Нвидиа) (18, 6)
Intel (36, 5)
Другие (194, 15)
Байкал Электроникс (Baikal Electronics) (1, 2)
Intel (1, 1)
Huawei (1, 1)
Nvidia (Нвидиа) (1, 1)
Микрон (Mikron) (1, 1)
Другие (0, 0)
Распределение систем по количеству проектов, не включая партнерские решения
Микрон Интегральные микросхемы MIK - 9
Эльбрус - 8
Oracle SPARC - 7
Intel Xeon Scalable - 5
Эльбрус 4.4 - 4
Другие 23
Baikal-M - 2
Intel Xeon Scalable - 1
Микрон Интегральные микросхемы MIK - 1
Huawei Kunpeng (процессоры) - 1
Nvidia Tesla - 1
Другие 0