Nvidia Volta

Продукт

Разработчики:	Nvidia (Нвидиа)
Дата премьеры системы:	2017/05/11
Технологии:	Процессоры

Содержание

2017
- Решения партнеров на базе Nvidia Volta для ИИ
- Анонс

ПРОЕКТЫ НА БАЗЕ (3)

РЕШЕНИЕ НА БАЗЕ (2)

СМ. ТАКЖЕ (18)

Volta – архитектура GPU.

Процессор на платформе Volta – GPU для дата-центров Tesla V100 обеспечивает высокую скорость и масштабируемость обучения и вывода данных нейронных сетей, ускоряет производительные и графические вычисления.

PCI Express 3.0 Host interface, (2017)

Каждый GPU Nvidia V100 включает 21 млрд транзисторов (обеспечивающих производительность задачах в глубокого обучения, эквивалентную 100 CPU), 640 Tensor-ядер, технологию NVLink и DRAM 900ГБ/с HBM2, что обеспечивает 50%-ый прирост производительности по сравнению с GPU предыдущего поколения. Пиковая производительность Volta в пять раз выше архитектуры Pascal - действующей графической архитектуры NVIDIA, и в 15 раз выше Maxwell.

GPU V100 идут в комплекте с оптимизированным под Volta программным обеспечением, включая CUDA 9.0 и SDK для глубокого обучения, в который входят TensorRT 3, DeepStream SDK и cuDNN 7, а также все основные ИИ-фреймворки. По информации Nvidia, доступны сотни тысяч GPU-ускоренных приложений для различных тяжелых задач, включая обучение нейросетей и инференс, высокопроизводительные вычисления, графику и сложных анализ данных.

Таблица результатов производительности Tesla V100 в сравнении с ускорителями Tesla предыдущего поколения.

Tesla Product	Tesla K40	Tesla M40	Tesla P100	Tesla V100
GPU	GK110 (Kepler)	GM200 (Maxwell)	GP100 (Pascal)	GV100 (Volta)
SMs	15	24	56	80
TPCs	15	24	28	40
FP32 Cores / SM	192	128	64	64
FP32 Cores / GPU	2880	3072	3584	5120
FP64 Cores / SM	64	4	32	32
FP64 Cores / GPU	960	96	1792	2560
Tensor Cores / SM	NA	NA	NA	8
Tensor Cores / GPU	NA	NA	NA	640
GPU Boost Clock	810/875 MHz	1114 MHz	1480 MHz	1455 MHz
Peak FP32 TFLOP/s^*	5.04	6.8	10.6	15
Peak FP64 TFLOP/s^*	1.68	2.1	5.3	7.5
Peak Tensor Core TFLOP/s^*	NA	NA	NA	120
Texture Units	240	192	224	320
Memory Interface	384-bit GDDR5	384-bit GDDR5	4096-bit HBM2	4096-bit HBM2
Memory Size	Up to 12 GB	Up to 24 GB	16 GB	16 GB
L2 Cache Size	1536 KB	3072 KB	4096 KB	6144 KB
Shared Memory Size / SM	16 KB/32 KB/48 KB	96 KB	64 KB	Configurable up to 96 KB
Register File Size / SM	256 KB	256 KB	256 KB	256KB
Register File Size / GPU	3840 KB	6144 KB	14336 KB	20480 KB
TDP	235 Watts	250 Watts	300 Watts	300 Watts
Transistors	7.1 billion	8 billion	15.3 billion	21.1 billion
GPU Die Size	551 mm²	601 mm²	610 mm²	815 mm²
Manufacturing Process	28 nm	28 nm	16 nm FinFET+	12 nm FFN

Volta GV100 Streaming Multiprocessor, (2017)

2017

Решения партнеров на базе Nvidia Volta для ИИ

Nvidia и партнеры компании Dell EMC, Hewlett Packard Enterprise, IBM и Supermicro 28 сентября 2017 года представили более десятка серверов на базе GPU-ускорителей Tesla V100 с архитектурой Nvidia Volta. Мультипроцессорные системы вендоров на базе V100 откроют пользователям широкие возможности GPU Nvidia для ускорения исследований в области ИИ и создания продуктов и услуг в этой области.

Как указали в Nvidia, графические процессоры Nvidia V100, производительность которых в задачах глубокого обучения превышает 120 терафлопс, созданы специально для глубокого обучения нейросетей и инференса, высокопроизводительных вычислений, ускорения аналитики и других ресурсоемких вычислительных задач. Один GPU Volta обеспечивает производительность, эквивалентную 100 CPU, позволяя ученым, исследователям и инженерам решать задачи, решение которых ранее представлялось слишком сложным или невозможным.«Группа Астра» в свободном доступе опубликовала курс по российской службе каталога ALD Pro для обучения администраторов 4.3 т

Анонсированы следующие системы на базе V100:

Dell EMC — PowerEdge R740 с поддержкой до трех GPU V100 для PCIe, PowerEdge R740XD с поддержкой до трех GPU V100 для PCIe и PowerEdge C4130 с поддержкой до четырех V100 для PCIe или четырех GPU V100 для Nvidia NVLink в форм-факторе SXM2;
HPE — HPE Apollo 6500 с поддержкой до восьми GPU V100 для PCIe и HPE ProLiant DL380 с поддержкой до трех GPU V100 для PCIe;
IBM — серверы следующего поколения IBM Power Systems на базе процессора Power9 с поддержкой нескольких GPU V100 и технологией NVLink с супербыстрым интерконнектом GPU-to-GPU и CPU-to-GPU OpenPOWER для быстрой передачи данных;
Supermicro — линейка продуктов с поддержкой новых GPU Volta включает рабочую станцию 7048GR-TR для высокопроизводительных GPU-вычислений, серверы 4028GR-TXRT, 4028GR-TRT и 4028GR-TR2 для самых требовательных приложений глубокого обучения и серверы 1028GQ-TRT для, например, сложных аналитических задач.

Кроме того, ряд партнерских систем пополнился решениями китайских производителей, включая Inspur, Lenovo и Huawei, которые анонсировали системы на базе архитектуры Volta для дата-центров интернет-компаний.

Анонс

10 мая 2017 года компания Nvidia представила архитектуру графических процессоров Volta и серию аппаратно-программных разработок, ориентированных на ускорение работы с системами искусственного интеллекта.

Согласно заявлению Дженсена Хуанга CEO Nvidia, Volta станет стандартом высокопроизводительных вычислений. Объединением ядер CUDA и Volta Tensor в унифицированной архитектуре, один сервер на платформе GPU Tesla V100 сможет заменить сотни центральных процессоров в сфере высокопроизводительных вычислений.

Источник — «https://www.tadviser.ru/index.php/%D0%9F%D1%80%D0%BE%D0%B4%D1%83%D0%BA%D1%82:Nvidia_Volta»

ПРОЕКТЫ НА БАЗЕ (3)

РЕШЕНИЕ НА БАЗЕ (2)

СМ. ТАКЖЕ (18)

Заказчик	Интегратор	Год	Технологии
- КЭР-Холдинг	Cloud4Y (ООО Флекс)	2021.10	IaaS - Инфраструктура как услуга, Процессоры, Центры обработки данных - технологии для ЦОД
- РН-Лояльность	Cloud4Y (ООО Флекс)	2019.06	IaaS - Инфраструктура как услуга, Процессоры, Центры обработки данных - технологии для ЦОД
- Большой театр	Nvidia (Нвидиа)	2019.03	Серверные платформы, Центры обработки данных - технологии для ЦОД, Процессоры, Центры обработки данных - технологии для ЦОД, Виртуализация