Groq LPU (языковой процессор)

Продукт
Разработчики: Groq
Дата премьеры системы: февраль 2024 г.
Отрасли: Электротехника и микроэлектроника
Технологии: Процессоры

2024: Анонс продукта

В конце февраля 2024 года стартап Groq представил специализированный процессор LPU (Language Processing Unit), предназначенный для ускорения работы больших языковых моделей (LLM). Ожидается, что изделие произведет революцию на рынке искусственного интеллекта.

Groq LPU базируется на архитектуре тензорного потокового процессора (TSP). Решение наделено локальной памятью SRAM объемом 230 Мбайт с пропускной способностью 80 Тбайт/с. Утверждается, что производительность на операциях INT8 достигает 750 TOPS, на операциях FP16 — 188 Тфлопс. При работе с моделью Mixtral 8x7B ускоритель Groq LPU обеспечивает скорость инференса до 480 токенов в секунду, что является одним из лучших показателей в отрасли по состоянию на конец февраля 2024 года. В таких моделях, как Llama 2 70B с длиной контекста 4096 токенов, новый чип демонстрирует быстродействие на уровне 300 токенов в секунду, тогда как в меньшей модели Llama 2 7B с 2048 токенами контекста скорость инференса достигает 750 токенов в секунду.

Стартап Groq представил специализированный процессор, предназначенный для ускорения работы больших языковых моделей

В целом, как отмечается, ускоритель Groq LPU превосходит конкурирующие продукты NVIDIA, AMD и Intel. Фактически речь идет о переосмыслении эффективности вычислений ИИ. Изделие Groq LPU — это не просто чип: это предвестник новой эры, когда ИИ сможет легко интегрироваться в повседневную жизнь, преодолевая существующие барьеры задержки, затрудняющие взаимодействие систем с пользователем в режиме реального времени.Дмитрий Бородачев, DатаРу Облако: Наше преимущество — мультивендорная модель предоставления облачных услуг

В отличие от графических процессоров, в LPU используется упрощенный подход, устраняющий необходимость в сложном аппаратном обеспечении планирования и обеспечивающий постоянную задержку и большую пропускную способность. Кроме того, новое изделие обладает высокой энергетической эффективностью, благодаря чему сокращаются общие расходы на поддержание систем ИИ.[1]

Примечания



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Т1 Интеграция (ранее Техносерв) (4)
  МЦСТ (4)
  Микрон (Mikron) (4)
  Lenovo (4)
  ИНЭУМ им. И.С. Брука (3)
  Другие (48)

  Cloud4Y (ООО Флекс) (1)
  Huawei Россия (Хуавэй) (1)
  Intel (1)
  Lenovo (1)
  TSMC (1)
  Другие (4)

  ISBC Group (Интеллектуальные системы управления бизнесом) (1)
  МЦСТ (1)
  Национальный центр информатизации (НЦИ) (1)
  Норси-Транс (НТ) (1)
  Трансинформ (1)
  Другие (0)

  БПС Инновационные программные решения (ранее БПЦ Банковские технологии) (1)
  Другие (0)

  Микрон (Mikron) (1)
  РСК (группа компаний, ранее - РСК Скиф) (1)
  Другие (0)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МЦСТ (8, 22)
  Микрон (Mikron) (2, 9)
  Oracle (1, 7)
  Nvidia (Нвидиа) (18, 6)
  Intel (37, 5)
  Другие (195, 15)

  Байкал Электроникс (Baikal Electronics) (1, 2)
  Huawei (1, 1)
  Nvidia (Нвидиа) (1, 1)
  Микрон (Mikron) (1, 1)
  Intel (1, 1)
  Другие (0, 0)

  МЦСТ (2, 2)
  Микрон (Mikron) (1, 1)
  Т-Платформы (T-Platforms) (1, 1)
  Другие (0, 0)

  МЦСТ (1, 1)
  Другие (0, 0)

  Intel (1, 1)
  Микрон (Mikron) (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Микрон Интегральные микросхемы MIK - 9
  Эльбрус - 8
  Oracle SPARC - 7
  Intel Xeon Scalable - 5
  Эльбрус 4.4 - 4
  Другие 23

  Baikal-M - 2
  Intel Xeon Scalable - 1
  Микрон Интегральные микросхемы MIK - 1
  Huawei Kunpeng (процессоры) - 1
  Nvidia Tesla - 1
  Другие 0

  Baikal - 1
  Эльбрус - 1
  Микрон Интегральные микросхемы MIK - 1
  Эльбрус-8С - 1
  Другие 0

  Эльбрус - 1
  Другие 0

  Intel Xeon Scalable - 1
  Микрон Интегральные микросхемы MIK - 1
  Другие 0