Яндекс: YaFSDP Библиотека для ускорения обучения больших языковых моделей

Продукт
Разработчики: Яндекс (Yandex)
Дата премьеры системы: 2024/06/11
Технологии: ITSM - Системы управления IT-службой

2024: Представление библиотеки YaFSDP

Яндекс разработал библиотеку YaFSDP и выложил ее в опенсорс. Об этом разработчик сообщил 11 июня 2024 года. Она значительно ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом. Библиотека даёт ускорение до 25% — результат зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения. Теперь YaFSDP могут использовать компании, разработчики и исследователи по всему миру.

Библиотека Яндекса рассчитана в первую очередь на большие языковые модели, хотя она подходит и для других нейросетей — например, таких, которые генерируют изображения. YaFSDP позволяет сократить расходы на оборудование для обучения моделей — это особенно важно для стартапов и, к примеру, научных проектов.

Одна из сложностей в обучении больших языковых моделей — это недостаточная загрузка каналов коммуникации между графическими процессорами. YaFSDP это решает. Библиотека оптимизирует использование ресурсов GPU на всех этапах обучения: pre-training (предварительное), supervised fine-tuning (с учителем), alignment (выравнивание модели). Благодаря этому YaFSDP задействует ровно столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет.

Яндекс разработал YaFSDP в процессе обучения своей генеративной модели нового поколения YandexGPT 3. Компания уже протестировала библиотеку на сторонних нейросетях с открытым исходным кодом. Например, если бы YaFSDP использовалась применительно к модели LLaMA 2, этап предварительного обучения на 1024 графических процессорах сократился бы с 66 до 53 дней.

Исходный код YaFSDP уже есть на GitHub[1]. Посмотреть подробности замеров можно в репозитории GitHub, а почитать про разработку библиотеки — на Хабре.

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Naumen (Наумен консалтинг) (327)
  Comindware (Колловэар) (254)
  Softline (Софтлайн) (126)
  Okdesk (Облачные Решения) (40)
  Террасофт (Terrasoft, ТС-Консалтинг) (38)
  Другие (726)

  Comindware (Колловэар) (78)
  Okdesk (Облачные Решения) (14)
  Naumen (Наумен консалтинг) (11)
  Крикунов и Партнеры Бизнес Системы (КПБС, KPBS, Krikunov & Partners Business Systems) (7)
  Nutanix (бизнес в России) (3)
  Другие (28)

  Naumen (Наумен консалтинг) (14)
  Okdesk (Облачные Решения) (9)
  Comindware (Колловэар) (8)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (7)
  БизнесАвтоматика НПЦ (3)
  Другие (18)

  Naumen (Наумен консалтинг) (18)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (12)
  SimpleOne (Симпл 1) (9)
  Softline (Софтлайн) (3)
  Деснол Софт (2)
  Другие (19)

  Naumen (Наумен консалтинг) (8)
  SimpleOne (Симпл 1) (4)
  Астра Группа компаний (3)
  Флант (Flant) (3)
  Softline (Софтлайн) (2)
  Другие (17)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Naumen (Наумен консалтинг) (7, 351)
  Comindware (Колловэар) (1, 257)
  Microsoft (16, 123)
  OmniNet (ОмниНет) (4, 55)
  Террасофт (Terrasoft, ТС-Консалтинг) (4, 47)
  Другие (587, 629)

  Comindware (Колловэар) (1, 78)
  Okdesk (Облачные Решения) (1, 14)
  Rails Jedies
  Naumen (Наумен консалтинг) (3, 12)
  Nutanix (1, 9)
  Другие (18, 24)

  Naumen (Наумен консалтинг) (3, 14)
  Okdesk (Облачные Решения) (1, 10)
  Rails Jedies
  Comindware (Колловэар) (1, 8)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 7)
  Другие (11, 14)

  Naumen (Наумен консалтинг) (4, 18)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (1, 12)
  SimpleOne (Симпл 1) (1, 10)
  Деснол Софт (2, 3)
  РусБИТех-Астра (ГК Астра) (1, 3)
  Другие (9, 11)

  Naumen (Наумен консалтинг) (3, 10)
  РусБИТех-Астра (ГК Астра) (1, 6)
  SimpleOne (Симпл 1) (1, 4)
  Флант (Flant) (1, 3)
  Carbon Soft (Карбон Софт) EvaTeam (1, 1)
  Другие (12, 12)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Naumen Service Desk - 283
  Comindware Business Application Platform - 257
  ITSM365.ru - 51
  Microsoft System Center Configuration Manager (SCCM) - 50
  Okdesk Система учета и регистрации заявок для малых и средних сервисных компаний - 41
  Другие 722

  Comindware Business Application Platform - 78
  Okdesk Система учета и регистрации заявок для малых и средних сервисных компаний - 14
  Nutanix HCI - 9
  ITSM365.ru - 6
  Naumen Service Desk - 4
  Другие 26

  Okdesk Система учета и регистрации заявок для малых и средних сервисных компаний - 10
  ITSM365.ru - 9
  Comindware Business Application Platform - 8
  ELMA365 Service - 6
  Naumen Service Desk - 3
  Другие 18

  ELMA365 Service - 12
  SimpleOne ITSM (IT Service Management) - 10
  ITSM365.ru - 9
  Naumen Service Desk - 7
  РусБИТех-Астра: ALD Pro - 3
  Другие 15

  РусБИТех-Астра: ALD Pro - 6
  Naumen Service Desk - 6
  SimpleOne ITSM (IT Service Management) - 4
  ITSM365.ru - 3
  Deckhouse Kubernetes-платформа - 3
  Другие 13