Т-Банк: Turbo Alignment Библиотека инструментов для обучения больших языковых моделей

Продукт
Разработчики: Т-Банк (Тинькофф Банк)
Дата премьеры системы: 2024/10/16
Технологии: Речевые технологии,  Средства разработки приложений

2024: Открытие доступа к Turbo Alignment

Центр искусственного интеллекта Т-Банка открыл доступ к бесплатной библиотеке инструментов Turbo Alignment для обучения больших языковых моделей (LLM) под задачи бизнеса. Библиотека позволит компаниям не разрабатывать ИИ-приложения с нуля, а использовать уже готовые инструменты. Об этом было объявлено 16 октября 2024 года.

Turbo Alignment поможет стартапам и крупному бизнесу, который не специализируется на ИИ, создавать инновационные продукты, которые были бы невозможны без LLM. Например, ассистентов поддержки, которые обрабатывают клиентские запросы и мгновенно предоставляют ответы, инструменты для анализа и обобщения крупных объемов текста, таких как отчеты и исследования, интеллектуальные поисковые системы, способные находить информацию с учетом контекста, а также модели для суммаризации текста.

Плюсы Turbo Alignment для бизнеса:

  • Комплексный подход. Компаниям не придется инвестировать в обучение больших языковых моделей с нуля. Кроме прикладных инструментов для создания ИИ-продуктов бизнесу доступна большая языковая модель T-lite, которая показывает лучшие результаты в решении бизнес-задач на русском языке среди открытых моделей размером 7—8 млрд параметров.
  • Снижение затрат на разработку. Turbo Alignment значительно снижает затраты на разработку ИИ-продуктов и количество используемых вычислительных ресурсов за счет использования готовых инструментов и моделей.
  • Экономия времени. По оценке разработчиков Т-Банка, скорость разработки с помощью репозитория — от идеи до продукта — выросла в 4 раза. Это сокращает время на запуск новых ИИ-продуктов и дает бизнесу конкурентное качество.
  • Улучшение клиентского опыта. Продукты на основе LLM делают взаимодействие с пользователями более интерактивным и персонализированным, учитывают их индивидуальные потребности. Это ускоряет обслуживание и повышает удовлетворенность клиентов.

«
Создание библиотеки Turbo Alignment — это часть нашей стратегии по развитию российской ИТ-индустрии. Как один из лидеров опенсорса, мы видим свою миссию в том, чтобы делиться с рынком своими разработками. У большинства компаний не хватает ресурсов для разработки продуктов на основе больших языковых моделей. Поэтому мы выпустили в опенсорс не только модель T-lite, но и библиотеку инструментов для ее прикладного использования. Так мы делаем ИИ более доступным для обычных людей: чем больше компаний создают ИИ-продукты, тем больше пользователей смогут извлечь пользу из этих технологий,
сказал Артем Бондарь, руководитель направления обработки естественного языка (NLP) в Центре искусственного интеллекта Т-Банка.
»

Библиотека создана при участии ученых из лаборатории научных исследований искусственного интеллекта T-Bank AI Research. В ней исследователи разрабатывают и проектируют новые методы, которые становятся основой их научных открытий. Turbo Alignment дает доступ к последним исследованиям в области AI Alignment, направленным на то, чтобы поведение ИИ было предсказуемым и не выходило из-под контроля человека, соответствовало его потребностям и ценностям. В библиотеке собраны все необходимые метрики и инструменты, которые позволяют понять и проанализировать различные подходы к обучению ИИ. Эксперты «Сколково» и TAdviser: российский рынок решений для интегрированного бизнес-планирования не избежал «болезней роста» 6.6 т

Преимущества Turbo Alignment для разработчиков:

  • Доступность для небольших и непрофильных команд. Turbo Alignment позволяет даже небольшим командам без значительных ресурсов и глубокой экспертизы в области языковых моделей создавать продукты на основе искусственного интеллекта.
  • Набор готовых инструментов. В репозитории доступен no-code-запуск экспериментов, скрипты для обучения большого количества алгоритмов, модуль для быстрого тестирования моделей и инструменты для мониторинга метрик во время обучения.
  • Инструменты для исследований и разработки. Turbo Alignment предоставляет все необходимые средства для добавления новых методов обучения и их сравнения с уже существующими решениями на конкретных задачах.
  • Поддержка сложных процессов обучения. Turbo Alignment оптимизирован для распределенного обучения на нескольких видеокартах и серверах (Multi-GPU и Multi-Node).

«
Современные эксперименты с большими языковыми моделями (LLM) нуждаются в стабильности, воспроизводимости и объяснимости — это ключевые факторы для создания качественных продуктов. Хотя на рынке уже существуют конкурентные решения, они зачастую фрагментированы и требуют доработки. В отличие от них мы объединили все необходимые компоненты в единой библиотеке, что обеспечивает целостность и удобство использования. Turbo Alignment предлагает расширенную функциональность, готовую последовательность работы с данными и инструменты для обучения LLM. Это позволяет быстро проверять научные и продуктовые гипотезы,
отметил Артем Бондарь, руководитель направления обработки естественного языка (NLP) в Центре искусственного интеллекта Т-Банка.
»

В дальнейшем Т-Банк планирует поддерживать и развивать библиотеку Turbo Alignment, добавляя новые методы и обучающие материалы.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Солар (ранее Ростелеком-Солар) (46)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (15)
  Форсайт (11)
  Бипиум (Bpium) (10)
  Axiom JDK (БеллСофт) ранее Bellsoft (9)
  Другие (385)

  Солар (ранее Ростелеком-Солар) (8)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (4)
  Консом групп, Konsom Group (КонсОМ СКС) (2)
  IFellow (АйФэлл) (2)
  ЛАНИТ - Би Пи Эм (Lanit BPM) (2)
  Другие (30)

  Солар (ранее Ростелеком-Солар) (10)
  Форсайт (3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  Cloud.ru (Облачные технологии) ранее SberCloud (2)
  КРИТ (KRIT) (2)
  Другие (13)

  Солар (ранее Ростелеком-Солар) (6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  РЖД-Технологии (3)
  Robin (Робин) (3)
  Другие (23)

  Солар (ранее Ростелеком-Солар) (3)
  Unlimited Production (Анлимитед Продакшен, eXpress) (2)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1)
  Effective Technologies (Эффектив Технолоджис) (1)
  Другие (6)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Солар (ранее Ростелеком-Солар) (2, 48)
  Microsoft (41, 47)
  Oracle (49, 26)
  Hyperledger (Open Ledger Project) (1, 23)
  IBM (33, 18)
  Другие (587, 299)

  Солар (ранее Ростелеком-Солар) (1, 8)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (1, 4)
  Microsoft (4, 3)
  Oracle (2, 3)
  SAP SE (2, 2)
  Другие (16, 19)

  Солар (ранее Ростелеком-Солар) (1, 11)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 3)
  Форсайт (1, 3)
  Сбербанк (1, 2)
  Cloud.ru (Облачные технологии) ранее SberCloud (1, 2)
  Другие (9, 9)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 6)
  Солар (ранее Ростелеком-Солар) (1, 6)
  Мобильные ТелеСистемы (МТС) (1, 4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  РЖД-Технологии (1, 3)
  Другие (14, 24)

  Мобильные ТелеСистемы (МТС) (2, 3)
  Солар (ранее Ростелеком-Солар) (1, 3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 2)
  Оператор Газпром ИД (ГИД) (1, 1)
  Другие (9, 9)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Solar appScreener (ранее Solar inCode) - 48
  Hyperledger Fabric - 23
  Windows Azure - 20
  FIS Platform - 15
  Форсайт. Мобильная платформа (ранее HyperHive) - 12
  Другие 319

  Solar appScreener (ранее Solar inCode) - 8
  FIS Platform - 4
  Java - 2
  Турбо X - 2
  Парадокс: MES Builder - 2
  Другие 22

  Solar appScreener (ранее Solar inCode) - 11
  Форсайт. Мобильная платформа (ранее HyperHive) - 3
  BSS Digital2Go - 3
  Cloud ML Space - 2
  Leroy Merlin Platformeco - 1
  Другие 8

  Solar appScreener (ранее Solar inCode) - 6
  EXpress Защищенный корпоративный мессенджер - 6
  МТС Exolve - 4
  Форсайт. Мобильная платформа (ранее HyperHive) - 3
  РЖД и Робин: Облачная фабрика программных роботов - 3
  Другие 14

  Solar appScreener (ранее Solar inCode) - 3
  EXpress Защищенный корпоративный мессенджер - 2
  МТС Exolve - 2
  GreenData Платформа - 1
  СберТех Platform V - 1
  Другие 6

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (44)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (29)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (27)
  SteadyControl (18)
  Naumen (Наумен консалтинг) (15)
  Другие (186)

  Группа компаний ЦРТ (Центр речевых технологий) (5)
  SteadyControl (4)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  Naumen (Наумен консалтинг) (2)
  Neuro.net (Нейро) (2)
  Другие (17)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Naumen (Наумен консалтинг) (3)
  SteadyControl (2)
  Другие (14)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (5)
  Naumen (Наумен консалтинг) (4)
  Другие (29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3)
  Naumen (Наумен консалтинг) (2)
  Другие (23)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (17, 46)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 30)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 29)
  SteadyControl HoReCa (1, 23)
  SteadyControl (1, 23)
  Другие (345, 205)

  Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  SteadyControl HoReCa (1, 4)
  SteadyControl (1, 4)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Другие (9, 13)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Naumen (Наумен консалтинг) (1, 3)
  SteadyControl (1, 3)
  Другие (12, 16)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 7)
  SteadyControl (1, 7)
  Другие (17, 29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 5)
  SteadyControl (1, 5)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 3)
  СалютДевайсы (ранее SberDevices) (2, 3)
  Другие (19, 31)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МТТ VoiceBox - 24
  SteadyControl Система контроля и управления персоналом - 23
  BSS Digital2Speech - 21
  Voice2Med Система распознавания речи в медицине - 14
  Naumen Erudite - 13
  Другие 195

  BSS Digital2Speech - 5
  SteadyControl Система контроля и управления персоналом - 4
  Voice2Med Система распознавания речи в медицине - 4
  МТТ VoiceBox - 2
  Neuro.net Голосовой робот - 2
  Другие 11

  МТТ VoiceBox - 11
  BSS Digital2Speech - 6
  SteadyControl Система контроля и управления персоналом - 3
  Naumen Erudite - 3
  VS Robotics: VS Робот-оператор - 3
  Другие 14

  МТТ VoiceBox - 9
  SteadyControl Система контроля и управления персоналом - 7
  BSS Digital2Speech - 6
  EXpress Защищенный корпоративный мессенджер - 6
  SmartLogger II - 4
  Другие 23

  SteadyControl Система контроля и управления персоналом - 5
  BSS Digital2Speech - 4
  Robovoice Пользовательская no-code платформа для разработки ИИ-ботов - 3
  YandexGPT (YaLM 2.0) - 3
  BSS: Виртуальный голосовой ассистент - 3
  Другие 22