Halyk Bank при поддержке Databorn внедрил корпоративную ModelOps-платформу на технологиях open-source
Заказчики: Народный банк Казахстана (Halyk bank) Алматы; Финансовые услуги, инвестиции и аудит Подрядчики: Databorn Продукт: Проекты ИТ-аутсорсингаДата проекта: 2022/06 — 2022/12
|
Технология: ИТ-аутсорсинг
|
2022: Внедрение корпоративной ModelOps-платформы
Halyk Bank внедрил корпоративную ModelOps-платформу, развернутую на базе ПО с открытым кодом. Автором проекта выступила команда экспертов международной компании-интегратора Databorn. Решение позволило сократить как минимум в два раза время вывода в промышленную эксплуатацию (time-to-market) ML-моделей. Об этом 12 января 2023 года TAdviser сообщил Андрей Суставов, директор Databorn.
Потребность в технологическом решении была обусловлена отсутствием в банке единой платформы для разработки и применения ML-моделей, а также единой системы отслеживания их метрик и параметров.
На протяжении последних лет мы активно развиваем направление Data Science. Увеличивается количество ML-моделей, и обходиться без полноценной системы продуктивизции разрабатываемых моделей стало сложнее, – пояснил Роман Машчык, заместитель председателя правления Halyk Bank. – Для решения вопроса мы привлекли экспертную команду Databorn, которая внедрила корпоративную ModelOps-платформу. Теперь все ML-модели разрабатываются на основе единого шаблона и имеют стандартизованный пайплайн продуктивизации для регламентного предсказания и автоматического переобучения. |
Платформа интегрирована с банковскими источниками данных, состоит из различных инструментов, развернутых в кластере Kubernetes. Такое решение позволяет обеспечить гибкость инструмента, эффективное управление имеющимися вычислительными ресурсами, а также предоставляет возможность быстрого масштабирования.
Для непрерывной интеграции (упаковки) и продуктивизации используется Gitlab CI/CD. С его помощью построен единый пайплайн вывода модели от стадии разработки до применения в продакшене. В качестве инструмента по управлению Data Science-экспериментами используется MLFlow, что позволяет логировать метрики и параметры модели, а также различные артефакты экспериментов, принимать решения о внедрении моделей, выполнять ретроспективный анализ процесса изменения метрик. Оркестратором применения ML-моделей служит Airflow.TrafficSoft ADC: балансировщик нагрузки с высокой скоростью работы и минимальными аппаратными требованиями
По результатам опытной эксплуатации, на примере перенесенной на платформу модели, в среднем весь процесс от создания модели до вывода в промышленную эксплуатацию теперь проходит как минимум в 2 раза быстрее, чем до внедрения платформы.
MLOps помогает бизнесу развивать Data Science-направление эффективнее и внедрять качественные ML-модели значительно быстрее, – рассказал Андрей Суставов. – Подход объединяет Machine Learning, DevOps, Data Engineering и Model Governance в единую методологию создания, внедрения и эксплуатации моделей машинного обучения. CI/CD-процессы на платформе выстроены в понятные и единообразные шаги: разработку, сборку, тестирование, внедрение и эксплуатацию, что позволяет продуктивизировать модель быстрее. Ускорение time-to-market высвобождает время для разработки новых моделей специалистами банка, что позволяет решать больше задач бизнеса с помощью технологий машинного обучения. |
Halyk Bank нацелен интенсивно развивать направление Data Science, и внедрение ModelOps сыграет важную роль в достижении этой цели.