Система хранения данных Сбера

Продукт
Разработчики: Сбербанк-Технологии (СберТех)
Отрасли: Финансовые услуги, инвестиции и аудит
Технологии: СХД

Как выяснил TAdviser, Сбербанк разрабатывает собственную СХД. Информация об этом содержится в ряде вакансий Сбербанка, опубликованных в октябре 2023 года на его сайте и на рекрутинговом портале HH. Речь идёт о «распределённой, отказоустойчивой, высоконагруженной программно-определяемой СХД».

«
Проект собственной системы хранения данных для Сбербанка – это амбициозная задача по созданию СХД из лучших мировых практик. Сложность уровня Big Enterprise, масштабируемость уровня Google, скорость на уровне современных суперкомпьютеров, – говорится в описании проекта по разработке.
»

Там же, в вакансиях, указано, что проект абсолютно новый, с полным отсутствием legacy, и полностью обеспечен «современным высокотехнологическим железом».

В Сбербанке ведётся амбициозный проект по созданию СХД «из лучших мировых практик» (фото: Вячеслав Прокофьев / ТАСС)

В обязанности разработчика С/C++, в частности, которого Сбербанк подыскивал под проект, входит разработка СХД, проектирование и разработка протоколов взаимодействия узлов кластера между собой, написание модулей СХД и вспомогательного ПО (мониторинг, автотесты и проч.), а также написание кода в ultra low latency стиле, с микросекундными задержками[1].

В Сбербанке предпочли не раскрывать детали этого проекта, в том числе, какое «железо» в нём применяется.

Не исключено, что в проекте может использоваться «железо» и экспертиза компании «Элпитех», которую в конце 2022 года приобрела ООО «Салютдевайсы» (до мая 2022-го она называлась «Сбердевайсы», SberDevices). Портфель «Элпитех» включает в себя, том числе, серверы, СХД. На сайте компании говорится, что одно из её продуктовых направлений – разработка и производство универсального и «блейд» серверов собственной торговой марки для применения в создании высокопроизводительных вычислительных кластеров, а также заявлены услуги в области HPC. В её команде присутствуют бывшие инженеры и архитекторы обанкротившегося производителя суперкомпьютеров «Т-Платформы», и возглавляет её выходец из «Т-Платформы» – Александр Грищенков. Дмитрий Бородачев, DатаРу Облако: Наше преимущество — мультивендорная модель предоставления облачных услуг

Правда, в январе 2023 года в Сбербанке заявляли изданию CNews, что SberDevices больше не входит в группу Сбербанка в результате некой сделки[2]. Вместе с тем, в вакансиях банка сейчас можно видеть набор персонала в SberDevices – «департамент SberDevices в Сбербанке»[3]. И интернет-магазин ООО «Салютдевайсы» по состоянию на октябрь 2023 года продолжает работать под брендом SberDevices.

Сейчас в Сбербанке применяется широкий портфель высокопроизводительных СХД зарубежных производителей. От главного эксперта СХД для стека HPC в подразделении SberInfra, обеспечивающем базис инфраструктурного развития экосистемы банка, требуется опыт работы с вендорскими решениями Dell EMC, NetApp, Huawei, Hitachi, HPE, Pure Storage[4]. При этом Сбербанк заинтересован в поиске перспективных решений и разработок в области СХД.

Отметим, что в Сбербанке уже не первый год ведётся много собственных разработок в области хранения и обработки данных. Одна из наиболее известных – SberData Platform (SDP), которая представляет собой набор интегрированных сервисов работы с данными[5]. По заявлению разработчиков, она позволяет упростить развертывание и настройку сервисов работы с данными, сократить время на создание решений для работы с большими данными. В основе платформы – собственные разработки, а также инструменты на основе свободно распространяемого ПО.

Также, к примеру, банк ведёт разработку собственных СУБД с использованием различных open source технологий. Одна из них – собственная сборка Сбербанка на базе Greenplum. Перед командой стояли амбициозные цели построить «уникальную в мировом масштабе инфраструктуру по хранению и обработке данных» на основе этой СУБД. Отличительная особенность собственной сборки – возможность обработки огромных массивов данных объёмом более 1 ПБ одновременно большим количеством пользователей.

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Рэйдикс (Raidix) (35)
  ITglobal.com (ИТглобалком Рус) (35)
  R-Style Softlab (Эр-Стайл Софтлаб) (27)
  BeringPro (БерингПойнт) ранее BearingPoint Russia (26)
  Сапран (Saprun) (22)
  Другие (546)

  Сапиенс солюшнс (Sapiens solutions) (7)
  ITglobal.com (ИТглобалком Рус) (6)
  Aerodisk (Аеро Диск) (4)
  Крикунов и Партнеры Бизнес Системы (КПБС, KPBS, Krikunov & Partners Business Systems) (3)
  BeringPro (БерингПойнт) ранее BearingPoint Russia (3)
  Другие (30)

  ActiveCloud by Softline (АктивХост РУ) (1)
  Aerodisk (Аеро Диск) (1)
  Hewlett Packard Enterprise (HPE) (1)
  ITglobal.com (ИТглобалком Рус) (1)
  Аквариус (Aquarius) (1)
  Другие (8)

  Киберпротект (ранее Акронис-Инфозащита, Acronis-Infoprotect) (3)
  Arenadata (Аренадата Софтвер) (1)
  Axenix (ранее Аксенчер Россия) Аксеникс (1)
  Beeline Cloud (DataFort) (1)
  Cloud4Y (ООО Флекс) (1)
  Другие (7)

  Platformcraft (Платформкрафт) (2)
  TData (ТДата) (2)
  КНС Групп (Yadro) (2)
  Aerodisk (Аеро Диск) (1)
  Cloud4Y (ООО Флекс) (1)
  Другие (8)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  SAP SE (1, 103)
  NetApp (25, 66)
  Рэйдикс (Raidix) (19, 52)
  IBM (30, 43)
  Dell EMC (68, 32)
  Другие (705, 344)

  SAP SE (1, 8)
  NetApp (5, 7)
  Aerodisk (Аеро Диск) (5, 6)
  Lenovo Data Center Group (1, 6)
  Lenovo (1, 6)
  Другие (18, 19)

  Aerodisk (Аеро Диск) (3, 2)
  Ростелеком (1, 1)
  ActiveCloud by Softline (АктивХост РУ) (1, 1)
  Dell EMC (1, 1)
  Lenovo (1, 1)
  Другие (7, 7)

  Киберпротект (ранее Акронис-Инфозащита, Acronis-Infoprotect) (1, 3)
  Arenadata (Аренадата Софтвер) (1, 1)
  Lenovo (1, 1)
  ВымпелКом ПАО (1, 1)
  КНС Групп (Yadro) (1, 1)
  Другие (3, 3)

  Platformcraft (Платформкрафт) (2, 2)
  Рэйдикс (Raidix) (1, 2)
  КНС Групп (Yadro) (1, 2)
  Aerodisk (Аеро Диск) (1, 1)
  Nextcloud GmbH (1, 1)
  Другие (4, 4)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 103
  Raidix СХД - 47
  NetApp FASx - 45
  RS-DataHouse - 24
  Lenovo ThinkSystem - 17
  Другие 354

  SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 8
  Lenovo ThinkSystem - 6
  IBM FlashSystem - 3
  NetApp FASx - 3
  Аэродиск Восток СХД - 3
  Другие 23

  Аэродиск Восток СХД - 1
  ActiveStorage (ранее Active S3) - 1
  SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 1
  NetApp FASx - 1
  Lenovo ThinkSystem - 1
  Другие 7

  Кибер Инфраструктура (ранее Acronis Инфраструктура) - 3
  Cloud4Y СХД - 1
  Вымпелком: Облако Билайн - 1
  Lenovo ThinkSystem - 1
  TATLIN семейство систем хранения данных - 1
  Другие 2

  TATLIN семейство систем хранения данных - 2
  Raidix СХД - 2
  Nextcloud Files - 1
  SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 1
  Platformcraft: Облачное хранилище для бизнеса - 1
  Другие 5