Система хранения данных Сбера

Продукт
Разработчики: Сбербанк-Технологии (СберТех)
Отрасли: Финансовые услуги, инвестиции и аудит
Технологии: СХД

Как выяснил TAdviser, Сбербанк разрабатывает собственную СХД. Информация об этом содержится в ряде вакансий Сбербанка, опубликованных в октябре 2023 года на его сайте и на рекрутинговом портале HH. Речь идёт о «распределённой, отказоустойчивой, высоконагруженной программно-определяемой СХД».

«
Проект собственной системы хранения данных для Сбербанка – это амбициозная задача по созданию СХД из лучших мировых практик. Сложность уровня Big Enterprise, масштабируемость уровня Google, скорость на уровне современных суперкомпьютеров, – говорится в описании проекта по разработке.
»

Там же, в вакансиях, указано, что проект абсолютно новый, с полным отсутствием legacy, и полностью обеспечен «современным высокотехнологическим железом».

В Сбербанке ведётся амбициозный проект по созданию СХД «из лучших мировых практик» (фото: Вячеслав Прокофьев / ТАСС)

В обязанности разработчика С/C++, в частности, которого Сбербанк подыскивал под проект, входит разработка СХД, проектирование и разработка протоколов взаимодействия узлов кластера между собой, написание модулей СХД и вспомогательного ПО (мониторинг, автотесты и проч.), а также написание кода в ultra low latency стиле, с микросекундными задержками[1].

В Сбербанке предпочли не раскрывать детали этого проекта, в том числе, какое «железо» в нём применяется.

Не исключено, что в проекте может использоваться «железо» и экспертиза компании «Элпитех», которую в конце 2022 года приобрела ООО «Салютдевайсы» (до мая 2022-го она называлась «Сбердевайсы», SberDevices). Портфель «Элпитех» включает в себя, том числе, серверы, СХД. На сайте компании говорится, что одно из её продуктовых направлений – разработка и производство универсального и «блейд» серверов собственной торговой марки для применения в создании высокопроизводительных вычислительных кластеров, а также заявлены услуги в области HPC. В её команде присутствуют бывшие инженеры и архитекторы обанкротившегося производителя суперкомпьютеров «Т-Платформы», и возглавляет её выходец из «Т-Платформы» – Александр Грищенков. Михаил Садиров, SMART technologies: На тестирование мультивендорных решений есть спрос

Правда, в январе 2023 года в Сбербанке заявляли изданию CNews, что SberDevices больше не входит в группу Сбербанка в результате некой сделки[2]. Вместе с тем, в вакансиях банка сейчас можно видеть набор персонала в SberDevices – «департамент SberDevices в Сбербанке»[3]. И интернет-магазин ООО «Салютдевайсы» по состоянию на октябрь 2023 года продолжает работать под брендом SberDevices.

Сейчас в Сбербанке применяется широкий портфель высокопроизводительных СХД зарубежных производителей. От главного эксперта СХД для стека HPC в подразделении SberInfra, обеспечивающем базис инфраструктурного развития экосистемы банка, требуется опыт работы с вендорскими решениями Dell EMC, NetApp, Huawei, Hitachi, HPE, Pure Storage[4]. При этом Сбербанк заинтересован в поиске перспективных решений и разработок в области СХД.

Отметим, что в Сбербанке уже не первый год ведётся много собственных разработок в области хранения и обработки данных. Одна из наиболее известных – SberData Platform (SDP), которая представляет собой набор интегрированных сервисов работы с данными[5]. По заявлению разработчиков, она позволяет упростить развертывание и настройку сервисов работы с данными, сократить время на создание решений для работы с большими данными. В основе платформы – собственные разработки, а также инструменты на основе свободно распространяемого ПО.

Также, к примеру, банк ведёт разработку собственных СУБД с использованием различных open source технологий. Одна из них – собственная сборка Сбербанка на базе Greenplum. Перед командой стояли амбициозные цели построить «уникальную в мировом масштабе инфраструктуру по хранению и обработке данных» на основе этой СУБД. Отличительная особенность собственной сборки – возможность обработки огромных массивов данных объёмом более 1 ПБ одновременно большим количеством пользователей.

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ITglobal.com (ИТглобалком Рус) (35)
  Рэйдикс (Raidix) (35)
  R-Style Softlab (Эр-Стайл Софтлаб) (27)
  BeringPro (БерингПойнт) ранее BearingPoint Russia (26)
  Сапран (Saprun) (22)
  Другие (546)

  Сапиенс солюшнс (Sapiens solutions) (7)
  ITglobal.com (ИТглобалком Рус) (6)
  Aerodisk (Аеро Диск) (4)
  Lenovo Россия (3)
  Крикунов и Партнеры Бизнес Системы (КПБС, KPBS, Krikunov & Partners Business Systems) (3)
  Другие (30)

  Аквариус (Aquarius) (1)
  КНС Групп (Yadro) (1)
  КРИТ (KRIT) (1)
  Кортис (1)
  Крикунов и Партнеры Бизнес Системы (КПБС, KPBS, Krikunov & Partners Business Systems) (1)
  Другие (8)

  Киберпротект (ранее Акронис-Инфозащита, Acronis-Infoprotect) (3)
  Mind Software (Майнд Софт) (1)
  TData (ТДата) (1)
  Кортис (1)
  Кортис Технологии (1)
  Другие (7)

  Platformcraft (Платформкрафт) (2)
  TData (ТДата) (2)
  КНС Групп (Yadro) (2)
  ITglobal.com (ИТглобалком Рус) (1)
  Lenovo (1)
  Другие (8)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  SAP SE (1, 103)
  NetApp (25, 66)
  Рэйдикс (Raidix) (19, 52)
  IBM (30, 43)
  Dell EMC (68, 32)
  Другие (705, 352)

  SAP SE (1, 8)
  NetApp (5, 7)
  Aerodisk (Аеро Диск) (5, 6)
  Lenovo (1, 6)
  Lenovo Data Center Group (1, 6)
  Другие (18, 19)

  Aerodisk (Аеро Диск) (3, 2)
  Hewlett Packard Enterprise (HPE) (1, 1)
  Lenovo Data Center Group (1, 1)
  NetApp (1, 1)
  TData (ТДата) (1, 1)
  Другие (7, 7)

  Киберпротект (ранее Акронис-Инфозащита, Acronis-Infoprotect) (1, 3)
  Cloud4Y (ООО Флекс) (1, 1)
  Lenovo Data Center Group (1, 1)
  ВымпелКом ПАО (1, 1)
  КНС Групп (Yadro) (1, 1)
  Другие (5, 5)

  Platformcraft (Платформкрафт) (2, 2)
  TData (ТДата) (1, 2)
  Ростелеком (1, 2)
  КНС Групп (Yadro) (1, 2)
  Рэйдикс (Raidix) (1, 2)
  Другие (6, 6)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 103
  Raidix СХД - 47
  NetApp FASx - 45
  RS-DataHouse - 24
  Lenovo ThinkSystem - 17
  Другие 358

  SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 8
  Lenovo ThinkSystem - 6
  Аэродиск Восток СХД - 3
  IBM FlashSystem - 3
  NetApp FASx - 3
  Другие 23

  Аэродиск Восток СХД - 1
  ActiveStorage (ранее Active S3) - 1
  SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 1
  NetApp FASx - 1
  Lenovo ThinkSystem - 1
  Другие 7

  Кибер Инфраструктура (ранее Acronis Инфраструктура) - 3
  Cloud4Y СХД - 1
  TATLIN семейство систем хранения данных - 1
  Lenovo ThinkSystem - 1
  Вымпелком: Облако Билайн - 1
  Другие 3

  Raidix СХД - 2
  RT.Datalake Решение для хранения и обработки данных любых объемов - 2
  TATLIN семейство систем хранения данных - 2
  Nextcloud Files - 1
  Synology NAS - DiskStation Manager - 1
  Другие 6