Сбербанк Auto ML

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Сбербанк
Дата премьеры системы: 2019/02/14
Отрасли: Финансовые услуги, инвестиции и аудит
Технологии: Data Mining

Auto ML — система алгоритмов, которая быстро и самостоятельно создает прикладные решения на основе моделей машинного обучения.

2019: Разработка и тестирование модели Auto ML

Сбербанк разработал модель машинного обучения Auto ML. Об этом 14 февраля 2019 года заявил заместитель Председателя Правления Сбербанка Анатолий Попов. Как он пояснил, Auto ML представляет собой алгоритм, который умеет создавать другие модели. А они, в свою очередь, уже решают прикладные задачи — например, прогнозируют платежеспособность клиента при выдаче кредита или помогают отделять законопослушных клиентов от нарушителей.

Сбербанк разработал алгоритм, который работает как дата-сайентист

Как подчеркнул Анатолий Попов, алгоритм позволяет оптимизировать один из важных шагов создания применяемой в бизнесе модели машинного обучения, а именно — создание baseline-модели (первой версии модели, которая затем развивается уже с участием человека). Качество baseline-моделей созданных алгоритмом Auto ML сопоставимо с качеством модели, создаваемой в ручную. При этом скорость работы алгоритма в 10-15 раз превосходит скорость работы человека, заверил зампредседателя Правления банка.

Разработка уже была протестирована Сбербанком в рамках пилотного проекта в январе 2019 года: алгоритмы Auto ML были применены для создания нескольких baseline-моделей (первых версий) класса Next BestAction (таргетирование кампаний продаж).Российский рынок облачных ИБ-сервисов только формируется 2.6 т

По мнению экспертов банка, полученные результаты доказывают возможность использования технологии автоматического моделирования для быстрого формирования базовых моделей обработки данных и запуска кампаний продаж корпоративно-инвестиционного бизнеса Сбербанка.

«
Одна из возможностей для повышения эффективности всех бизнес-процессов в банке — внедрение искусственного интеллекта. Однако создание десятков тысяч моделей, чтобы покрыть все аспекты деятельности, является практически нереальной задачей, если для создания и внедрения моделей применять только ручной труд дата-сайентистов и разработчиков. Поэтому мы внедряем у себя один из самых современных в мире подходов к работе с моделями машинного обучения — Auto ML. Систему алгоритмов, которая быстро и самостоятельно создает прикладные решения на основе моделей машинного обучения, — заключил Анатолий Попов, заместитель Председателя Правления Сбербанка.
»

  • Система представляет собой связанные потоками данных ML-модели (machine learning), которые работают на одном из самых крупных в России Hadoop кластере (более 15 петабайт данных).
  • При этом модели интегрированы в промышленные бизнес процессы Банка – кредитование, таргетирование продаж, работа колл-центра, процедуры комплаенс и др.
  • Система моделей обрабатывает данные по 2 млн юридических лиц и порядка 100 млн физ лиц.

Для создания ML-моделей активно используется ручной подход и пилотируется Auto ML.

Auto ML — алгоритм, который умеет создавать другие модели. А они, в свою очередь, уже решают прикладные задачи — например, прогнозируют платежеспособность клиента при выдаче кредита или помогают отделять законопослушных клиентов от нарушителей.

В 1 квартале 2019 г. был проведен пилот: алгоритмы Auto ML были применены для создания нескольких baseline-моделей (первых версий) класса Next BestAction (таргетирование кампаний продаж).

Алгоритм позволяет оптимизировать один из важных шагов создания применяемой в бизнесе модели машинного обучения, а именно создание baseline-модели (первой версии модели, которая потом развивается уже с участием человека). Качество baseline-моделей, созданных алгоритмом Auto ML, сопоставимо с качеством модели, создаваемой вручную. При этом скорость работы алгоритма в 10-15 раз превосходит скорость работы человека.

Полученные результаты доказывают возможность использования технологии автоматического моделирования для быстрого формирования базовых моделей обработки данных и использования его для запуска кампаний продаж КИБ.

Одно из самых коммерчески эффективных приложений на наш взгляд - это комплаенс.

Разработана и запущена программа-решение, позволяющее применять дифференцированную стратегию работы с клиентами, в деятельности которых установлены операции сомнительного характера. Чтобы не блокировать законопослушных клиентов, чье поведение тем не менее очень напоминает поведение недобросовестных, с помощью ML-моделей удалось минимизировать блокировки таких клиентов и позволить добросовестным клиентам вернуться к их регулярной деятельности.

Одно из основных направлений деятельности Банка – выдача кредитов. В процессе принятия решения о выдаче кредита используются данные, полученные через канал СМЭВ (Система межведомственного электронного взаимодействия). Через СМЭВ с начала 2019 г верифицировано более 4 млн клиентов ИП и ФЛ в рамках 115 ФЗ.

Еще одна из востребованных услуг - открытие счетов для ЮЛ/ИП. С начала года осуществлено более 200 тысяч проверок клиентов через СМЭВ. Это существенно высвобождает время специалистов операционного центра и приближает переход Банка на цифровые каналы взаимодействия с органами государственной власти в рамках реализации программы «Цифровая экономика Российской федерации».

Виртуальные операторы на основе NLP моделей. Чат-боты, как и другие программы с элементами искусственного интеллекта, хорошо продолжают нашу линейку небанковских сервисов. На сегодняшний день именно небанковские сервисы Сбербанка пользуются наибольшей популярностью у бизнесменов, поскольку помогают предпринимателям решить большинство насущных вопросов. В КИБ реализованы и развиваются голосовой виртуальный оператор Анна, текстовый чат бот и помощник оператора колл центра. Уже сейчас можно сказать, что виртуальные операторы сокращают время ответа на вопрос клиента в 4-9 раз.

Реализация проектов происходит командами из 8-10 человек, работающих в agile. Направление ML-моделей и искусственного интеллекта одно из самых интересных и перспективных в КИБ. За год мы расширились с 30 до 90 сотрудников.















РЕШЕНИЕ НА БАЗЕ (1) СМ. ТАКЖЕ (2)
Название решенияРазработчикКоличество
проектов
Технологии
Сбербанк Помощник оператора колл-центраСбербанк0Call-центры, Речевые технологии


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  БизнесАвтоматика НПЦ (120)
  Инфосистемы Джет (13)
  Сбербанк (10)
  Marketing Logic (Маркетинг Лоджик) (9)
  Другие (640)

  Ростелеком (3)
  БизнесАвтоматика НПЦ (3)
  Сапиенс солюшнс (Sapiens solutions) (2)
  Сбербанк (2)
  IPavlov (Айпавлов) (2)
  Другие (48)

  БизнесАвтоматика НПЦ (12)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  Платформа больших данных (Platforma) (2)
  К-Скай (K-SkAI) (2)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2)
  Другие (57)

  БизнесАвтоматика НПЦ (5)
  Группа компаний ЦРТ (Центр речевых технологий) (2)
  Сбер Бизнес Софт (2)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  Другие (63)

  БизнесАвтоматика НПЦ (8)
  SL Soft (СЛ Софт) (3)
  Сбер Бизнес Софт (3)
  Авантелеком (2)
  Полиматика (Polymatica) (2)
  Другие (69)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (2, 236)
  БизнесАвтоматика НПЦ (2, 119)
  Полиматика (Polymatica) (4, 15)
  SL Soft (СЛ Софт) (3, 15)
  Oracle (12, 14)
  Другие (314, 182)

  БизнесАвтоматика НПЦ (1, 3)
  Dell EMC (1, 2)
  Полиматика (Polymatica) (1, 2)
  SL Soft (СЛ Софт) (1, 2)
  Informatica (1, 1)
  Другие (6, 6)

  БизнесАвтоматика НПЦ (1, 12)
  Сбербанк (2, 2)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (1, 2)
  К-Скай (K-SkAI) (1, 2)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  Другие (14, 16)

  БизнесАвтоматика НПЦ (1, 5)
  Сбербанк (3, 3)
  Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 2)
  Полиматика (Polymatica) (1, 2)
  Другие (16, 19)

  БизнесАвтоматика НПЦ (1, 7)
  SL Soft (СЛ Софт) (3, 4)
  Полиматика (Polymatica) (3, 4)
  Rubbles (Раблз) (1, 2)
  Retail Rocket (Ритейл Рокет) (1, 2)
  Другие (15, 15)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Deductor - 226
  Visary BI Платформа бизнес-аналитики - 119
  Polymatica Analytics Аналитическая платформа - 13
  Loginom Аналитическая платформа - 10
  IBM SPSS Decision Management - 10
  Другие 167

  Visary BI Платформа бизнес-аналитики - 3
  EMC Greenplum Data Computing Appliance - 2
  Polymatica Analytics Аналитическая платформа - 2
  Loginom Аналитическая платформа - 1
  IBM SPSS Decision Management - 1
  Другие 5

  Visary BI Платформа бизнес-аналитики - 12
  Loginom Аналитическая платформа - 2
  Platforma и HFLabs: Технология безопасного метчинга данных - 2
  Webiomed - Платформа предиктивной аналитики и управления рисками в здравоохранении на основе машинного обучения - 2
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
  Другие 11

  Visary BI Платформа бизнес-аналитики - 5
  Polymatica Analytics Аналитическая платформа - 2
  CM.Expert Data Mining платформа - 2
  ЦРТ: Speech Analytics Lab - 2
  PIX Process Management (PIX Процессы) - 2
  Другие 15

  Visary BI Платформа бизнес-аналитики - 7
  Retail Rocket: Smart Placement Ads - 2
  Rubbles Customer Insight - 2
  Polymatica Analytics Аналитическая платформа - 2
  Преферентум. Платформа анализа неструктурированной информации - 1
  Другие 9