Oracle Cloud Data Science Platform

Продукт
Название базовой системы (платформы): Oracle Cloud
Разработчики: Oracle
Дата премьеры системы: 2020/02/20
Технологии: Big Data,  Data Mining,  MDM - Master Data Management - Управление основными мастер-данными,  SaaS - Программное обеспечение как услуга

2020: Доступность платформы Oracle Cloud Data Science Platform

20 февраля 2020 года корпорация Oracle объявила о доступности платформы Oracle Cloud Data Science Platform с семью сервисами и Oracle Cloud Infrastructure Data Science в основе. Сервисы помогут предприятиям сделать проекты в области Data Science более успешными благодаря решению задач совместной разработки, обучения, управления и развертывания моделей машинного обучения. В отличие от других продуктов для обработки данных, которые ориентированы на отдельных исследователей, сервис Oracle Cloud Infrastructure Data Science помогает повысить эффективность деятельности групп специалистов по обработке и анализу данных. Для этого предлагаются такие возможности, как общие проекты, каталоги моделей, групповые политики безопасности, обеспечиваются воспроизводимость и аудит. Oracle Cloud Infrastructure Data Science автоматически выбирает наиболее оптимальные обучающие наборы данных благодаря использованию AutoML для выбора и настройки алгоритма, оценки и объяснения модели.

Oracle выпустила облачную платформу Oracle Cloud Data Science Platform

Как отметили в Oracle, современные организации реализуют лишь малую часть огромного трансформирующего потенциала данных, поскольку специалисты по данным не получают простого доступа к нужным данным и не располагают инструментами для создания и развертывания эффективных моделей машинного обучения. В итоге на разработку моделей уходит слишком много времени, они не всегда соответствуют корпоративным требованиям в отношении точности и надежности и очень часто так и не запускаются в эксплуатацию.

«
«Эффективные модели машинного обучения являются основой успешных проектов в области науки о данных (Data Science), но объем и разнообразие данных, с которыми сталкиваются предприятия, могут помешать этим инициативам еще до того, как они начнут реализовываться. С помощью Oracle Cloud Infrastructure Data Science мы повышаем продуктивность отдельных специалистов по данным, автоматизируя весь их рабочий процесс, и добавляем мощную поддержку коллективной работы. Это обеспечивает реальную ценность проектов Data Science для бизнеса»,

отметил Грег Павлик, старший вице-президент Oracle по разработке продуктов обработки данных и ИИ
»

Со слов разработчика, сервис Oracle Cloud Infrastructure Data Science включает автоматизированный процесс обработки данных, экономя время и уменьшая количество ошибок, благодаря следующим возможностям:

  • AutoML, автоматический выбор алгоритмов и настройка автоматизирует процесс выполнения тестов для нескольких алгоритмов и конфигураций гиперпараметров. Система проверяет результаты на точность и подтверждает, что для использования выбраны оптимальная модель и конфигурация. Это экономит время специалистов по обработке и анализу данных и позволяет каждому из них получать те же результаты, что и самые опытные специалисты.
  • Автоматический выбор предиктивных признаков упрощает создание и отбор признаков, автоматически определяя ключевые предиктивные признаки по большим наборам данных.
  • Оценка модели генерирует полный набор метрик оценки и соответствующих визуализаций для измерения характеристик модели с новыми данными. Она позволяет ранжировать модели с течением времени, чтобы обеспечить оптимальное поведение рабочей версии. Оценка модели выходит за рамки прямой оценки характеристик. Чтобы полностью учесть различные воздействия ошибок первого и второго рода (false positive и false negative), принимается во внимание ожидаемое базовое поведение и используется модель затрат.
  • Объяснение модели: сервис Oracle Cloud Infrastructure Data Science автоматически предоставляет объяснение относительного веса и важности факторов, влияющих на формирование прогноза. Она предлагает первую коммерческую реализацию независимого от модели объяснения. Например, с помощью модели выявления мошенничества специалист по данным может объяснить, какие факторы являются основными причинами мошенничества. Это помогает компании изменить процессы или внедрить меры безопасности.

Для успешного запуска эффективных моделей машинного обучения в эксплуатацию требуются не только выделенные специалисты. Для этого нужна совместная работа специалистов по анализу и обработке данных. Согласно заявлению разработчика, сервис Oracle Cloud Infrastructure Data Science предоставляет широкие возможности для поддержки коллективной работы, в том числе:

  • Общие проекты помогают пользователям организовывать работу, осуществлять контроль версий и надежно делиться результатами, включая сеансы работы с данными и блокнотами.
  • Каталоги моделей позволяют членам группы надежно обмениваться уже построенными моделями и артефактами, необходимыми для изменения и развертывания моделей.
  • Коллективные политики безопасности дают пользователям возможность контролировать доступ к моделям, коду и данным, которые полностью интегрированы с функциями Oracle Cloud Infrastructure Identity and Access Management.
  • Функциональные возможности воспроизводимости и аудита позволяют предприятию отслеживать все соответствующие активы. Все модели можно воспроизвести и проверить, даже если члены команды покидают коллектив.

С помощью Oracle Cloud Infrastructure Data Science организации могут ускорить успешное развертывание моделей, получить для предиктивной аналитики результаты и производительность корпоративного уровня и обеспечить положительные результаты для бизнеса, считают в Oracle.Дмитрий Бородачев, DатаРу Облако: Наше преимущество — мультивендорная модель предоставления облачных услуг

Платформа Cloud Data Science Platform предлагает семь сервисов. Они объединяют комплексный опыт, улучшают и ускоряют получение результатов в проектах Data Science:

  • Oracle Cloud Infrastructure Data Science: позволяет пользователям создавать новые модели машинного обучения, обучать их и управлять ими в среде Oracle Cloud с использованием Python и других инструментов и библиотек с открытым исходным кодом, включая TensorFlow, Keras и Jupyter.
  • Возможности машинного обучения в Oracle Autonomous Database: алгоритмы машинного обучения тесно интегрированы в автономную базу данных Oracle Autonomous Database с поддержкой Python и автоматизированного машинного обучения. Предстоящая интеграция с сервисом Oracle Cloud Infrastructure Data Science позволит разработчикам создавать модели, используя как открытый код, так и масштабируемые алгоритмы в самой базе данных. Применение алгоритмов к данным в Oracle Database ускоряет получение результатов за счет сокращения времени подготовки и уменьшения потребности в перемещении данных.
  • Oracle Cloud Infrastructure Data Catalog: каталог данных помогает пользователям обнаруживать, находить, организовывать, обогащать и отслеживать активы данных в Oracle Cloud. Каталог Oracle Cloud Infrastructure Data Catalog имеет встроенный бизнес-глоссарий, позволяющий легко подбирать и находить нужные и доверенные данные.
  • Oracle Big Data Service: предлагает полную реализацию Cloudera Hadoop с существенно более простым управлением по сравнению с другими предложениями Hadoop. Например, одним щелчком мышью можно создать кластер высокой доступности или обеспечить безопасность. Oracle Big Data Service также включает в себя машинное обучение для Spark, что позволяет организациям выполнять алгоритмы машинного обучения Spark в памяти с использованием одного продукта и с минимальным перемещением данных.
  • Oracle Cloud SQL: позволяет выполнять SQL-запросы к данным в HDFS, Hive, Kafka, NoSQL и объектном хранилище. CloudSQL позволяет любому пользователю, приложению или аналитическому инструменту, которые могут взаимодействовать с базами данных Oracle, прозрачно работать с данными в других хранилищах данных, используя преимущества обработки со спуском (push-down) и горизонтальным масштабированием (scale-out) данных для минимизации их перемещения.
  • Oracle Cloud Infrastructure Data Flow: полностью управляемый сервис больших данных, позволяющий пользователям выполнять приложения Apache Spark, не создавая инфраструктуру для их развертывания или управления ими. Это дает предприятиям возможность быстрее выпускать приложения с использованием больших данных и ИИ. В отличие от конкурирующих сервисов Hadoop и Spark, сервис Oracle Cloud Infrastructure Data Flow предлагает единое окно для отслеживания всех заданий Spark, позволяющее выявлять ресурсоемкие задачи или диагностировать и устранять проблемы.
  • Oracle Cloud Infrastructure Virtual Machines for Data Science: виртуальные машины Oracle Cloud Infrastructure для Data Science – это предварительно сконфигурированные среды на базе графических процессоров с общими IDE, блокнотами и фреймворками, которые можно настроить и запустить менее чем за 15 минут за 30 долларов в день, утверждают в Oracle.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ВидеоМост (VideoMost) (1767)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (1643)
  TrueConf (Труконф) (1594)
  Террасофт (Terrasoft, ТС-Консалтинг) (1147)
  Directum (Директум) (733)
  Другие (8649)

  Elma (Элма, Интеллект Лаб, Практика БПМ) (244)
  Террасофт (Terrasoft, ТС-Консалтинг) (186)
  ВидеоМост (VideoMost) (181)
  Directum (Директум) (110)
  QuickBPM (83)
  Другие (759)

  Elma (Элма, Интеллект Лаб, Практика БПМ) (230)
  ВидеоМост (VideoMost) (101)
  Directum (Директум) (80)
  1С-Рарус (30)
  Projecto (Проджекто) (26)
  Другие (562)

  Elma (Элма, Интеллект Лаб, Практика БПМ) (179)
  Directum (Директум) (84)
  Первый Бит (23)
  Naumen (Наумен консалтинг) (22)
  Адванта Консалтинг (Advanta) (20)
  Другие (400)

  Directum (Директум) (230)
  Первый Бит (18)
  БизнесАвтоматика НПЦ (12)
  B2B-Center (Центр развития экономики) (12)
  Naumen (Наумен консалтинг) (12)
  Другие (210)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  1С Акционерное общество (35, 2831)
  ВидеоМост (VideoMost) (3, 1818)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (4, 1768)
  TrueConf (Труконф) (3, 1610)
  Creatio (12, 1238)
  Другие (1939, 7474)

  Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 327)
  Directum (Директум) (2, 233)
  Creatio (1, 200)
  ВидеоМост (VideoMost) (2, 183)
  1С Акционерное общество (13, 146)
  Другие (153, 489)

  Directum (Директум) (2, 236)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 233)
  ВидеоМост (VideoMost) (1, 102)
  1С Акционерное общество (9, 99)
  Projecto (Проджекто) (1, 26)
  Другие (94, 330)

  Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 180)
  Directum (Директум) (1, 146)
  1С Акционерное общество (12, 89)
  Naumen (Наумен консалтинг) (5, 22)
  1С-Битрикс (1, 21)
  Другие (81, 265)

  Directum (Директум) (1, 237)
  1С Акционерное общество (8, 60)
  1С-Битрикс (1, 18)
  Naumen (Наумен консалтинг) (3, 16)
  БизнесАвтоматика НПЦ (5, 12)
  Другие (66, 164)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ВидеоМост (VideoMost) ВКС - 1817
  TrueConf Server - 1594
  ELMA BPM Suite - 1431
  Directum RX - 1112
  Creatio (ранее bpm’online) - 944
  Другие 8512

  ELMA BPM Suite - 241
  Directum RX - 233
  Creatio (ранее bpm’online) - 200
  ВидеоМост (VideoMost) ВКС - 182
  1С:ERP Управление предприятием 2 - 114
  Другие 570

  Directum RX - 236
  ELMA BPM Suite - 151
  ВидеоМост (VideoMost) ВКС - 102
  ELMA365 - 83
  1С:ERP Управление предприятием 2 - 68
  Другие 362

  ELMA365 - 161
  Directum RX - 146
  1С:ERP Управление предприятием 2 - 54
  ELMA BPM Suite - 22
  1С-Битрикс24 - 21
  Другие 299

  Directum RX - 237
  1С:ERP Управление предприятием 2 - 41
  1С-Битрикс24 - 18
  B2B-Center: Мои поставщики - 12
  HRlink Система электронного кадрового документооборота - 12
  Другие 173

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  БизнесАвтоматика НПЦ (120)
  Инфосистемы Джет (13)
  Сбербанк (10)
  Marketing Logic (Маркетинг Лоджик) (9)
  Другие (640)

  Ростелеком (3)
  БизнесАвтоматика НПЦ (3)
  Сапиенс солюшнс (Sapiens solutions) (2)
  Сбербанк (2)
  IPavlov (Айпавлов) (2)
  Другие (48)

  БизнесАвтоматика НПЦ (12)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  Платформа больших данных (Platforma) (2)
  К-Скай (K-SkAI) (2)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2)
  Другие (57)

  БизнесАвтоматика НПЦ (5)
  Группа компаний ЦРТ (Центр речевых технологий) (2)
  Сбер Бизнес Софт (2)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  Другие (63)

  БизнесАвтоматика НПЦ (8)
  SL Soft (СЛ Софт) (3)
  Сбер Бизнес Софт (3)
  Авантелеком (2)
  Полиматика (Polymatica) (2)
  Другие (69)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (2, 236)
  БизнесАвтоматика НПЦ (2, 119)
  Полиматика (Polymatica) (4, 15)
  SL Soft (СЛ Софт) (3, 15)
  Oracle (12, 14)
  Другие (314, 182)

  БизнесАвтоматика НПЦ (1, 3)
  Dell EMC (1, 2)
  Полиматика (Polymatica) (1, 2)
  SL Soft (СЛ Софт) (1, 2)
  Informatica (1, 1)
  Другие (6, 6)

  БизнесАвтоматика НПЦ (1, 12)
  Сбербанк (2, 2)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (1, 2)
  К-Скай (K-SkAI) (1, 2)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  Другие (14, 16)

  БизнесАвтоматика НПЦ (1, 5)
  Сбербанк (3, 3)
  Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 2)
  Полиматика (Polymatica) (1, 2)
  Другие (16, 19)

  БизнесАвтоматика НПЦ (1, 7)
  SL Soft (СЛ Софт) (3, 4)
  Полиматика (Polymatica) (3, 4)
  Rubbles (Раблз) (1, 2)
  Retail Rocket (Ритейл Рокет) (1, 2)
  Другие (15, 15)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Deductor - 226
  Visary BI Платформа бизнес-аналитики - 119
  Polymatica Analytics Аналитическая платформа - 13
  Loginom Аналитическая платформа - 10
  IBM SPSS Decision Management - 10
  Другие 167

  Visary BI Платформа бизнес-аналитики - 3
  EMC Greenplum Data Computing Appliance - 2
  Polymatica Analytics Аналитическая платформа - 2
  Loginom Аналитическая платформа - 1
  IBM SPSS Decision Management - 1
  Другие 5

  Visary BI Платформа бизнес-аналитики - 12
  Loginom Аналитическая платформа - 2
  Platforma и HFLabs: Технология безопасного метчинга данных - 2
  Webiomed - Платформа предиктивной аналитики и управления рисками в здравоохранении на основе машинного обучения - 2
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
  Другие 11

  Visary BI Платформа бизнес-аналитики - 5
  Polymatica Analytics Аналитическая платформа - 2
  CM.Expert Data Mining платформа - 2
  ЦРТ: Speech Analytics Lab - 2
  PIX Process Management (PIX Процессы) - 2
  Другие 15

  Visary BI Платформа бизнес-аналитики - 7
  Retail Rocket: Smart Placement Ads - 2
  Rubbles Customer Insight - 2
  Polymatica Analytics Аналитическая платформа - 2
  Преферентум. Платформа анализа неструктурированной информации - 1
  Другие 9