Проект

«Самолет» использует концепцию LakeHouse для управления данными

Заказчики: Самолет Группа компаний

Москва; Строительство и промышленность строительных материалов

Продукт: Проекты на базе технологий Big Data

Дата проекта: 2024/02 — 2024/08
Технология: BI
подрядчики - 452
проекты - 3080
системы - 1154
вендоры - 561
Технология: Big Data
подрядчики - 226
проекты - 642
системы - 241
вендоры - 195
Технология: Data Mining
подрядчики - 254
проекты - 862
системы - 296
вендоры - 212

2024: Создание аналитической платформы данных на базе концепции LakeHouse

Группа «Самолет» построила аналитическую платформу для работы с данными на базе концепции LakeHouse, последнего поколения архитектур, которое предполагает гибридную модель данных и объединяет достоинства классических DWH с гибкостью Data Lake. Данное решение реализовано в 2024 году, оно полностью построено на стеке open source и позволяет компании применять самый современный подход к работе с Big Data. Об этом компания сообщила 19 сентября 2024 года.

Данная концепция дает возможность более оперативно обрабатывать данные по сравнению с другими технологиями, экономя время на дополнительных циклах загрузки. Архитектура и подходы концепции LakeHouse расширяют традиционную аналитику данных, совмещая гибкость Data Lake с четкой структурой хранилищ. Это позволяет оптимизировать конвейеры захвата и передачи данных, и в рамках единой аналитической платформы обслуживать как запросы к готовым витринам, так и возможность работать напрямую с очищенными качественными данными в Data Lake. На сентября 2024 года в контур аналитической платформы подключено более 120 мастер-систем и источников данных, LakeHouse включает более 10 тысяч объектов с реализацией 300 широких витрин в ClickHouse.

«
«Самолет» заинтересован в монетизации данных и эффективно применяет концепцию LakeHouse для обеспечения data-driven подхода и внедрения на практике data value chain. Значимым техническим плюсом этой концепции считается изоляция хранения от вычислений по разным кластерам, что облегчает масштабирование. Немаловажным аспектом для «Самолета» также является возможность обрабатывать многообразие различных типов данных, включая изображения, видео, аудио, JSON-структуры и текст. Архитектура LakeHouse разрешает поддерживать различные рабочие нагрузки: от алгоритмов машинного обучения до SQL-запросов и распределенных вычислений. Они требуют разных технологий реализации, но все полагаются на один единый репозиторий, что позволяет нам обеспечивать единую версию правды данных. Таким образом, концепция LakeHouse отлично коррелирует с идеями цифровой трансформации и находит эффективное применение в «Самолете», – отметила директор по данным группы «Самолет» Ольга Свитнева.
»

«Самолет» ежедневно работает с большими массивами данных различных типов. Специфика строительной отрасли изначально предполагает обработку большого потока информации: финансовая отчетность по нескольким десяткам юридических лиц, заказы клиентов с дополнительными функциями, продажи, прогноз и оценка рисков и пр.

Использование Big Data предоставляет возможность осуществлять эффективную аналитику данных, применять современные подходы в промышленной эксплуатации, что в свою очередь позволяет строить прогнозы, своевременно менять стратегии продвижения, повышать уровень обслуживания клиентов и качество оказываемых компанией услуг.