Вадим Миженский
Руководитель управления разработки цифровых продуктов
С помощью ESB подхода к обмену данными создаем общее хранилище предприятия для быстрого подключения аналитики и отчетов.
Вы также получите
Таблицу сравнения
типов интеграций
Data Warehouse
Data Warehouse - это комплекс структурированных данных всего предприятия.
Он состоит из хранилищ разных объектов (заказов, цен, товаров, др). Структура данных определяется заранее. Ведь бизнес знает, какие системы и, как используют их для целей настоящего.
Хранилища не зависят друг от друга и могут работать на разных серверах в разных локациях. Так отказ любого из них, не повлечет проблем с остальным.
Data Warehouse позволяет легко подключить любую систему аналитики.
Данные легко фильтровать по открытым полям и искать нужные объекты.
Data Warehouse улучшает обмен данными между IT-системами:
1. Снижает нагрузку на системы;
2. Ослабляет связанность изменений систем;
3. Позволяет агрегировать и трансформировать данные, как угодно.
Подробнее об интеграциях мы рассказываем здесь.
Обмен данными и аналитика
для целей настоящего дня
Структурированные данные,
понятные любым потребителям
Обработка данных перед загрузкой
в хранилище
Data Lake
Что такое Data Lake? Разберем на простом примере системы управления заказами (OMS).
Например, система OMS хранит историю данных по статусам всех заказов. Эти данные важны для аналитики, но саму систему они только засоряют. Такой объем исторических данных лучше вынести в общее хранилище, чтобы не перегружать систему.
Невозможно учесть всех форматов использования этих данных в будущем. Сегодня нужен отчет по количеству времени, за которое заказ переходит из одного статуса в другой. Через месяц потребуется использовать данные о заказах по-другому и в другом формате.
Чтобы хранить данные для использования их в будущем создается Data Lake - озеро данных предприятия. В такое хранилище данные попадают, как есть. Когда станет понятно, для чего использовать эти данные и как, аналитики смогут приступить к обработке.
Хранение и обработка данных
для использования в будущем
Структурированные
и неструктурированные данные
Данные обрабатывает аналитик
после загрузки
Отличие DL от DWH
по цели внедрения
На практике граница между типами хранилищ условна. Все зависит от качества реализации и дальнейшего использования.
Собрать максимум данных
с целью обработки в будущем.
Собрать данные и сделать их
пригодными для потребления сразу.
Создаем
отказоустойчивые
хранилища данных
1.
При нашем подходе в архитектуре нет единой точки отказа
2.
Компоненты хранилища не зависят друг от друга и могут работать на разных серверах в разных локациях
3.
Мы создаем дубли хранилищ на нескольких серверах. Если один сервер откажет, поток данных будет перенаправлен на другой сервер
4.
Вы можете использовать, как облачные сервера, так и on-premise
Мы используем Opensource решения, поэтому наши клиенты сокращают расходы на оплату лицензий без риска ограничений со стороны законодательства разных стран.
С вами свяжутся персональные менеджеры
Email:
Telegram: