Бизнес-аналитики готовят документ со спецификацией бизнес-требований. После сбора требований выполняется моделирование данных определяются измерения, факты и их комбинации.
Этот этап в большей степени посвящен определению бизнес-потребностей и их размещению в хранилище данных.
Моделирование данных — это процесс визуализации распределения данных и проектирования баз данных путем выполнения требований по преобразованию данных в формат, подходящий для хранения в хранилище данных.
Моделирование данных помогает организовать данные, создает связи между наборами данных и полезно для обеспечения соответствия данных требованиям и их безопасности в соответствии с целями хранилища.
Моделирование данных обычно происходит на уровне витрин данных и далее опускается до слоев хранилища данных.
Витрины данных — это либо плоские таблицы, либо многомерные кубы, ориентированное на определённое направление бизнеса, отдел, предметную область или команду клиента. В некоторых случаях каждый отдел или подразделение может считаться владельцем своей витрины данных, включая всё оборудование, программное обеспечение и данные. Это позволяет каждому отделу изолировать использование своих данных. В других случаях, где используются согласованные между отделами измерения, витрины используется на уровне всей компании.
На этом этапе происходит работа с запросами пользователей, оптимизация процессов, реализация изменений в форматах данных, интеграционных потоков, дашбордах, добавление новых пользователей, масштабирование платформы при подклчюении дополнительных источников и прочее.
OLTP - транзакционные системы управления базами данных (СУБД)
Интеграция и ETL
Преобразования данных
Стриминговая аналитика
OLAP - аналитическая обработка он-лайн, многомерные кубы данных