Имя клиента раскрыть не можем — подписали NDA и держим слово. Это федеральная розничная сеть, входящая в топ‑5 по выручке в своей товарной категории.
Когда никто в компании не может ответить на вопрос «Какова выручка за прошлый квартал?» без трёх часов сведения таблиц — это не проблема людей. Это проблема архитектуры.

Четыре системы, четыре источника «правды». Финансовый директор каждый понедельник получал три разных версии одного и того же отчёта. Какой верить — не знал никто.
Категорийные менеджеры планировали пополнение запасов опираясь на данные, которые отставали от реальности на несколько недель. В высокий сезон это означало пустые полки при переполненном складе.
Один аналитик на отдел — единственный человек, который умел сводить данные из всех систем. Его болезнь или отпуск останавливал регулярную отчётность.
Мы не стали переделывать операционные системы клиента — это нереалистично и не нужно. SAP, ERP и 1С пусть делают то, для чего предназначены. Наша задача — забрать из них данные, привести к единому формату и положить в хранилище, из которого удобно строить аналитику.
ClickHouse как ядро Data Warehouse: колончатое хранение, векторные операции, агрегации по миллиардам строк за доли секунды. Apache Airflow как оркестратор пайплайнов. dbt для трансформаций с версионированием и тестами качества.
Сверху — Apache Superset с ролевым доступом. CEO видит одно, региональный директор — только свои регионы, категорийный менеджер — только свои категории.


Данные в реальном времени позволили категорийным менеджерам реагировать на изменения спроса немедленно, а не по итогам периода.
Впервые увидели ROI по каждому каналу с точностью до категории товаров. Перераспределили бюджет туда, где он реально работает.
Аналитик перестал заниматься сборкой данных и начал заниматься анализом — тем, ради чего его нанимали.
Если у вас больше одного источника данных и аналитика занимает дни — это решаемо. Без NDA готовы рассказать подробнее.