В процессе построения отчетов сквозной аналитики для одного из клиентов, он попросил нас предоставить данные по эффективности рекламных кампаний в разрезе новых и старых пользователей.

На первый взгляд задача была простой и ее передали аккаунт — менеджерам в разработку. Ответ «это невозможно» от разработки был настолько неожиданным не только для клиента, но и для аккаунт-менеджера проекта, что его обоснование решили сохранить для потомков, то есть описать в данной статье.

Итак, как же строится отчет сквозной аналитики:
В одной таблице у нас есть данные по затратам на рекламу с параметрами source, medium, campaign, с которыми все понятно, и isNew. isNew — это как раз признак «новый ли пользователь».

В другой таблице находится выручка из CRM с теми же ключами source, medium, campaign, а также isNewCustomer, которое обозначает, является ли данная покупка первой или повторной.

Таблицы объединяются по общим ключам и получается отчет, в котором затраты сопоставляются с выручкой по срезам source, medium, campaign

С точки зрения «банальной эрудиции» мы легко можем построить отчет, в котором будут не только срезы source, medium, campaign но и isNew и isNewCustomer. Ведь «все данные у нас есть»!

Однако, как говорил мой научный руководитель, «не нужно сравнивать огурцы и подоконники». Дело в том, что isNew и isNewCustomer — это разные параметры. И объединять данные по ним не то чтобы «невозможно», а можно, но такое объединение не будет иметь смысла. Почему?

Для простоты восприятия, представьте, что у вас есть данные по продажам обуви.
В первой таблице рекламные расходы в виде таблицы с двумя колонками: «цвет» и «затраты».

Таблица 1

Цвет Затраты
красная 10 000
черная 30 000

Во второй таблице «размер» и «выручка».

Таблица 2

Размер Выручка
40 40 000
41 60 000

А теперь ответьте на вопрос, какое было соотношение расходов и доходов по цветам и размерам? Не можете? То то и оно!

Единственное, что можно рассчитать по этим данным, это совокупный ДРР:
(10 000 + 30 000) / (40 000 + 60 000) = 40%

О том, как мы решили эту проблему, узнаете в следующей серии.

Спойлер: Нужно размечать каждую пару обуви. (Тссс!)