Как оценивать и сравнивать эффективность рекламных каналов при омниканальной (omnichannel) стратегии: какие модели атрибуции подходят для сложных покупательских путей и почему
Ключевая идея: атрибуция распределяет кредит за конверсию между точками контакта, но корректная оценка эффективности каналов в омниканале требует сочетания моделей атрибуции и каузального тестирования (lift/holdout, geo‑tests). Ниже — кратко о моделях, когда их применять и почему. 1) Простые правилные модели (быстро, но неточный результат) - Last‑click / First‑click: весь кредит у последнего/первого касания. Применение: быстрый отчёт, плохо отражает мультиканальные пути. - Linear: каждому касанию равный вес: wi=1nw_i=\frac{1}{n}wi=n1 для пути длины nnn. Применение: когда нет причин выделять первые/последние касания. - Time‑decay: более поздним касаниям дают больший вес: wi∝e−λtiw_i \propto e^{-\lambda t_i}wi∝e−λti, нормализуются так, чтобы ∑wi=1\sum w_i=1∑wi=1. Подходит при явном эффекте «недавних» касаний. 2) Правила «позиции» (U‑shaped) - Position‑based (например U‑shaped): часть веса β\betaβ у первого и последнего, остальное равномерно между средними: первый/последний =β=\beta=β, средние =1−2βn−2=\frac{1-2\beta}{n-2}=n−21−2β. Хороша когда ценится и узнаваемость, и завершающие касания. 3) Data‑driven / алгоритмические модели (лучше для сложных путей) - Shapley value (игровая теория) — справедливое распределение вклада при взаимодействии каналов: ϕi=∑S⊆N∖{i}∣S∣!(∣N∣−∣S∣−1)!∣N∣!(v(S∪{i})−v(S)).
\phi_i=\sum_{S\subseteq N\setminus\{i\}}\frac{|S|!(|N|-|S|-1)!}{|N|!}\big(v(S\cup\{i\})-v(S)\big). ϕi=S⊆N∖{i}∑∣N∣!∣S∣!(∣N∣−∣S∣−1)!(v(S∪{i})−v(S)).
Плюсы: учитывает взаимодействия, симметричен и справедлив. Минусы: вычислительно дорого (решается Монте‑Карло аппроксимацией). - Markov chain / removal‑effect: строится матрица переходов между состояниями (каналами) и вычисляется вклад как падение вероятности конверсии при удалении состояния; для подпроцессов используется фундаментальная матрица N=(I−Q)−1N=(I-Q)^{-1}N=(I−Q)−1. Плюсы: даёт интерпретируемый вклад по путям и учитывает порядок касаний. - Causal ML / Uplift (incrementality attributor): обучает модель причинного эффекта (treatment vs control) на уровне пользователя/сессии. Требует экспериментов или хороших инструментов синтетического контроля. 4) Маркетинговые модели уровня отрасли - Marketing Mix Modeling (MMM) — агрегированная регрессия/временные ряды для оценки краткосрочного и долгосрочного воздействия каналов (особенно офлайн + ТВ). Хорош для каналов без user‑level данных. Не даёт детальной пользовательской атрибуции, но даёт причинные оценки и кривые отдачи. 5) Эксперименты и инкрементальность (обязательно) - Holdouts / A/B / geo‑tests: прямой способ измерить причинный прирост трафика/продаж. Рекомендуется сочетать с MTA/MMM для валидации и калибровки. 6) Практическая рекомендация для омниканальной стратегии - Сочетайте методы: используйте MTA (Shapley/Markov) для user‑level цифровых путей и MMM для офлайн/агрегации. Калибруйте/верифицируйте результаты экспериментами (holdout/geo). - Шаги: 1. Стабильный data‑layer: унификация идентификаторов, сквозная привязка онлайн↔оффлайн. 2. Анализ путей: длина, частые последовательности, lag между касаниями. 3. Выбор модели: если короткие цифровые пути — Markov/Shapley; если много длинных кросс‑каналов и офлайн — комбинируйте MTA с MMM. 4. Валидируйте через эксперименты/holdouts. 5. Обновляйте часто и учитывайте кривые отдачи и сезонность. 7) Ограничения и нюансы - Атрибуция ≠ каузальность: только эксперименты дают чистый lift. - Данные: кросс‑девайсный фьюжн и отслеживание офлайн критичны. - Выбор модели зависит от целей: оптимизация ROAS в краткосрочной кампании vs долгосрочная инвестиционная стратегия требуют разных подходов. Краткий вывод: для сложных омниканальных путей предпочтительны data‑driven методы (Shapley, Markov, causal ML) в сочетании с MMM для офлайн и с обязательными экспериментами (holdout/geo) для проверки инкрементальности.
1) Простые правилные модели (быстро, но неточный результат)
- Last‑click / First‑click: весь кредит у последнего/первого касания. Применение: быстрый отчёт, плохо отражает мультиканальные пути.
- Linear: каждому касанию равный вес: wi=1nw_i=\frac{1}{n}wi =n1 для пути длины nnn. Применение: когда нет причин выделять первые/последние касания.
- Time‑decay: более поздним касаниям дают больший вес: wi∝e−λtiw_i \propto e^{-\lambda t_i}wi ∝e−λti , нормализуются так, чтобы ∑wi=1\sum w_i=1∑wi =1. Подходит при явном эффекте «недавних» касаний.
2) Правила «позиции» (U‑shaped)
- Position‑based (например U‑shaped): часть веса β\betaβ у первого и последнего, остальное равномерно между средними: первый/последний =β=\beta=β, средние =1−2βn−2=\frac{1-2\beta}{n-2}=n−21−2β . Хороша когда ценится и узнаваемость, и завершающие касания.
3) Data‑driven / алгоритмические модели (лучше для сложных путей)
- Shapley value (игровая теория) — справедливое распределение вклада при взаимодействии каналов:
ϕi=∑S⊆N∖{i}∣S∣!(∣N∣−∣S∣−1)!∣N∣!(v(S∪{i})−v(S)). \phi_i=\sum_{S\subseteq N\setminus\{i\}}\frac{|S|!(|N|-|S|-1)!}{|N|!}\big(v(S\cup\{i\})-v(S)\big).
ϕi =S⊆N∖{i}∑ ∣N∣!∣S∣!(∣N∣−∣S∣−1)! (v(S∪{i})−v(S)). Плюсы: учитывает взаимодействия, симметричен и справедлив. Минусы: вычислительно дорого (решается Монте‑Карло аппроксимацией).
- Markov chain / removal‑effect: строится матрица переходов между состояниями (каналами) и вычисляется вклад как падение вероятности конверсии при удалении состояния; для подпроцессов используется фундаментальная матрица N=(I−Q)−1N=(I-Q)^{-1}N=(I−Q)−1. Плюсы: даёт интерпретируемый вклад по путям и учитывает порядок касаний.
- Causal ML / Uplift (incrementality attributor): обучает модель причинного эффекта (treatment vs control) на уровне пользователя/сессии. Требует экспериментов или хороших инструментов синтетического контроля.
4) Маркетинговые модели уровня отрасли
- Marketing Mix Modeling (MMM) — агрегированная регрессия/временные ряды для оценки краткосрочного и долгосрочного воздействия каналов (особенно офлайн + ТВ). Хорош для каналов без user‑level данных. Не даёт детальной пользовательской атрибуции, но даёт причинные оценки и кривые отдачи.
5) Эксперименты и инкрементальность (обязательно)
- Holdouts / A/B / geo‑tests: прямой способ измерить причинный прирост трафика/продаж. Рекомендуется сочетать с MTA/MMM для валидации и калибровки.
6) Практическая рекомендация для омниканальной стратегии
- Сочетайте методы: используйте MTA (Shapley/Markov) для user‑level цифровых путей и MMM для офлайн/агрегации. Калибруйте/верифицируйте результаты экспериментами (holdout/geo).
- Шаги:
1. Стабильный data‑layer: унификация идентификаторов, сквозная привязка онлайн↔оффлайн.
2. Анализ путей: длина, частые последовательности, lag между касаниями.
3. Выбор модели: если короткие цифровые пути — Markov/Shapley; если много длинных кросс‑каналов и офлайн — комбинируйте MTA с MMM.
4. Валидируйте через эксперименты/holdouts.
5. Обновляйте часто и учитывайте кривые отдачи и сезонность.
7) Ограничения и нюансы
- Атрибуция ≠ каузальность: только эксперименты дают чистый lift.
- Данные: кросс‑девайсный фьюжн и отслеживание офлайн критичны.
- Выбор модели зависит от целей: оптимизация ROAS в краткосрочной кампании vs долгосрочная инвестиционная стратегия требуют разных подходов.
Краткий вывод: для сложных омниканальных путей предпочтительны data‑driven методы (Shapley, Markov, causal ML) в сочетании с MMM для офлайн и с обязательными экспериментами (holdout/geo) для проверки инкрементальности.