Кейс: разработчик мобильного приложения для медитации утверждает уменьшение тревоги пользователей, но низкая удерживаемость — какие экспериментальные дизайны (рандомизированное контролируемое исследование, A/B‑тестирование, длительное наблюдение) и метрики (вовлечённость, субъективное благополучие, физиология) вы бы предложили для валидации эффекта?

18 Ноя в 17:37
7 +1
0
Ответы
1
Коротко и по делу — предложу набор экспериментальных дизайнов и конкретные метрики + ключевые аналитические принципы.
Дизайны (цели и когда применять)
- Рандомизированное контролируемое исследование (RCT) — для валидации каузального эффекта на тревогу.
- Дизайн: пользователи рандомизируются в группу приложения vs активный контроль (например, учебные аудио без медитации) или ожидание.
- Длительность: основной эндпоинт через 888 недель, дополнительный — через 333 и 666 месяцев.
- Стратификация по исходной тревоге (низкая/умеренная/высокая).
- A/B‑тестирование (в продакшн) — для повышения удерживаемости/вовлечённости и оценки модификаций продукта.
- Тесты функций: напоминания, персонализация, короткие форматы, геймификация, онбординг.
- Короткие итерации (222666 недель) с метриками вовлечения как первичными.
- Использовать многорукие A/B или адаптивный (многорукий бандит) для оптимизации UX.
- Длительное наблюдение (когорта, EMA) — для экстернализации результатов и понимания долговременного эффекта в реальном мире.
- Частые эмпирические замеры состояния (EMA, раз в день/несколько раз в неделю) + пассивные данные (использование, сон, шаги).
- Полезно для изучения механизмов и медиаторов эффекта.
Ключевые метрики (что измерять и как)
- Основной клинический исход (субъективное благополучие / тревога)
- Изменение шкалы тревоги: GAD‑7 — первичный исход в RCT (например, разница в средних баллах между группами к 888 неделе).
- Минимально клинически значимое изменение: порядка ∼4\sim44 баллов (ориентировочно, уточнить по литературе).
- Вовлечённость / удержание (как KPI продукта)
- Дневная/недельная активность: DAU, WAU (фиксировать как абсолютные числа и относительные изменения).
- Ретеншн: удержание на 777 и 303030 дней, когортный анализ.
- Частота сессий, медианная длительность сессии, процент завершённых сессий.
- Коэффициенты перехода по воронке (онбординг → первая сессия → регулярность).
- Физиологические маркеры (объективные сигналы тревоги)
- HRV (например, RMSSD), частота сердечных сокращений в покое, кожно‑электрическая активность, при возможности — кортизол.
- Измерять в стандартизованных условиях (утро/перед сном или во время короткого стресс‑теста).
- EMA / моментальные оценки
- Одно- или двухвопросный VAS тревоги/настроения несколько раз в неделю для отслеживания динамики.
- Побочные/дополнительные исходы
- Сон (самооценка и/или акселерометр), депрессия (PHQ‑9), удовлетворённость приложением, побочные эффекты.
Аналитика и принципы
- Пре‑регистрация гипотез и план анализа; заранее определить первичный исход и временной пункт.
- Анализ по принципу intent‑to‑treat (ITT) + per‑protocol для чувствительности.
- Контроль за множественной проверкой (если много вторичных исходов).
- Оценка модераторов и медиаторов (кто лучше отвечает на приложение, роль вовлечённости как медиатора).
- Управление оттоком: использовать методы взвешивания/импутации при пропусках.
Пример расчёта размера выборки (эскиз)
- Формула для сравнения средних (двух групп, одинаковые дисперсии):
n=2σ2(z1−α/2+z1−β)2Δ2 n=\frac{2\sigma^2\left(z_{1-\alpha/2}+z_{1-\beta}\right)^2}{\Delta^2}
n=Δ22σ2(z1α/2 +z1β )2
где σ\sigmaσ — стандартное отклонение, Δ\DeltaΔ — ожидаемая разница.
- Пример: σ=5\sigma=5σ=5, Δ=3\Delta=3Δ=3, α=0.05\alpha=0.05α=0.05 (z1−α/2=1.96z_{1-\alpha/2}=1.96z1α/2 =1.96), мощность 0.80.80.8 (z1−β=0.84z_{1-\beta}=0.84z1β =0.84):
n=2⋅52(1.96+0.84)232=50⋅(2.8)29≈50⋅7.849≈44 на группу n=\frac{2\cdot 5^2(1.96+0.84)^2}{3^2}=\frac{50\cdot (2.8)^2}{9}\approx\frac{50\cdot 7.84}{9}\approx 44\ \text{на группу}
n=32252(1.96+0.84)2 =950(2.8)2 9507.84 44 на группу
- Учесть инфляцию из‑за оттока: при ожидаемом оттоке 40%40\%40% умножить на 11−0.4=1.67\frac{1}{1-0.4}=1.6710.41 =1.67.
Рекомендация по стратегии
- Провести RCT для доказательства эффективности на GAD‑7 (primary) с измерением физиологии у подвыборки.
- Параллельно запустить A/B‑тесты в продакшне, чтобы повысить удержание и вовлечённость; использовать результаты A/B для повышения комплаенса в последующих RCT.
- Вести длительную когорту с EMA и пассивными данными для изучения долговременных эффектов и механизмов.
Если нужно, могу предложить конкретный набор первичных/вторичных показателей, шаблон протокола RCT и список вопросов EMA.
18 Ноя в 18:51
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Поможем написать учебную работу
Прямой эфир