Коротко и по делу — предложу набор экспериментальных дизайнов и конкретные метрики + ключевые аналитические принципы. Дизайны (цели и когда применять) - Рандомизированное контролируемое исследование (RCT) — для валидации каузального эффекта на тревогу. - Дизайн: пользователи рандомизируются в группу приложения vs активный контроль (например, учебные аудио без медитации) или ожидание. - Длительность: основной эндпоинт через 888 недель, дополнительный — через 333 и 666 месяцев. - Стратификация по исходной тревоге (низкая/умеренная/высокая). - A/B‑тестирование (в продакшн) — для повышения удерживаемости/вовлечённости и оценки модификаций продукта. - Тесты функций: напоминания, персонализация, короткие форматы, геймификация, онбординг. - Короткие итерации (222–666 недель) с метриками вовлечения как первичными. - Использовать многорукие A/B или адаптивный (многорукий бандит) для оптимизации UX. - Длительное наблюдение (когорта, EMA) — для экстернализации результатов и понимания долговременного эффекта в реальном мире. - Частые эмпирические замеры состояния (EMA, раз в день/несколько раз в неделю) + пассивные данные (использование, сон, шаги). - Полезно для изучения механизмов и медиаторов эффекта. Ключевые метрики (что измерять и как) - Основной клинический исход (субъективное благополучие / тревога) - Изменение шкалы тревоги: GAD‑7 — первичный исход в RCT (например, разница в средних баллах между группами к 888 неделе). - Минимально клинически значимое изменение: порядка ∼4\sim4∼4 баллов (ориентировочно, уточнить по литературе). - Вовлечённость / удержание (как KPI продукта) - Дневная/недельная активность: DAU, WAU (фиксировать как абсолютные числа и относительные изменения). - Ретеншн: удержание на 777 и 303030 дней, когортный анализ. - Частота сессий, медианная длительность сессии, процент завершённых сессий. - Коэффициенты перехода по воронке (онбординг → первая сессия → регулярность). - Физиологические маркеры (объективные сигналы тревоги) - HRV (например, RMSSD), частота сердечных сокращений в покое, кожно‑электрическая активность, при возможности — кортизол. - Измерять в стандартизованных условиях (утро/перед сном или во время короткого стресс‑теста). - EMA / моментальные оценки - Одно- или двухвопросный VAS тревоги/настроения несколько раз в неделю для отслеживания динамики. - Побочные/дополнительные исходы - Сон (самооценка и/или акселерометр), депрессия (PHQ‑9), удовлетворённость приложением, побочные эффекты. Аналитика и принципы - Пре‑регистрация гипотез и план анализа; заранее определить первичный исход и временной пункт. - Анализ по принципу intent‑to‑treat (ITT) + per‑protocol для чувствительности. - Контроль за множественной проверкой (если много вторичных исходов). - Оценка модераторов и медиаторов (кто лучше отвечает на приложение, роль вовлечённости как медиатора). - Управление оттоком: использовать методы взвешивания/импутации при пропусках. Пример расчёта размера выборки (эскиз) - Формула для сравнения средних (двух групп, одинаковые дисперсии): n=2σ2(z1−α/2+z1−β)2Δ2
n=\frac{2\sigma^2\left(z_{1-\alpha/2}+z_{1-\beta}\right)^2}{\Delta^2} n=Δ22σ2(z1−α/2+z1−β)2
где σ\sigmaσ — стандартное отклонение, Δ\DeltaΔ — ожидаемая разница. - Пример: σ=5\sigma=5σ=5, Δ=3\Delta=3Δ=3, α=0.05\alpha=0.05α=0.05 (z1−α/2=1.96z_{1-\alpha/2}=1.96z1−α/2=1.96), мощность 0.80.80.8 (z1−β=0.84z_{1-\beta}=0.84z1−β=0.84): n=2⋅52(1.96+0.84)232=50⋅(2.8)29≈50⋅7.849≈44 на группу
n=\frac{2\cdot 5^2(1.96+0.84)^2}{3^2}=\frac{50\cdot (2.8)^2}{9}\approx\frac{50\cdot 7.84}{9}\approx 44\ \text{на группу} n=322⋅52(1.96+0.84)2=950⋅(2.8)2≈950⋅7.84≈44нагруппу
- Учесть инфляцию из‑за оттока: при ожидаемом оттоке 40%40\%40% умножить на 11−0.4=1.67\frac{1}{1-0.4}=1.671−0.41=1.67. Рекомендация по стратегии - Провести RCT для доказательства эффективности на GAD‑7 (primary) с измерением физиологии у подвыборки. - Параллельно запустить A/B‑тесты в продакшне, чтобы повысить удержание и вовлечённость; использовать результаты A/B для повышения комплаенса в последующих RCT. - Вести длительную когорту с EMA и пассивными данными для изучения долговременных эффектов и механизмов. Если нужно, могу предложить конкретный набор первичных/вторичных показателей, шаблон протокола RCT и список вопросов EMA.
Дизайны (цели и когда применять)
- Рандомизированное контролируемое исследование (RCT) — для валидации каузального эффекта на тревогу.
- Дизайн: пользователи рандомизируются в группу приложения vs активный контроль (например, учебные аудио без медитации) или ожидание.
- Длительность: основной эндпоинт через 888 недель, дополнительный — через 333 и 666 месяцев.
- Стратификация по исходной тревоге (низкая/умеренная/высокая).
- A/B‑тестирование (в продакшн) — для повышения удерживаемости/вовлечённости и оценки модификаций продукта.
- Тесты функций: напоминания, персонализация, короткие форматы, геймификация, онбординг.
- Короткие итерации (222–666 недель) с метриками вовлечения как первичными.
- Использовать многорукие A/B или адаптивный (многорукий бандит) для оптимизации UX.
- Длительное наблюдение (когорта, EMA) — для экстернализации результатов и понимания долговременного эффекта в реальном мире.
- Частые эмпирические замеры состояния (EMA, раз в день/несколько раз в неделю) + пассивные данные (использование, сон, шаги).
- Полезно для изучения механизмов и медиаторов эффекта.
Ключевые метрики (что измерять и как)
- Основной клинический исход (субъективное благополучие / тревога)
- Изменение шкалы тревоги: GAD‑7 — первичный исход в RCT (например, разница в средних баллах между группами к 888 неделе).
- Минимально клинически значимое изменение: порядка ∼4\sim4∼4 баллов (ориентировочно, уточнить по литературе).
- Вовлечённость / удержание (как KPI продукта)
- Дневная/недельная активность: DAU, WAU (фиксировать как абсолютные числа и относительные изменения).
- Ретеншн: удержание на 777 и 303030 дней, когортный анализ.
- Частота сессий, медианная длительность сессии, процент завершённых сессий.
- Коэффициенты перехода по воронке (онбординг → первая сессия → регулярность).
- Физиологические маркеры (объективные сигналы тревоги)
- HRV (например, RMSSD), частота сердечных сокращений в покое, кожно‑электрическая активность, при возможности — кортизол.
- Измерять в стандартизованных условиях (утро/перед сном или во время короткого стресс‑теста).
- EMA / моментальные оценки
- Одно- или двухвопросный VAS тревоги/настроения несколько раз в неделю для отслеживания динамики.
- Побочные/дополнительные исходы
- Сон (самооценка и/или акселерометр), депрессия (PHQ‑9), удовлетворённость приложением, побочные эффекты.
Аналитика и принципы
- Пре‑регистрация гипотез и план анализа; заранее определить первичный исход и временной пункт.
- Анализ по принципу intent‑to‑treat (ITT) + per‑protocol для чувствительности.
- Контроль за множественной проверкой (если много вторичных исходов).
- Оценка модераторов и медиаторов (кто лучше отвечает на приложение, роль вовлечённости как медиатора).
- Управление оттоком: использовать методы взвешивания/импутации при пропусках.
Пример расчёта размера выборки (эскиз)
- Формула для сравнения средних (двух групп, одинаковые дисперсии):
n=2σ2(z1−α/2+z1−β)2Δ2 n=\frac{2\sigma^2\left(z_{1-\alpha/2}+z_{1-\beta}\right)^2}{\Delta^2}
n=Δ22σ2(z1−α/2 +z1−β )2 где σ\sigmaσ — стандартное отклонение, Δ\DeltaΔ — ожидаемая разница.
- Пример: σ=5\sigma=5σ=5, Δ=3\Delta=3Δ=3, α=0.05\alpha=0.05α=0.05 (z1−α/2=1.96z_{1-\alpha/2}=1.96z1−α/2 =1.96), мощность 0.80.80.8 (z1−β=0.84z_{1-\beta}=0.84z1−β =0.84):
n=2⋅52(1.96+0.84)232=50⋅(2.8)29≈50⋅7.849≈44 на группу n=\frac{2\cdot 5^2(1.96+0.84)^2}{3^2}=\frac{50\cdot (2.8)^2}{9}\approx\frac{50\cdot 7.84}{9}\approx 44\ \text{на группу}
n=322⋅52(1.96+0.84)2 =950⋅(2.8)2 ≈950⋅7.84 ≈44 на группу - Учесть инфляцию из‑за оттока: при ожидаемом оттоке 40%40\%40% умножить на 11−0.4=1.67\frac{1}{1-0.4}=1.671−0.41 =1.67.
Рекомендация по стратегии
- Провести RCT для доказательства эффективности на GAD‑7 (primary) с измерением физиологии у подвыборки.
- Параллельно запустить A/B‑тесты в продакшне, чтобы повысить удержание и вовлечённость; использовать результаты A/B для повышения комплаенса в последующих RCT.
- Вести длительную когорту с EMA и пассивными данными для изучения долговременных эффектов и механизмов.
Если нужно, могу предложить конкретный набор первичных/вторичных показателей, шаблон протокола RCT и список вопросов EMA.