Разработайте план полевого эксперимента (рандомизированного контроля) для оценки, что эффективнее снижает потребление сладких напитков у подростков — налог на напитки, информационная кампания или "nudges" (изменение расположения товаров) — какие показатели, выборка и статистические методы вы используете
Краткий план рандомизированного полевого эксперимента для сравнения налогa, информационной кампании и nudges. Цели и основные показатели - Первичный показатель: среднее потребление сладких напитков (SSB) в мл/день — используйте комбинированную метрику: самодекларированная 24‑часовая шкала + объективные данные продаж (школьные буфеты / карты лояльности). Обозначение: YYY (мл/день). - Вторичные: доля подростков, потребляющих ≥1 порцию/день; средние покупки SSB в штуках/неделю; общий энергопотребление (ккал); индекс массы тела (BMI). - Процессные: осведомлённость о рисках, знание цен, восприятие доступности. Дизайн и вмешательства - Рандомизация по кластерам (школы/районы) — чтобы избежать спиллов между учащимися внутри школы. - Четыре рандомизированные группы: контроль, налог (имитация ценового повышения в точках продаж), информационная кампания, nudges (перестановка/видимость товаров, визуальные подсказки). - Налог: у участников в кластере повышаются цены на SSB в школьных точках продаж на фиксированную величину (реальная или с помощью талонов/скидок). - Информационная кампания: плакаты, уроки, соцсети, раздаточные материалы, целевые сообщения родителям. - Nudges: SSB перемещаются в менее заметные зоны, вода и несладкие напитки вынесены на уровень глаз, метки здоровья. - Продолжительность вмешательств: минимум 666 месяцев (основной контроль на 666 мес), дополнительный сбор на 121212 мес для оценки устойчивости. Выборка и размер эффекта - Кластерный дизайн: кластер — школа; средний размер кластера nnn = 505050 учащихся. - Параметры для расчёта мощности: уровень значимости α=0.05\alpha = 0.05α=0.05, мощность 1−β=0.81-\beta = 0.81−β=0.8. Ожидаемая дисперсия потребления: σ=250\sigma = 250σ=250 (мл), минимально заметное отличие (MDE) δ=60\delta = 60δ=60 (мл). - Формула для индивидуального расчёта (двухсторонний тест между двумя группами): N=2(z1−α/2+z1−β)2σ2δ2,
N = \frac{2(z_{1-\alpha/2}+z_{1-\beta})^2\sigma^2}{\delta^2}, N=δ22(z1−α/2+z1−β)2σ2,
где z1−α/2=1.96, z1−β=0.84z_{1-\alpha/2}=1.96,\ z_{1-\beta}=0.84z1−α/2=1.96,z1−β=0.84. Подставляя: N≈2(1.96+0.84)2⋅2502602≈273 (индивидуумов на группу при индивидуальной рандомизации).
N \approx \frac{2(1.96+0.84)^2\cdot 250^2}{60^2} \approx 273\ \text{(индивидуумов на группу при индивидуальной рандомизации)}. N≈6022(1.96+0.84)2⋅2502≈273(индивидуумовнагруппуприиндивидуальнойрандомизации).
- Учет кластеризации: дизайн‑эффект DE=1+(n−1)ρ,
DE = 1 + (n-1)\rho, DE=1+(n−1)ρ,
где межклассовая корреляция ρ\rhoρ предположительно 0.020.020.02. Тогда при n=50n=50n=50: DE≈1+49⋅0.02≈1.98.
DE \approx 1 + 49\cdot 0.02 \approx 1.98. DE≈1+49⋅0.02≈1.98.
Скорректированная требуемая N на группу: Nadj≈DE⋅N≈1.98⋅273≈540.
N_{adj} \approx DE\cdot N \approx 1.98\cdot 273 \approx 540. Nadj≈DE⋅N≈1.98⋅273≈540.
Число кластеров на группу: m=Nadjn≈54050≈11 школ на группу.
m = \frac{N_{adj}}{n} \approx \frac{540}{50} \approx 11\ \text{школ на группу}. m=nNadj≈50540≈11школнагруппу.
- Для 444 групп (контроль + 333 вмешательства) потребуется примерно 4⋅11=444\cdot 11 = 444⋅11=44 школ и суммарно ≈2160\approx 2160≈2160 учащихся. Рандомизация и стратификация - Блочная/стратифицированная рандомизация по базовому уровню потребления SSB и город/село, чтобы балансировать средние по группам. - Реестр рандомизации и предрегистрация протокола. Сбор данных - Базовые измерения до вмешательства, затем на 333, 666 (основной исход) и 121212 мес. - Инструменты: 24‑часовые опросники и недельные журналы потребления; данные продаж на точках продаж; антропометрия; короткие тесты знаний/отношений. - Мониторинг реализации вмешательств (fidelity): замеры цен, фотографирование выкладки, отчёты кампании. Аналитические методы - Основной анализ — Intention‑to‑Treat (ITT): оценить среднее отличие конечного YYY между присвоенными группами. - Регрессионная модель (ANCOVA) для повышения мощности: Yi1=α+∑kβkTik+γYi0+Xi′δ+uc(i)+εi,
Y_{i1} = \alpha + \sum_{k}\beta_k T_{ik} + \gamma Y_{i0} + X_i'\delta + u_{c(i)} + \varepsilon_i, Yi1=α+k∑βkTik+γYi0+Xi′δ+uc(i)+εi,
где TikT_{ik}Tik — индикаторы вмешательств (k=k=k= налог, инфо, nudges), Yi0Y_{i0}Yi0 — базовый уровень, XiX_iXi — ковариаты, uc(i)u_{c(i)}uc(i) — эффект кластера (фиксированный или случайный). - Стандартные ошибки кластерно‑робастные по школе; при небольшом числа кластеров используйте wild cluster bootstrap или рандомизационную инференцию. - Пер‑протокольный и комплайнс‑анализ: IV (инструмент — присвоение к вмешательству) для оценки эффекта на комpliers (LATE): Первая стадия: Di=πZi+...D_i = \pi Z_i + ...Di=πZi+..., вторая стадия: Yi=α+βD^i+...Y_i = \alpha + \beta \hat D_i + ...Yi=α+βD^i+.... - Коррекция множественных сравнений: предопределённый главный контраст (каждое вмешательство vs контроль) и корректировка для вторичных тестов (Holm-Bonferroni или Romano‑Wolf). - Анализы гетерогенности по полу, исходному потреблению, SES — предварительно оговорены. - Обработка пропусков: предположительно MAR — множественная импутация; чувствительность по граду MAR/MNAR. Спилловеры и внешние влияния - Расположите кластеры так, чтобы минимизировать контакт между группами; измеряйте внешнее воздействие (всплывающие покупки вне школы). - Анализ сетевых/пространственных спиллов — включить переменные дистанции или использовать модель авторегрессии, если необходимо. Прочее - Пре‑регистрация анализа и плана промежуточных анализов. - Этические соображения: согласие родителей/участников, минимизация вреда, компенсации за участие. - Оцените стоимость/эффективность: соберите данные о стоимости внедрения каждого вмешательства и рассчитайте стоимость на единицу сокращённого потребления. Короткий итог - Рекомендуемый дизайн: кластерный RCT по школам, 444 группы (контроль + налог + инфо + nudges), примерно 444444 школ и ≈2160 \approx 2160≈2160 учащихся для MDE δ=60\delta=60δ=60 мл/день при указанных предположениях. Анализ — ITT, ANCOVA с кластерно‑робастными стандартными ошибками, IV для комплаенса, корректировка множественных тестов и предрегистрация.
Цели и основные показатели
- Первичный показатель: среднее потребление сладких напитков (SSB) в мл/день — используйте комбинированную метрику: самодекларированная 24‑часовая шкала + объективные данные продаж (школьные буфеты / карты лояльности). Обозначение: YYY (мл/день).
- Вторичные: доля подростков, потребляющих ≥1 порцию/день; средние покупки SSB в штуках/неделю; общий энергопотребление (ккал); индекс массы тела (BMI).
- Процессные: осведомлённость о рисках, знание цен, восприятие доступности.
Дизайн и вмешательства
- Рандомизация по кластерам (школы/районы) — чтобы избежать спиллов между учащимися внутри школы.
- Четыре рандомизированные группы: контроль, налог (имитация ценового повышения в точках продаж), информационная кампания, nudges (перестановка/видимость товаров, визуальные подсказки).
- Налог: у участников в кластере повышаются цены на SSB в школьных точках продаж на фиксированную величину (реальная или с помощью талонов/скидок).
- Информационная кампания: плакаты, уроки, соцсети, раздаточные материалы, целевые сообщения родителям.
- Nudges: SSB перемещаются в менее заметные зоны, вода и несладкие напитки вынесены на уровень глаз, метки здоровья.
- Продолжительность вмешательств: минимум 666 месяцев (основной контроль на 666 мес), дополнительный сбор на 121212 мес для оценки устойчивости.
Выборка и размер эффекта
- Кластерный дизайн: кластер — школа; средний размер кластера nnn = 505050 учащихся.
- Параметры для расчёта мощности: уровень значимости α=0.05\alpha = 0.05α=0.05, мощность 1−β=0.81-\beta = 0.81−β=0.8. Ожидаемая дисперсия потребления: σ=250\sigma = 250σ=250 (мл), минимально заметное отличие (MDE) δ=60\delta = 60δ=60 (мл).
- Формула для индивидуального расчёта (двухсторонний тест между двумя группами):
N=2(z1−α/2+z1−β)2σ2δ2, N = \frac{2(z_{1-\alpha/2}+z_{1-\beta})^2\sigma^2}{\delta^2},
N=δ22(z1−α/2 +z1−β )2σ2 , где z1−α/2=1.96, z1−β=0.84z_{1-\alpha/2}=1.96,\ z_{1-\beta}=0.84z1−α/2 =1.96, z1−β =0.84.
Подставляя:
N≈2(1.96+0.84)2⋅2502602≈273 (индивидуумов на группу при индивидуальной рандомизации). N \approx \frac{2(1.96+0.84)^2\cdot 250^2}{60^2} \approx 273\ \text{(индивидуумов на группу при индивидуальной рандомизации)}.
N≈6022(1.96+0.84)2⋅2502 ≈273 (индивидуумов на группу при индивидуальной рандомизации). - Учет кластеризации: дизайн‑эффект
DE=1+(n−1)ρ, DE = 1 + (n-1)\rho,
DE=1+(n−1)ρ, где межклассовая корреляция ρ\rhoρ предположительно 0.020.020.02. Тогда при n=50n=50n=50:
DE≈1+49⋅0.02≈1.98. DE \approx 1 + 49\cdot 0.02 \approx 1.98.
DE≈1+49⋅0.02≈1.98. Скорректированная требуемая N на группу:
Nadj≈DE⋅N≈1.98⋅273≈540. N_{adj} \approx DE\cdot N \approx 1.98\cdot 273 \approx 540.
Nadj ≈DE⋅N≈1.98⋅273≈540. Число кластеров на группу:
m=Nadjn≈54050≈11 школ на группу. m = \frac{N_{adj}}{n} \approx \frac{540}{50} \approx 11\ \text{школ на группу}.
m=nNadj ≈50540 ≈11 школ на группу. - Для 444 групп (контроль + 333 вмешательства) потребуется примерно 4⋅11=444\cdot 11 = 444⋅11=44 школ и суммарно ≈2160\approx 2160≈2160 учащихся.
Рандомизация и стратификация
- Блочная/стратифицированная рандомизация по базовому уровню потребления SSB и город/село, чтобы балансировать средние по группам.
- Реестр рандомизации и предрегистрация протокола.
Сбор данных
- Базовые измерения до вмешательства, затем на 333, 666 (основной исход) и 121212 мес.
- Инструменты: 24‑часовые опросники и недельные журналы потребления; данные продаж на точках продаж; антропометрия; короткие тесты знаний/отношений.
- Мониторинг реализации вмешательств (fidelity): замеры цен, фотографирование выкладки, отчёты кампании.
Аналитические методы
- Основной анализ — Intention‑to‑Treat (ITT): оценить среднее отличие конечного YYY между присвоенными группами.
- Регрессионная модель (ANCOVA) для повышения мощности:
Yi1=α+∑kβkTik+γYi0+Xi′δ+uc(i)+εi, Y_{i1} = \alpha + \sum_{k}\beta_k T_{ik} + \gamma Y_{i0} + X_i'\delta + u_{c(i)} + \varepsilon_i,
Yi1 =α+k∑ βk Tik +γYi0 +Xi′ δ+uc(i) +εi , где TikT_{ik}Tik — индикаторы вмешательств (k=k=k= налог, инфо, nudges), Yi0Y_{i0}Yi0 — базовый уровень, XiX_iXi — ковариаты, uc(i)u_{c(i)}uc(i) — эффект кластера (фиксированный или случайный).
- Стандартные ошибки кластерно‑робастные по школе; при небольшом числа кластеров используйте wild cluster bootstrap или рандомизационную инференцию.
- Пер‑протокольный и комплайнс‑анализ: IV (инструмент — присвоение к вмешательству) для оценки эффекта на комpliers (LATE):
Первая стадия: Di=πZi+...D_i = \pi Z_i + ...Di =πZi +..., вторая стадия: Yi=α+βD^i+...Y_i = \alpha + \beta \hat D_i + ...Yi =α+βD^i +....
- Коррекция множественных сравнений: предопределённый главный контраст (каждое вмешательство vs контроль) и корректировка для вторичных тестов (Holm-Bonferroni или Romano‑Wolf).
- Анализы гетерогенности по полу, исходному потреблению, SES — предварительно оговорены.
- Обработка пропусков: предположительно MAR — множественная импутация; чувствительность по граду MAR/MNAR.
Спилловеры и внешние влияния
- Расположите кластеры так, чтобы минимизировать контакт между группами; измеряйте внешнее воздействие (всплывающие покупки вне школы).
- Анализ сетевых/пространственных спиллов — включить переменные дистанции или использовать модель авторегрессии, если необходимо.
Прочее
- Пре‑регистрация анализа и плана промежуточных анализов.
- Этические соображения: согласие родителей/участников, минимизация вреда, компенсации за участие.
- Оцените стоимость/эффективность: соберите данные о стоимости внедрения каждого вмешательства и рассчитайте стоимость на единицу сокращённого потребления.
Короткий итог
- Рекомендуемый дизайн: кластерный RCT по школам, 444 группы (контроль + налог + инфо + nudges), примерно 444444 школ и ≈2160 \approx 2160≈2160 учащихся для MDE δ=60\delta=60δ=60 мл/день при указанных предположениях. Анализ — ITT, ANCOVA с кластерно‑робастными стандартными ошибками, IV для комплаенса, корректировка множественных тестов и предрегистрация.