Эмпирическое задание: имея панельные данные по фирмам о затратах на НИОКР и показателях производительности, предложите эконометрическую стратегию для оценки причинного влияния НИОКР на производительность, учитывая проблему эндогенности и гетерогенности
Предыдущий
вопрос Следующий
вопрос

Question

Эмпирическое задание: имея панельные данные по фирмам о затратах на НИОКР и показателях производительности, предложите эконометрическую стратегию для оценки причинного влияния НИОКР на производительность, учитывая проблему эндогенности и гетерогенности
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по экономике

Эмпирическое задание...

eva

12 Ноя в 10:36

6 +6

0

Helper · Answer 1

Кратко и по делу — пошаговая эконометрическая стратегия с уравнениями, проверками и способами бороться с эндогенностью и гетерогенностью.
1) Целевая модель (TFP или лог-производительность)

y_{it} = \alpha_i + \gamma_t + \beta \, RD_{it} + X_{it}\delta + \varepsilon_{it},

где

y_{it}

— показатель производительности (TFP, лог-выход на рабочую силу и т.п.),

αi\alpha_i

— фирменные FE,

γt\gamma_t

— годовые FE,

RD_{it}

— затраты на НИОКР,

X_{it}

— набор управляемых контролей. Этот базовый фикс-эффект контролирует постоянную фирменную гетерогенность.
2) Проблема эндогенности
- Причины: обратная причинность (высокая продуктивность стимулирует

R D

), одновременно воздействующие шоки, измерительная ошибка.
- Стратегии:
a) Инструменты (IV / 2SLS). Первая стадия:

RD_{it} = \pi Z_{it} + \alpha_i + \gamma_t + X_{it}\phi + u_{it},

второй — та же основная модель, но с предсказанными

RD^it\widehat{RD}_{it}

. Требования: инструмент релевантен (

π≠0\pi\neq0

) и экзогенен. Возможные инструменты: изменение налоговых льгот на R&D по регионам/отраслям, квазиэкспериментальные субсидии, отраслево-временные шоки, удалённость до научных центров, политика амортизации R&D. Проверки: F-stat первой стадии, тест Хансена/Сargan для сверхидентификации, анализ чувствительности к исключению инструментов.
b) Динамическая панель — системный GMM / Arellano–Bond (если есть лаг зависимой и

R D

динамичен):

y_{it} = \rho y_{i,t-1} + \beta RD_{it} + \alpha_i + \gamma_t + v_{it},

используем лаги

y_{i,t-s}

,

RD_{i,t-s}

как инструменты. Проверки: AR(1), AR(2) для остатков, тесты на переизбыточность (Hansen), проверка слабых инструментов.
c) Control function: оценить уравнение для

RD_{it}

, сохранить остаток

u^it\hat u_{it}

и включить его в основное уравнение — если условие коррекции выполнено, это снимает часть эндогенности.
3) Учет временных трендов и обратной причинности
- Добавить фирменно-специфические тренды:

αi+λit\alpha_i + \lambda_i t

.
- Лаги и опережающие эффекты: оценить кумулятивные лаги

RD_{i,t-k}

и проверить пред-тренды (включить

ℓ\ell

-лидеры для диагностики обратной причинности).
4) Различные идентификационные подходы при политике/шоке
- Разность-в-разницах / event-study (если есть экспогенный шок/политика):

y_{it}=\alpha_i+\gamma_t+\sum_{k\neq -1}\beta_k\mathbf{1}\{t-t_i=k\}+X_{it}\delta+\varepsilon_{it},

где

1{t−ti=k}\mathbf{1}\{t-t_i=k\}

— индикаторы для расстояния во времени от внедрения политики. Обязательно тестировать отсутствие пред-трендов (коэффициенты до события ≈ 0).
5) Гетерогенность эффектов
- Позволить коэффициенту по

R D

зависеть от характеристик:

βi=β0+β1Wi\beta_i=\beta_0+\beta_1 W_i

, оценка через взаимодействия:

RDit×WiRD_{it}\times W_i

.
- Групповой анализ (по секторам, размерам, возрасту фирмы).
- Модель случайных коэффициентов / деревья причинной гетерогенности / Causal Forest для оценки неоднородных эффектов.
- Квантили воздействия: квантили регрессии по следам или распределение эффектов.
6) Технические моменты и робастность
- Вычисление TFP: Olley–Pakes, Levinsohn–Petrin или Ackerberg–Cutler–Fisher для снижения смещения поведения входящих факторов.
- Кластеризация стандартных ошибок на уровне фирмы или выше (отрасль×регион), если спилловеры.
- Проверки: тесты слабых инструментов, тесты на автокорреляцию остатков, placebo-тесты, исключение подозрительных инструментов.
- Обработка пропусков и измерительных ошибок: использовать лаги RD, внешние административные данные или центроиды.
7) Последовательность практической реализации (рекомендуемая)
1. Сконструировать надежный показатель производительности (TFP) методами OP/LP/ACF.
2. Описательная статистика, предтренды и корреляции, визуализация.
3. Оценить фикс-эффектную модель

yit=αi+γt+βRDit+Xity_{it}=\alpha_i+\gamma_t+\beta RD_{it}+X_{it}

.
4. Протестировать эндогенность (Durbin–Wu–Hausman) и, при необходимости, применить IV (обосновать инструменты).
5. Если данные панельные с динамикой — применить system GMM и проверить AR(2), Hansen.
6. Провести event-study, если есть политика/шок.
7. Оценить гетерогенность через взаимодействия, подклассы и методы ML для CATE.
8. Привести множество робастных проверок: альтернативные меры RD, разные лаги, кластеризация, placebo.
Кратко: базовый путь — фикс‑эффекты + проверенные IV (или sysGMM при динамике) + проверка пред-трендов и явной гетерогенности; все результаты дополнять тестами валидности инструментов и множеством робастных проверок.

Другие вопросы eva

Другие вопросы
eva