В задаче медицинской диагностики тест имеет чувствительность 99% и специфичность 95%, распространённость заболевания 1% — вычислите апостериорную вероятность заболевания при положительном результате, объясните влияние априорной вероятности и прокомментируйте, как интерпретировать результат теста на практике
Вычисление (по формуле Байеса): P(D∣+)=P(+∣D)P(D)P(+∣D)P(D)+P(+∣¬D)P(¬D)
P(D|+) = \frac{P(+|D)P(D)}{P(+|D)P(D) + P(+|\neg D)P(\neg D)} P(D∣+)=P(+∣D)P(D)+P(+∣¬D)P(¬D)P(+∣D)P(D) Подставляем P(+∣D)=0.99P(+|D)=0.99P(+∣D)=0.99, P(+∣¬D)=1−специфичность=0.05P(+|\neg D)=1-\text{специфичность}=0.05P(+∣¬D)=1−специфичность=0.05, P(D)=0.01P(D)=0.01P(D)=0.01, P(¬D)=0.99P(\neg D)=0.99P(¬D)=0.99: P(D∣+)=0.99⋅0.010.99⋅0.01+0.05⋅0.99=0.00990.0099+0.0495=0.00990.0594≈0.1667 (16.7%).
P(D|+) = \frac{0.99\cdot 0.01}{0.99\cdot 0.01 + 0.05\cdot 0.99} = \frac{0.0099}{0.0099+0.0495} = \frac{0.0099}{0.0594} \approx 0.1667 \ (16.7\%). P(D∣+)=0.99⋅0.01+0.05⋅0.990.99⋅0.01=0.0099+0.04950.0099=0.05940.0099≈0.1667(16.7%). Влияние априорной вероятности: при низкой распространённости (P(D)P(D)P(D)) даже очень чувствительный и относительно специфичный тест даёт низкое положительное предсказательное значение (PPV), так как абсолютное число ложных положительных (P(+∣¬D)P(¬D)P(+|\neg D)P(\neg D)P(+∣¬D)P(¬D)) превосходит число истинно положительных. Чем выше априор (предтестовая) вероятность, тем выше P(D∣+)P(D|+)P(D∣+); при очень низкой — специфичность становится критичнее для повышения PPV. Практическая интерпретация: при положительном результате апостериорная вероятность болезни возрастает с 1%1\%1% до ~16.7%16.7\%16.7%, то есть большинство положительных результатов всё ещё ложноположительные (примерно 1 из 6 — истинно больной). На практике это значит: не ставить окончательный диагноз только по этому тесту — учитывать клинику и риск-факторы, применять подтверждающие или более специфичные тесты, при массовом скрининге ожидать много ложных тревог.
P(D∣+)=P(+∣D)P(D)P(+∣D)P(D)+P(+∣¬D)P(¬D) P(D|+) = \frac{P(+|D)P(D)}{P(+|D)P(D) + P(+|\neg D)P(\neg D)}
P(D∣+)=P(+∣D)P(D)+P(+∣¬D)P(¬D)P(+∣D)P(D)
Подставляем P(+∣D)=0.99P(+|D)=0.99P(+∣D)=0.99, P(+∣¬D)=1−специфичность=0.05P(+|\neg D)=1-\text{специфичность}=0.05P(+∣¬D)=1−специфичность=0.05, P(D)=0.01P(D)=0.01P(D)=0.01, P(¬D)=0.99P(\neg D)=0.99P(¬D)=0.99:
P(D∣+)=0.99⋅0.010.99⋅0.01+0.05⋅0.99=0.00990.0099+0.0495=0.00990.0594≈0.1667 (16.7%). P(D|+) = \frac{0.99\cdot 0.01}{0.99\cdot 0.01 + 0.05\cdot 0.99} = \frac{0.0099}{0.0099+0.0495} = \frac{0.0099}{0.0594} \approx 0.1667 \ (16.7\%).
P(D∣+)=0.99⋅0.01+0.05⋅0.990.99⋅0.01 =0.0099+0.04950.0099 =0.05940.0099 ≈0.1667 (16.7%).
Влияние априорной вероятности: при низкой распространённости (P(D)P(D)P(D)) даже очень чувствительный и относительно специфичный тест даёт низкое положительное предсказательное значение (PPV), так как абсолютное число ложных положительных (P(+∣¬D)P(¬D)P(+|\neg D)P(\neg D)P(+∣¬D)P(¬D)) превосходит число истинно положительных. Чем выше априор (предтестовая) вероятность, тем выше P(D∣+)P(D|+)P(D∣+); при очень низкой — специфичность становится критичнее для повышения PPV.
Практическая интерпретация: при положительном результате апостериорная вероятность болезни возрастает с 1%1\%1% до ~16.7%16.7\%16.7%, то есть большинство положительных результатов всё ещё ложноположительные (примерно 1 из 6 — истинно больной). На практике это значит: не ставить окончательный диагноз только по этому тесту — учитывать клинику и риск-факторы, применять подтверждающие или более специфичные тесты, при массовом скрининге ожидать много ложных тревог.