Дано популяционное генетическое уравнение с начальной частотой аллеля p0=0,1 в популяции размера N, подвергающейся миграции, отбору и генетическому дрейфу; предложите модель (или несколько сценариев) для предсказания распределения частот через 50 поколений, опишите необходимые параметры и обсудите, как эмпирически отличить влияние дрейфа от отбора
Предыдущий
вопрос Следующий
вопрос

Question

Дано популяционное генетическое уравнение с начальной частотой аллеля p0=0,1 в популяции размера N, подвергающейся миграции, отбору и генетическому дрейфу; предложите модель (или несколько сценариев) для предсказания распределения частот через 50 поколений, опишите необходимые параметры и обсудите, как эмпирически отличить влияние дрейфа от отбора
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по естествознанию

Дано популяционное г...

eva

29 Окт в 09:35

4 +1

0

Helper · Answer 1

Модельную стратегию предложу кратко — с уравнениями, параметрами и практическими способами отличить дрейф от отбора.
1) Базовая стохастическая модель (Wright–Fisher с отбором и миграцией)
- Обозначения: начальная частота

p_0=0.1

, эффективный размер популяции

N_e

(или

N

), скорость миграции

m

, частота аллеля в источнике миграции

p_m

, коэффициент отбора

s

, доминантность

h

, число поколений

T = 50

.
- Пошаговый апдейт от поколения

t

к

t + 1

:
1. Отбор (постселекционный частотный сдвиг). Для генотипных фитнессов

w_{AA}=1+s,\; w_{Aa}=1+hs,\; w_{aa}=1

:

\tilde p = \frac{p_t^2 w_{AA} + p_t(1-p_t) w_{Aa}}{\bar w},\qquad \bar w = p_t^2 w_{AA}+2p_t(1-p_t)w_{Aa}+(1-p_t)^2 w_{aa}.

2. Миграция (миксинг с источником):

p'_t = (1-m)\,\tilde p + m\,p_m.

3. Генетический дрейф (дискретная семплинг-стадия Wright–Fisher):

X_{t+1}\sim \mathrm{Binomial}(2N_e,\; p'_t),\qquad p_{t+1}=\frac{X_{t+1}}{2N_e}.

- Повторить 50 раз и выполнить много реплик (например

R=10^3\!-\!10^4

) для получения распределения частот, вероятности потери/фиксации, среднего и дисперсии.
2) Диффузионное приближение (для аналитических оценок)
- В непрерывном приближении:

\big[m(p_m-p)+ S(p)\big]dt + \sqrt{\frac{p(1-p)}{2N_e}}\,dW_t,

где при простом аддитивном отборе

p(1−p)S(p)\approx s\,p(1-p)

. Дает приближённые времена к фиксации и распределение вероятностей.
3) Варианты/сценарии (примеры параметров и ожидания)
- Сценарий A — сильный дрейф:

N_e=100,\; s=0,\; m=0

. Ожидание: высокая вероятность потерять аллель за 50 поколений; распределение широкое, средняя близка к

p_0

до тех пор, пока большинство реплик потеряют аллель.
- Сценарий B — слабый положительный отбор:

N_e=1000,\; s=0.02,\; m=0

. Ожидание: если

s≫1/(2Ne)=0.0005s\gg 1/(2N_e)=0.0005

, частота растёт устойчиво; за 50 поколений заметный сдвиг вверх в большинстве реплик.
- Сценарий C — миграция из источника:

N_e=500,\; s=0,\; m=0.01,\; p_m=0.5

. Ожидание: систематическое увеличение частоты к смешанному равновесию; при малом

N_e

эффект миграции доминирует над дрейфом.
- Сценарий D — конкуренция процессов:

N_e=200,\; s=0.005,\; m=0.005

. Ожидание: оба эффекта важны; результаты чувствительны к исходному случайному семплингу.
4) Важные параметры, которые нужно задать/оценить
-

N_e

(эффективный размер) — ключевой для силы дрейфа.
-

s

и

h

— сила и форма отбора.
-

m

,

p_m

— скорость и направление миграции.
- Число реплик/популяций и число симуляций

R

— для оценки распределения.
- Начальные условия (

p_0=0.1

) и длительность

T = 50

.
5) Критерии: когда дрейф vs отбор важнее
- Порядковая оценка: если

\ll 1/(2N_e)

, дрейф доминирует; если

\gg 1/(2N_e)

, отбор доминирует.

\text{порог: } s\sim\frac{1}{2N_e}.

- Ожидаемая дисперсия дрейфа за один шаг:

Var(Δp)≈p(1−p)2Ne\mathrm{Var}(\Delta p)\approx \frac{p(1-p)}{2N_e}

.
6) Как эмпирически отличить влияние дрейфа от отбора и миграции
- Реплики: держите множество независимых популяций. Согласованное повторяющееся направление изменения (в нескольких независимых репликах) указывает на отбор, тогда как случайные разнонаправленные изменения — на дрейф.
- Временной ряд (частоты через поколения): сравнить траекторию с моделями через likelihood. Инструменты: WFABC, Wright–Fisher diffusion-based inference, CLUES, TimeMachine — оценивают

s

и дают статистику «отбор vs нейтральность».
- Тесты по скорости изменения: если частота меняется быстрее, чем предсказывает модель нейтрального дрейфа (с учётом

N_e

), это признак отбора; формально — likelihood-ratio между модели s=0 и s≠0.
- Миграция vs отбор: проверить корреляцию с потоком генов/географией. Если рост частоты совпадает с gene flow из источника с высокой

p_m

, скорее миграция. Использовать маркеры происхождения/структуры (PCA, STRUCTURE/ADMIXTURE) и оценки

m

(например, через coalescent или FST).
- Геномные сигнатуры: если locus один из многих и показывает аномалии (FST-выброс, тесные гаплотипы — hitchhiking), это поддерживает отбор; миграция даёт совместное изменение во многих локусах, соответствующих источнику.
- Статистическая мощность: при малых

N_e

и малом

s

трудно отличить; нужны либо много реплик, либо длинные временные ряды и/или геномный контекст.
7) Практическая рекомендация для прогноза
- Реализуйте WF-симуляции по шагам (отбор→миграция→семплинг) с заданными параметрами и

R

репликами, соберите распределение

p_{50}

, вероятность фиксации/потери, среднее и дисперсию.
- Параллельно выполните нейтральные симуляции (s=0) и симуляции только с миграцией (s=0, m>0) для сравнения.
- Для вывода о причине изменения используйте likelihood-инференс по траекториям + проверку согласованности между популяциями и геномные данные.
Если нужно, могу дать компактный псевдокод симуляции WF с указанными параметрами и примеры числовых сценариев (конкретных значений

N_e,m,s,p_m

) для запуска.

Другие вопросы eva

Другие вопросы
eva