Кейс генетики популяций: две изолированные популяции того же вида демонстрируют разную частоту аллелей — какие эволюционные процессы могли привести к этому и как это проверить с помощью молекулярных маркеров
Возможные эволюционные процессы (кратко, с объяснениями) - Генетический дрейф — случайные флуктуации частот аллелей в изолированных популяциях; особенно сильен при малых эффективных размерах популяций NeN_eNe. - Фаундер-эффект и бутылочное горлышко — резкое уменьшение NeN_eNe или исходная малая группа основателей ведут к потере аллельного разнообразия и сдвигам частот. - Отбор (локальная адаптация) — разные среды приводят к положительному отбору на разные аллели в разных популяциях. - Мутации — новые мутации могут появляться и фиксироваться в одной популяции. - Ограниченный или отсутствующий генетический поток (миграция) — поддерживает различия; при миграции различия уменьшаются. - Сексуальный отбор, неслучайное скрещивание, интрогрессия/гибридизация с другими таксонами — могут изменить частоты локально. Как отличить эти процессы с помощью молекулярных маркеров (практическая схема) 1. Выбор маркеров - Нейтральные маркеры (микросателлиты, нейтральные SNP, межгеномные участки) — для тестирования дрейфа/миграции/демографии. - Геномные SNP или ориентированные маркеры (экзомы, RAD-seq, WGS) — для сканов на отбор и локальную адаптацию. - Митохондриальная ДНК / Y-хромосома — материнская/патернальная история, асимметричный поток генов. 2. Описательная статистика - Различие частот: FSTF_{ST}FST (или Weir & Cockerham) — мера дифференциации между популяциями. Высокий FSTF_{ST}FST указывает на малый поток генов/дрейф или локальный отбор. - Гетероzygостность: ожидаемая гетерозиготность He=1−∑pi2H_e = 1-\sum p_i^2He=1−∑pi2. - Нуклеотидное разнообразие π\piπ и число частных аллелей. 3. Тесты демографии и дрейфа - Тесты на бутылочное горлышко (heterozygosity excess, M-ratio). - Оценка эффективного размера популяции NeN_eNe (метод LD, coalescent-модели). - Модели демографической истории (site frequency spectrum, dadi, fastsimcoal2, Stairway Plot, PSMC/MSMC при WGS). 4. Тесты на отбор vs нейтральность - Сканы на FST-outliers (BayeScan, FDIST) — локусы с FSTF_{ST}FST намного выше фонового уровня могут быть под локальным отбором. - Связанные тесты: XP-CLR, XP-EHH, PBS для поиска сигналов селективных сдвигов. - Связь генетики с окружающей средой (LFMM, redundancy analysis) — выявление локальной адаптации. 5. Структура популяций и миграция - PCA, STRUCTURE/ADMIXTURE — визуализация кластеров и адмикшна. - Оценка потоков миграции (MIGRATE-N, BAYESASS) и тесты на изоляцию по расстоянию (Mantel test). - D-statistics / ABBA-BABA — для выявления интрогрессии/гибридизации. 6. Интерпретация паттернов (правила простого вывода) - Высокий фоновый FSTF_{ST}FST по нейтральным маркерам + низкое NeN_eNe → дрейф/изоляция. - Низкий фон FSTF_{ST}FST, но отдельные локусы — сильные аутлайеры → вероятный локальный отбор. - Сигналы недавнего сокращения (heterozygosity excess, отрицательный разрыв M-ratio) → бутылочное горлышко. - Различия в митохондрии, но не в ядерных маркерах → материнская линия/асимметричный генетический поток или интрогрессия. Практические советы по дизайну исследования - Берите достаточное число образцов на популяцию (рекомендуемо 20–3020\text{–}3020–30 индивидов для SNP-анализа; при ограничениях — больше для микросателлитов). - Используйте сочетание нейтральных и геномных маркеров. - Контролируйте за фоновой структурой и связностью (linked selection, рекомбинация). - Комбинируйте методы (описательные, демографические, тесты на отбор) — конвергентные доказательства сильнее. Ключевые статистики/формулы для интерпретации - FSTF_{ST}FST (в общем виде): FST=Var(p)pˉ(1−pˉ)\displaystyle F_{ST}=\frac{Var(p)}{\bar{p}(1-\bar{p})}FST=pˉ(1−pˉ)Var(p). - Ожидаемая гетерозиготность: He=1−∑ipi2\displaystyle H_e=1-\sum_i p_i^2He=1−i∑pi2. - Нуклеотидное разнообразие: π=среднее число различий между парой последовательностей\displaystyle \pi=\text{среднее число различий между парой последовательностей}π=среднеечислоразличиймеждупаройпоследовательностей. Краткий вывод - Сначала оцените дифференциацию по нейтральным маркерам (дрейф/миграция/демография). Затем выполните геномные сканы и ассоциативные анализы, чтобы выявить кандидаты на локальную адаптацию. Комбинация нескольких независимых тестов и адекватный выбор маркеров позволит отделить роль дрейфа, отбора, миграции и демографических событий.
- Генетический дрейф — случайные флуктуации частот аллелей в изолированных популяциях; особенно сильен при малых эффективных размерах популяций NeN_eNe .
- Фаундер-эффект и бутылочное горлышко — резкое уменьшение NeN_eNe или исходная малая группа основателей ведут к потере аллельного разнообразия и сдвигам частот.
- Отбор (локальная адаптация) — разные среды приводят к положительному отбору на разные аллели в разных популяциях.
- Мутации — новые мутации могут появляться и фиксироваться в одной популяции.
- Ограниченный или отсутствующий генетический поток (миграция) — поддерживает различия; при миграции различия уменьшаются.
- Сексуальный отбор, неслучайное скрещивание, интрогрессия/гибридизация с другими таксонами — могут изменить частоты локально.
Как отличить эти процессы с помощью молекулярных маркеров (практическая схема)
1. Выбор маркеров
- Нейтральные маркеры (микросателлиты, нейтральные SNP, межгеномные участки) — для тестирования дрейфа/миграции/демографии.
- Геномные SNP или ориентированные маркеры (экзомы, RAD-seq, WGS) — для сканов на отбор и локальную адаптацию.
- Митохондриальная ДНК / Y-хромосома — материнская/патернальная история, асимметричный поток генов.
2. Описательная статистика
- Различие частот: FSTF_{ST}FST (или Weir & Cockerham) — мера дифференциации между популяциями. Высокий FSTF_{ST}FST указывает на малый поток генов/дрейф или локальный отбор.
- Гетероzygостность: ожидаемая гетерозиготность He=1−∑pi2H_e = 1-\sum p_i^2He =1−∑pi2 .
- Нуклеотидное разнообразие π\piπ и число частных аллелей.
3. Тесты демографии и дрейфа
- Тесты на бутылочное горлышко (heterozygosity excess, M-ratio).
- Оценка эффективного размера популяции NeN_eNe (метод LD, coalescent-модели).
- Модели демографической истории (site frequency spectrum, dadi, fastsimcoal2, Stairway Plot, PSMC/MSMC при WGS).
4. Тесты на отбор vs нейтральность
- Сканы на FST-outliers (BayeScan, FDIST) — локусы с FSTF_{ST}FST намного выше фонового уровня могут быть под локальным отбором.
- Связанные тесты: XP-CLR, XP-EHH, PBS для поиска сигналов селективных сдвигов.
- Связь генетики с окружающей средой (LFMM, redundancy analysis) — выявление локальной адаптации.
5. Структура популяций и миграция
- PCA, STRUCTURE/ADMIXTURE — визуализация кластеров и адмикшна.
- Оценка потоков миграции (MIGRATE-N, BAYESASS) и тесты на изоляцию по расстоянию (Mantel test).
- D-statistics / ABBA-BABA — для выявления интрогрессии/гибридизации.
6. Интерпретация паттернов (правила простого вывода)
- Высокий фоновый FSTF_{ST}FST по нейтральным маркерам + низкое NeN_eNe → дрейф/изоляция.
- Низкий фон FSTF_{ST}FST , но отдельные локусы — сильные аутлайеры → вероятный локальный отбор.
- Сигналы недавнего сокращения (heterozygosity excess, отрицательный разрыв M-ratio) → бутылочное горлышко.
- Различия в митохондрии, но не в ядерных маркерах → материнская линия/асимметричный генетический поток или интрогрессия.
Практические советы по дизайну исследования
- Берите достаточное число образцов на популяцию (рекомендуемо 20–3020\text{–}3020–30 индивидов для SNP-анализа; при ограничениях — больше для микросателлитов).
- Используйте сочетание нейтральных и геномных маркеров.
- Контролируйте за фоновой структурой и связностью (linked selection, рекомбинация).
- Комбинируйте методы (описательные, демографические, тесты на отбор) — конвергентные доказательства сильнее.
Ключевые статистики/формулы для интерпретации
- FSTF_{ST}FST (в общем виде): FST=Var(p)pˉ(1−pˉ)\displaystyle F_{ST}=\frac{Var(p)}{\bar{p}(1-\bar{p})}FST =pˉ (1−pˉ )Var(p) .
- Ожидаемая гетерозиготность: He=1−∑ipi2\displaystyle H_e=1-\sum_i p_i^2He =1−i∑ pi2 .
- Нуклеотидное разнообразие: π=среднее число различий между парой последовательностей\displaystyle \pi=\text{среднее число различий между парой последовательностей}π=среднее число различий между парой последовательностей.
Краткий вывод
- Сначала оцените дифференциацию по нейтральным маркерам (дрейф/миграция/демография). Затем выполните геномные сканы и ассоциативные анализы, чтобы выявить кандидаты на локальную адаптацию. Комбинация нескольких независимых тестов и адекватный выбор маркеров позволит отделить роль дрейфа, отбора, миграции и демографических событий.