В популяции зафиксирована избыточная доля гетерозигот по локусу, связанному с рецессивным заболеванием — перечислите возможные биологические и методологические причины этого явления и предложите подходы для дальнейшего исследования
Кратко: избыток гетерозигот может быть реальным биологическим явлением балансирующийотбор,дизассортативноеспаривание,отборпротивгомозиготит.п.балансирующий отбор, дизассортативное спаривание, отбор против гомозигот и т. п.балансирующийотбор,дизассортативноеспаривание,отборпротивгомозиготит.п. или артефактом ошибкигенотипирования,отборпроб,смешениеобразцовит.д.ошибки генотипирования, отбор проб, смешение образцов и т. д.ошибкигенотипирования,отборпроб,смешениеобразцовит.д.. Ниже — подробный перечень возможных причин и план дальнейшего расследования.
Возможные биологические причины
Балансирующий отбор / overdominance гетерозиготноепреимуществогетерозиготное преимуществогетерозиготноепреимущество. Гетерозиготы дают большую приспособленность, поэтому частота гетерозигот выше, чем ожидание по нейтральной HWE. Классический пример — серповидноклеточность/малярия.Отбор против гомозигот рецессивно−зависящаялетальностьилиуменьшениевыживаемости/фертильностирецессивно-зависящая летальность или уменьшение выживаемости/фертильностирецессивно−зависящаялетальностьилиуменьшениевыживаемости/фертильности. Если больные гомозиготы гибнут до отбора в выборку иливыбываютизрепродуктивнойпопуляцииили выбывают из репродуктивной популяциииливыбываютизрепродуктивнойпопуляции, в выборке взрослых остается больше гетерозигот.Дизассортативное спаривание предпочтениепартнёровсотличнымгенотипом/фенотипомпредпочтение партнёров с отличным генотипом/фенотипомпредпочтениепартнёровсотличнымгенотипом/фенотипом. Прямо увеличивает долю гетерозигот.Недавний приток адмиксадмиксадмикс и/или скрещивание между популяциями с разными частотами аллелей в сочетании с неравномерным брачным поведением — в некоторых ситуациях может приводить к локальным отклонениям от HWE ноклассическийWahlund‑эффектчащедаётдефицитгетерозиготно классический Wahlund‑эффект чаще даёт дефицит гетерозиготноклассическийWahlund‑эффектчащедаётдефицитгетерозигот.Гетерогенность по возрасту/сезону/половая селекция: например, гомозиготы умирают молодыми → в выборке взрослых слышимый избыток гетерозигот.Множественные аллели/комплексный локус например,мульти‑аллическаясистемаилилокусснесколькимикопияминапример, мульти‑аллическая система или локус с несколькими копияминапример,мульти‑аллическаясистемаилилокусснесколькимикопиями: модель двухалельной HWE может не применяться напрямую.
Возможные методологические/технические причины
Генотипирующие артефакты: Ошибки кластеризации в SNP‑чипах → ложные гетерозиготные вызовы.Ошибки выравнивания при секвенировании паралоги,индексы,неоднозначныеместапаралоги, индексы, неоднозначные местапаралоги,индексы,неоднозначныеместа → ложные смешанные аллели.Контаминация образцов миксДНКмикс ДНКмиксДНК → систематический избыток гетерозигот по множеству локусов.Копийные вариации/делеции/инсерции в регионе приводят к некорректным вызовам генотипов.Низкое покрытие NGS → ошибочные вызовы гетерозигот при ограниченных чтениях или при наличии ошибок секвенции.Ассертмент/отбор образцов: Выборка, ориентированная на родственников, клинические центры, доноров и т. п.; если при отборе исключаются больные гомозиготы, доля гетерозигот искусственно повышается.Дублирование/повторный учет одних и тех же образцов смесьстемижеобразцамиобычнонедастизбытокгетерозигот,ноошибкиучётамогутсмесь с теми же образцами обычно не даст избыток гетерозигот, но ошибки учёта могутсмесьстемижеобразцамиобычнонедастизбытокгетерозигот,ноошибкиучётамогут.Ошибки в учёте/филоге метаданныеметаданныеметаданные: неверные пол, возраст, место рождения и т.п. — мешают правильной стратификации анализов.Популяционная структура анализа: если вы сравниваете ожидаемое HWE, рассчитанное некорректно например,подругимподгруппамнапример, по другим подгруппамнапример,подругимподгруппам, можно получить видимый избыток.
Как исследовать дальше — пошагово 1) Быстрая диагностика — локальный или системный эффект?
Проверьте гетерозиготность по всему геному/панели. Если много локусов показывают аномально высокий % гетерозигот → вероятна контаминация или техническая проблема. Если явление ограничено одним локусом → более вероятна биологическая причина или локальный технический артефакт.Рассчитайте FIS инбрединговыйкоэффициентинбрединговый коэффициентинбрединговыйкоэффициент для локуса и для генома; отрицательный FIS указывает на избыток гетерозигот. 2) Проверки качества генотиповПросмотрите сырые данные: cluster plots дляSNP‑чиповдля SNP‑чиповдляSNP‑чипов или alignments/reads в IGV дляNGSдля NGSдляNGS в проблемном локусе.Проверьте метрики качества прочностьвызова,покрытие,балансаллелей,качествобазпрочность вызова, покрытие, баланс аллелей, качество базпрочностьвызова,покрытие,балансаллелей,качествобаз.Повторите генотипирование для подпопуляции образцов Sanger‑секвенированиеилидругойнезависимыйметодSanger‑секвенирование или другой независимый методSanger‑секвенированиеилидругойнезависимыйметод — особенно на гетерозиготах и гомозиготах.Оцените наличие копий CNVCNVCNV в регионе могутмаскировать/создаватьложныегетерозиготымогут маскировать/создавать ложные гетерозиготымогутмаскировать/создаватьложныегетерозиготы. 3) Проверки выборки и метаданныхПроанализируйте возможную контаминацию высокаягетерозиготностьgenome‑wide,несоответствияпополовомухромосомамвысокая гетерозиготность genome‑wide, несоответствия по половому хромосомамвысокаягетерозиготностьgenome‑wide,несоответствияпополовомухромосомам.Удалите/отметьте близкородственные и дублированные образцы; проверьте родство KING/PLINKKING/PLINKKING/PLINK.Пересмотрите процедуру отбора образцов асцертментасцертментасцертмент, возрастной состав и источники данных. 4) Анализы популяционной структуры и стратификацииПроведите PCA, ADMIXTURE/STRUCTURE, вычислите Fst между подгруппами. Структура популяции может объяснить отклонения.Разделите данные по географии/этике/клану/возрасту/партнёрам и протестируйте HWE в каждой подгруппе. 5) Биологические испытания и клинические данныеСопоставьте генотипы с фенотипом/клиническими картами: есть ли повышенная смертность/снижение фертильности у гомозигот? Проверьте частоту гомозигот в детских и взрослых когортах.Семейный анализ: сегрегация в родословных, ожидание числа гетерозигот у детей и родителей; проводите тесты на дефицит родословных гомозигот.Если есть подозрение на гетерозиготное преимущество, попытайтесь оценить относительные фитнес‑коэффициенты s,hs, hs,h моделированием и по демографии. 6) Тесты на сигнатуры отбораИспользуйте тесты на балансирующий отбор: Tajima’s D положительноезначениеположительное значениеположительноезначение, HKA, повышение локального уровня полиморфизма, долгие и разнообразные гаплотипы; iHS/XP‑EHH и др. оничащеиспользуютсядлянедавнегоселекции,длябаланса—другиекритерииони чаще используются для недавнего селекции, для баланса — другие критериионичащеиспользуютсядлянедавнегоселекции,длябаланса—другиекритерии.Сравните уровни диверсификации гаплотипов вокруг локуса с геномным фоном. 7) Моделирование и статистическая оценкаСмоделируйте ожидаемые частоты под различными сценариями дизассортативность,отборпротивгомозигот,частичнаясмертность,смешение,ошибкигенотипированиядизассортативность, отбор против гомозигот, частичная смертность, смешение, ошибки генотипированиядизассортативность,отборпротивгомозигот,частичнаясмертность,смешение,ошибкигенотипирования и подберите параметры, оптимально объясняющие наблюдение.Примените точечные и точные тесты HWE например,exacttestнапример, exact testнапример,exacttest, учитывая стратификацию и множественные тесты. 8) РепликацияПроверьте результаты в независимой выборке другаякогорты,другойрегион,другиелабораториидругая когорты, другой регион, другие лабораториидругаякогорты,другойрегион,другиелаборатории.Если возможно, возьмите биологические образцы кровь/ДНКкровь/ДНКкровь/ДНК от тех же лиц и протестируйте повторно.
Критерии интерпретации
Если аномалия локализована в одном локусе, качества данных чисты высокоепокрытие,хорошиекластерывысокое покрытие, хорошие кластерывысокоепокрытие,хорошиекластеры, повторный Sanger подтверждает генотипы и клинические данные показывают снижение выживаемости гомозигот — сильный сигнал биологического отбора/балансирующего эффекта.Если аномалия наблюдается геномно и сопровождается признаками смешения/контаминации/низкого качества → техническая причина вероятнее.
Короткий план действий практикапрактикапрактика
Сравните гетерозиготность локуса vs genome‑wide. Просмотрите cluster plots / IGV для проблемных образцов. Повторная проверка генотипов методом Sanger или глубокого секвенирования на выборке 10–50образцов:гомоигетеро10–50 образцов: гомо и гетеро10–50образцов:гомоигетеро. Проведите PCA/ADMIXTURE, расчёт FIS и тесты HWE по подгруппам. Сверьте с клинической/возрастной информацией, выполните семейный анализ. При подтверждении биологического сигнала — выполните тесты на признаки отбора и модельную оценку величин отбора.
Если хотите, могу:
предложить конкретные команды/скрипты PLINK,vcftools,IGVPLINK, vcftools, IGVPLINK,vcftools,IGV для проверки качества и HWE; помочь составить план повторной валидации какиеобразцывыбрать,какойметодкакие образцы выбрать, какой методкакиеобразцывыбрать,какойметод; интерпретировать конкретные данные, если вы пришлёте частоты/таблицы/плоты.
Кратко: избыток гетерозигот может быть реальным биологическим явлением балансирующийотбор,дизассортативноеспаривание,отборпротивгомозиготит.п.балансирующий отбор, дизассортативное спаривание, отбор против гомозигот и т. п.балансирующийотбор,дизассортативноеспаривание,отборпротивгомозиготит.п. или артефактом ошибкигенотипирования,отборпроб,смешениеобразцовит.д.ошибки генотипирования, отбор проб, смешение образцов и т. д.ошибкигенотипирования,отборпроб,смешениеобразцовит.д.. Ниже — подробный перечень возможных причин и план дальнейшего расследования.
Возможные биологические причины
Балансирующий отбор / overdominance гетерозиготноепреимуществогетерозиготное преимуществогетерозиготноепреимущество. Гетерозиготы дают большую приспособленность, поэтому частота гетерозигот выше, чем ожидание по нейтральной HWE. Классический пример — серповидноклеточность/малярия.Отбор против гомозигот рецессивно−зависящаялетальностьилиуменьшениевыживаемости/фертильностирецессивно-зависящая летальность или уменьшение выживаемости/фертильностирецессивно−зависящаялетальностьилиуменьшениевыживаемости/фертильности. Если больные гомозиготы гибнут до отбора в выборку иливыбываютизрепродуктивнойпопуляцииили выбывают из репродуктивной популяциииливыбываютизрепродуктивнойпопуляции, в выборке взрослых остается больше гетерозигот.Дизассортативное спаривание предпочтениепартнёровсотличнымгенотипом/фенотипомпредпочтение партнёров с отличным генотипом/фенотипомпредпочтениепартнёровсотличнымгенотипом/фенотипом. Прямо увеличивает долю гетерозигот.Недавний приток адмиксадмиксадмикс и/или скрещивание между популяциями с разными частотами аллелей в сочетании с неравномерным брачным поведением — в некоторых ситуациях может приводить к локальным отклонениям от HWE ноклассическийWahlund‑эффектчащедаётдефицитгетерозиготно классический Wahlund‑эффект чаще даёт дефицит гетерозиготноклассическийWahlund‑эффектчащедаётдефицитгетерозигот.Гетерогенность по возрасту/сезону/половая селекция: например, гомозиготы умирают молодыми → в выборке взрослых слышимый избыток гетерозигот.Множественные аллели/комплексный локус например,мульти‑аллическаясистемаилилокусснесколькимикопияминапример, мульти‑аллическая система или локус с несколькими копияминапример,мульти‑аллическаясистемаилилокусснесколькимикопиями: модель двухалельной HWE может не применяться напрямую.Возможные методологические/технические причины
Генотипирующие артефакты:Ошибки кластеризации в SNP‑чипах → ложные гетерозиготные вызовы.Ошибки выравнивания при секвенировании паралоги,индексы,неоднозначныеместапаралоги, индексы, неоднозначные местапаралоги,индексы,неоднозначныеместа → ложные смешанные аллели.Контаминация образцов миксДНКмикс ДНКмиксДНК → систематический избыток гетерозигот по множеству локусов.Копийные вариации/делеции/инсерции в регионе приводят к некорректным вызовам генотипов.Низкое покрытие NGS → ошибочные вызовы гетерозигот при ограниченных чтениях или при наличии ошибок секвенции.Ассертмент/отбор образцов:
Выборка, ориентированная на родственников, клинические центры, доноров и т. п.; если при отборе исключаются больные гомозиготы, доля гетерозигот искусственно повышается.Дублирование/повторный учет одних и тех же образцов смесьстемижеобразцамиобычнонедастизбытокгетерозигот,ноошибкиучётамогутсмесь с теми же образцами обычно не даст избыток гетерозигот, но ошибки учёта могутсмесьстемижеобразцамиобычнонедастизбытокгетерозигот,ноошибкиучётамогут.Ошибки в учёте/филоге метаданныеметаданныеметаданные: неверные пол, возраст, место рождения и т.п. — мешают правильной стратификации анализов.Популяционная структура анализа: если вы сравниваете ожидаемое HWE, рассчитанное некорректно например,подругимподгруппамнапример, по другим подгруппамнапример,подругимподгруппам, можно получить видимый избыток.
Как исследовать дальше — пошагово
Проверьте гетерозиготность по всему геному/панели. Если много локусов показывают аномально высокий % гетерозигот → вероятна контаминация или техническая проблема. Если явление ограничено одним локусом → более вероятна биологическая причина или локальный технический артефакт.Рассчитайте FIS инбрединговыйкоэффициентинбрединговый коэффициентинбрединговыйкоэффициент для локуса и для генома; отрицательный FIS указывает на избыток гетерозигот.1) Быстрая диагностика — локальный или системный эффект?
2) Проверки качества генотиповПросмотрите сырые данные: cluster plots дляSNP‑чиповдля SNP‑чиповдляSNP‑чипов или alignments/reads в IGV дляNGSдля NGSдляNGS в проблемном локусе.Проверьте метрики качества прочностьвызова,покрытие,балансаллелей,качествобазпрочность вызова, покрытие, баланс аллелей, качество базпрочностьвызова,покрытие,балансаллелей,качествобаз.Повторите генотипирование для подпопуляции образцов Sanger‑секвенированиеилидругойнезависимыйметодSanger‑секвенирование или другой независимый методSanger‑секвенированиеилидругойнезависимыйметод — особенно на гетерозиготах и гомозиготах.Оцените наличие копий CNVCNVCNV в регионе могутмаскировать/создаватьложныегетерозиготымогут маскировать/создавать ложные гетерозиготымогутмаскировать/создаватьложныегетерозиготы.
3) Проверки выборки и метаданныхПроанализируйте возможную контаминацию высокаягетерозиготностьgenome‑wide,несоответствияпополовомухромосомамвысокая гетерозиготность genome‑wide, несоответствия по половому хромосомамвысокаягетерозиготностьgenome‑wide,несоответствияпополовомухромосомам.Удалите/отметьте близкородственные и дублированные образцы; проверьте родство KING/PLINKKING/PLINKKING/PLINK.Пересмотрите процедуру отбора образцов асцертментасцертментасцертмент, возрастной состав и источники данных.
4) Анализы популяционной структуры и стратификацииПроведите PCA, ADMIXTURE/STRUCTURE, вычислите Fst между подгруппами. Структура популяции может объяснить отклонения.Разделите данные по географии/этике/клану/возрасту/партнёрам и протестируйте HWE в каждой подгруппе.
5) Биологические испытания и клинические данныеСопоставьте генотипы с фенотипом/клиническими картами: есть ли повышенная смертность/снижение фертильности у гомозигот? Проверьте частоту гомозигот в детских и взрослых когортах.Семейный анализ: сегрегация в родословных, ожидание числа гетерозигот у детей и родителей; проводите тесты на дефицит родословных гомозигот.Если есть подозрение на гетерозиготное преимущество, попытайтесь оценить относительные фитнес‑коэффициенты s,hs, hs,h моделированием и по демографии.
6) Тесты на сигнатуры отбораИспользуйте тесты на балансирующий отбор: Tajima’s D положительноезначениеположительное значениеположительноезначение, HKA, повышение локального уровня полиморфизма, долгие и разнообразные гаплотипы; iHS/XP‑EHH и др. оничащеиспользуютсядлянедавнегоселекции,длябаланса—другиекритерииони чаще используются для недавнего селекции, для баланса — другие критериионичащеиспользуютсядлянедавнегоселекции,длябаланса—другиекритерии.Сравните уровни диверсификации гаплотипов вокруг локуса с геномным фоном.
7) Моделирование и статистическая оценкаСмоделируйте ожидаемые частоты под различными сценариями дизассортативность,отборпротивгомозигот,частичнаясмертность,смешение,ошибкигенотипированиядизассортативность, отбор против гомозигот, частичная смертность, смешение, ошибки генотипированиядизассортативность,отборпротивгомозигот,частичнаясмертность,смешение,ошибкигенотипирования и подберите параметры, оптимально объясняющие наблюдение.Примените точечные и точные тесты HWE например,exacttestнапример, exact testнапример,exacttest, учитывая стратификацию и множественные тесты.
8) РепликацияПроверьте результаты в независимой выборке другаякогорты,другойрегион,другиелабораториидругая когорты, другой регион, другие лабораториидругаякогорты,другойрегион,другиелаборатории.Если возможно, возьмите биологические образцы кровь/ДНКкровь/ДНКкровь/ДНК от тех же лиц и протестируйте повторно.
Критерии интерпретации
Если аномалия локализована в одном локусе, качества данных чисты высокоепокрытие,хорошиекластерывысокое покрытие, хорошие кластерывысокоепокрытие,хорошиекластеры, повторный Sanger подтверждает генотипы и клинические данные показывают снижение выживаемости гомозигот — сильный сигнал биологического отбора/балансирующего эффекта.Если аномалия наблюдается геномно и сопровождается признаками смешения/контаминации/низкого качества → техническая причина вероятнее.Короткий план действий практикапрактикапрактика
Сравните гетерозиготность локуса vs genome‑wide. Просмотрите cluster plots / IGV для проблемных образцов. Повторная проверка генотипов методом Sanger или глубокого секвенирования на выборке 10–50образцов:гомоигетеро10–50 образцов: гомо и гетеро10–50образцов:гомоигетеро. Проведите PCA/ADMIXTURE, расчёт FIS и тесты HWE по подгруппам. Сверьте с клинической/возрастной информацией, выполните семейный анализ. При подтверждении биологического сигнала — выполните тесты на признаки отбора и модельную оценку величин отбора.Если хотите, могу:
предложить конкретные команды/скрипты PLINK,vcftools,IGVPLINK, vcftools, IGVPLINK,vcftools,IGV для проверки качества и HWE; помочь составить план повторной валидации какиеобразцывыбрать,какойметодкакие образцы выбрать, какой методкакиеобразцывыбрать,какойметод; интерпретировать конкретные данные, если вы пришлёте частоты/таблицы/плоты.