Генетика, 2022, T. 58, № 4, стр. 470-474

Сигналы направленного отбора в популяциях коренного населения Сибири

Н. А. Колесников 1***, В. Н. Харьков 1, А. А. Зарубин 1, М. И. Воевода 2, М. А. Губина 3, О. В. Штыгашева 4, Н. Р. Максимова 5, А. Л. Сухомясова 5, В. А. Степанов 1

1 Научно-исследовательский институт медицинской генетики, Томский национальный исследовательский медицинский центр Российской академии наук
634050 Томск, Россия

2 Федеральный исследовательский центр фундаментальной и трансляционной медицины
630060 Новосибирск, Россия

3 Федеральный исследовательский центр Институт цитологии и генетики Сибирского отделения Российской академии наук
630090 Новосибирск, Россия

4 Хакасский государственный университет им. Н.Ф. Катанова
655000 Абакан, Россия

5 Северо-Восточный федеральный университет им. М.К. Аммосова
677000 Якутск, Россия

* E-mail: nikita.kolesnikov@medgenetics.ru
** E-mail: nik.fleming@mail.ru

Поступила в редакцию 12.08.2021
После доработки 14.10.2021
Принята к публикации 21.10.2021

Полный текст (PDF)

Аннотация

Популяции коренных этносов Сибири представляют значительный интерес для популяционной геномики по причине специфичности их генофондов, развивавшихся в различных генетико-демографических условиях. Данные о сигналах направленного отбора являются важным дополнением к существующим данным о эволюции генофондов и механизмах генетической адаптации населения Евразии. Мы использовали массив генотипов по 1 779 819 SNP в выборке из 477 человек, включающей 20 популяций коренного населения Сибири, для поиска сигналов направленного отбора с помощью теста на протяженную гомозиготность гаплотипов (nSL). Для популяций Сибири обнаружено, что все исследованные популяции сильно отличаются друг от друга по составу генов, которые демонстрируют влияние отбора. Наибольшее число значимых сигналов естественного отбора выявлено в популяциях хантов, коряков и чукчей. Среди локусов генома, несущих наиболее выраженные сигналы направленного отбора, в северных популяциях выделяются гены ADGRB3, ANO3, CDH13, CUEDC1, PCDH15.

Ключевые слова: популяционная генетика, Сибирь, естественный отбор, адаптация, nSL.

Генетическая структура коренного населения Сибири и Крайнего Севера сложилась под существенным влиянием естественного отбора, в наиболее неблагоприятных условиях среды обитания в арктическом климате Крайнего Cевера и резко континентальном умеренном климате Сибири и Дальнего Востока. Длительная эволюция генофонда различных популяций Сибири, в том числе приспособительная, могла привести, с одной стороны, к формированию устойчивых адаптивных комплексов, а с другой – к специфическому спектру заболеваний как моногенной, так и мультифакторной природы. Недавние исследования показывают, что генетические системы, связанные с устойчивостью к температурным шокам, жировым метаболизмом, тонусом сосудистого русла, изменением инфекционной нагрузки [14], могут играть существенную роль в адаптации к неблагоприятным или экстремальным климато-географическим условиям. Переход от охоты к животноводству, смена типа питания на фоне резкого роста численности популяций могли привести к изменению структуры генофонда популяций по различным генам, продукты которых участвуют в липидном обмене и усвоении различных продуктов.

При анализе древней ДНК в популяциях Европы было показано по каким генам и в каком направлении за последние 8 тыс. лет действовал естественный отбор. Культурные и социальные изменения в неолите сопровождались изменениями частоты аллелей, связанных с различными признаками. Под отбором находились аллели толерантности к лактозе, пигментации кожи и глаз, метаболизма, а также роста и веса [5]. Население Сибири все еще остается очень слабо изученным в отношении генетического разнообразия на полногеномном уровне. Мы предполагаем, что генетическая структура коренного населения Сибири сложилась под существенным влиянием генетического дрейфа на фоне резкого роста численности популяций, с одной стороны, и естественного отбора, сформировавшего устойчивые адаптивные генетические комплексы, с другой стороны. В совокупности с изоляцией расстоянием это привело к значительной генетической подразделенности населения Сибири.

Данные были получены с помощью биочипов “Infinium Multi-Ethnic Global-8 Kit”, содержащих 1 779 819 SNP. Популяции коренного населения Сибири (N = 477) представлены: алтайцами (Б – с. Бешпельтир Чемальского муниципального района, N = 24 и К – с. Кулада Онгудайского района, N = 25), бурятами (А – п. Агинское Агинского района, N = 23 и К – с. Курумкан Курумканского района, N = 28), калмыками (N = 29) (калмыки были собраны в Республике Калмыкия, но были включены в данную выборку, так как имеют центрально-азиатское происхождение и представляют южную часть этого региона), кетами (N = 15), коряками (N = 20), нивхами (N = 13), татарами (Т – г. Томск, N = 20), тувинцами (N = 28), удэгейцами (N = 15), хантами (К – с. Казым Белоярского района, N = 30 и Р – д. Русскинская Сургутского района, N = 26), хакасами (Т – сагайцами Таштыпского р-на, N = 29 и Ш – качинцами Ширинского р-на, N = 26), чукчами (N = 25), чулымцами (N = 22), эвенками (З – забайкальские (п. Чара Каларского района, с. Моклан и с. Тупик Тунгиро-Олёкминского района) N = 25 и Я – якутские, N = 28) и якутами (N = 26).

При биоинформатической обработке полученных данных из анализа были исключены SNP с более чем 10% отсутствующих генотипов. Были исключены все позиции делеций и инсерций. Данные были предварительно отфильтрованы по минимальной частоте редкого аллеля (MAF, minor allele frequency >0.01). В итоге после фильтрации исходных данных по 1 779 819 маркерам в финальный массив данных вошло 886 889 аутосомных SNP. Кроме этого, были исключены образцы, имеющие более 5% пропущенных SNP, а также метисы первого, второго и третьего поколений.

Поиск сигналов направленного отбора в популяциях Сибири на основе анализа данных по высокоплотному набору SNP проводили в пакете SelScan с помощью геномного теста на протяженную гомозиготность гаплотипов (nSL – number of Segregating sites by Length) [6]. Ожидаемая доля ложных отклонений FDR (False discovery rate) была больше или равна 0.05. Обогащенность биологических путей (по базе данных KEGG) генами под отбором была оценена с помощью ресурса webgestalt (WEB-based Gene SeT AnaLysis Toolkit).

Результаты поиска сигналов, сформированных под действием направленного отбора в изучаемых популяциях, с помощью теста nSL приведены в табл. 1. Всего было найдено 375 SNP (fdr ≥ 0.05), попадающих в функциональные участки 287 генов, и 271 SNP – на межгенные участки. Для каждой из популяций обнаружено от одного до 83 генов. Наибольшее число значимых сигналов естественного отбора выявлено в популяциях хантов, коряков и чукчей. Пять генов (ADGRB3, ANO3, CDH13, CUEDC1, PCDH15), имеющих сигналы направленного отбора, повторяются не более чем у трех популяций, 28 генов – у двух, а остальные являются уникальными для отдельных популяций.

Таблица 1.

Результаты поиска сигналов направленного отбора с помощью теста nSL

Популяция Гены с сигналами направленного отбора
Алтайцы (Б) ADCY1, DHX37, DYNC1H1, FOXP1, LINC00682, LINC02299, LOC101926960, MGLL, PDE10A, PPP2R2B, PTPRG, STK32B, SUCLG2-AS1
Алтайцы (К) ADGRB3, ARL15, C5orf66, CELF2, LINC01378, LINC01622, RAPGEF2, RBFOX1, RBMS3, SOX5
Буряты (А) STAG1
Буряты (К) GLO1, PCDH15, PLSCR1, PRR16, ST8SIA6, TNIK
Чукчи ACTA2, ADAMTS18, ANKRD60, CACNA2D3, CDCA7L, CDK5R2, CNTN5, FAM135B, FHIT, GABRG3, GMFG, HS1BP3-IT1, HYDIN, ITSN2, LOC100507283, MOBP, NALCN-AS1, NCALD, NLRP5, NRXN3, OPCML, PAPPA, PCLO, PDLIM5, PGR, PRKACB, SAR1A, SCUBE2, TDRP, TENM2, TMEM65, TNIK, TSBP1-AS1, VAV2, VSTM2A
Чулымцы ANKRD33B, CFAP299, DPP6, GRIA2, HLA-DQA1, LAMA1, LINC00473, LINC01435, LOC100128164, MEIS1, MIR646HG, MYH11, PREP, PTPRN2, RDH10-AS1, RGMB-AS1, SAMD7, SPATS2, STARD4-AS1, TMEM244, TMSB10, TMTC2, TSBP1-AS1, USH2A, XKR4, ZNF423
Эвенки (Я) ADGRB3, AUTS2, DOCK8, DPP6, GABRB3, GAP43, LINC02294, LINC02743, LOC101928855, MYO15B, NR5A2, NTF3, PTPRN2, TEC, TENT5A
Эвенки (З) ADH5, ANO3, FAM228B
Калмыки CUEDC1, ERC1, MGST3, ZNF407
Кеты LOC101928304, MCF2L2
Хакасы (Ш) ANO3, CCDC138, CDH13, CUEDC1, EDAR, LINC00974, LINC02568, PRKG2, STK32B
Хакасы (Т) AATK, CYP1B1-AS1, FOXP2, GRIK4, HLA-B, KIAA1324, LINC00448, LINC01630, LRP1B, MCPH1, MRC1, TMEM236, NCKAP5L, NCOA7-AS1, NRCAM, NTRK2, PALLD, PLD5, PPM1L, RARB, SDK2, ST6GALNAC1, TRPC6, UBB
Ханты (К) ARFGEF3, ATP2C1, BTBD9, CCDC33, CD226, CDH13, CSMD2, DGKH, DNAH11, EGFLAM, FAM135B, GAP43, GDI2, GRIN2B, HCG9, ITPR3, KCNAB1, KDM1B, LARGE1, LINC00473, LINC01006, LINC01339, LINC02147, LOC100507283, MAPRE2, PDZD2, PRIMA1, ROR1, RSPO4, SAA3P, SLC6A15, SMARCA2, SMOC1
Ханты (Р) ADGRA3, AFF3, ALX1, ANK1, ANKRD33B, APBA1, ATP4B, ATXN1, CCND2, CDH13, CDKAL1, CNIH3, CNTN3, CSMD2, CXADR, DCANP1, TIFAB, DDX55, DSCAM, EPHA6, ERC1, FARS2, FAT2, GAREM1, GATAD2A, GDPD5, GLT1D1, GNAL, KIF6, KSR2, LINC00929, LINC01088, LINC01339, LINC02006, LINC02147, LINC02618, LOC101927630, LOC101929595, LOC105370586, LOC105374428, LOC339862, LRFN2, LYRM4-AS1, MTCH1, MYOM1, NAV2, OR5D16, OSBPL6, PBX4, PCDH15, PGR, PIP4K2A, PLEC, PLXNA2, PPP1R16B, PPP2R5C, RASGRP3, RDH13, RFC1, RMND1, RNF7, ROBO2, RYR1, SAA3P, SDK1, SLC14A2, SLC35G2, SLC46A2, SLX4IP, SNAP25, SOX1-OT, ST18, STAG1, SUGP1, TAS1R2, TCERG1L, TCF7L1, TCF7L2, TM6SF2, TMEM163, TSHZ2, TSNAX-DISC1, WWOX
Коряки AGBL1, ATP8B1, CACNA2D3, CACNA2D3-AS1, CCDC169-SOHLH2, SOHLH2, CD96, CHI3L1, CLCN1, DOK7, FLJ22447, GACAT2, HDAC9, ITPR1, KCNAB1, LIMS1, LINC02542, LOC100507053, LOC105369911, LRRN2, MMP16, MREG, NLRP11, NRG1, OSTM1-AS1, PCDH15, PRKG1, SLC10A7, SLC16A12, SPIRE2, TMPRSS13, TNIP1, ZBED9
Нивхи HCG9, LRRC52-AS1, TMEM237
Татары (Т) ELMO1, LOC101927822
Тувинцы ADH5, ANO3, BCAR3, CUEDC1, LIMS1, LOC101927822, LYRM4-AS1, RARB, RBFOX1, SULT1C4
Удэгейцы HPSE, LOC101928764, RBMS3, ST8SIA1
Якуты ADGRB3, CRTAC1, GLI3, HECW2, LCORL, NTRK3, PRDM6, RHOJ, SMOC1

Из списка 287 генов, которые находятся в регионах генома, выявленных как мишени для направленного отбора по результатам тестов nSL, 84 по данным webgestalt оказались аннотированными по базе KEGG. 10 KEGG-путей были статистически значимы с учетом поправки Бенджамини–Хохберга (табл. 2), обогащены генами, находящимися под отбором. Основными молекулярными путями были пути, отвечающие за синаптическую пластичность: долговременная потенциация (LTD) и долговременная депрессия (LTP) – отвечающие за усиление или ослабление синаптической передачи между двумя нейронами, сохраняющееся на протяжении длительного времени после воздействия на синаптический проводящий путь, что обеспечивает нервную систему живого организма возможностью адаптироваться к изменяющимся условиям внешней среды. Также были отмечены пути дофаминергического и глутаматергического синапсов, передача сигналов ретроградного эндоканнабиноида, циркадный захват (отвечающий за синхронизацию эндокринных и поведенческих ритмов организма с сигналами окружающей среды), межклеточный щелевой контакт, обеспечивающий прямой перенос ионов и небольших молекул между соседними клетками, секреция слюны, регуляция липолиза в адипоцитах, сокращение гладкомышечных клеток сосудов.

Таблица 2.

Биологические пути (по базе данных KEGG), обогащенные сигналами естественного отбора

Набор генов Описание пути p Value FDR Гены
hsa04713 Циркадный захват 1.09E-06 3.6E-04 ADCY1, GRIA2, GRIN2B, ITPR1, ITPR3, PRKACB, PRKG1, PRKG2, RYR1
hsa04730 Долговременная депрессия 5.21E-05 8.4E-03 GRIA2, ITPR1, ITPR3, PRKG1, PRKG2, RYR1
hsa04720 Долговременная потенциация 9.75E-05 8.4E-03 ADCY1, GRIA2, GRIN2B, ITPR1, ITPR3, PRKACB
hsa04728 Дофаминергический синапс 1.03E-04 8.4E-03 GNAL, GRIA2, GRIN2B, ITPR1, ITPR3, PPP2R2B, PPP2R5C, PRKACB
hsa04723 Ретроградный эндоканнабиноидный сигнал 2.40E-04 1.5E-02 ADCY1, GABRB3, GABRG3, GRIA2, ITPR1, ITPR3, MGLL, PRKACB
hsa04724 Глутаматергический синапс 2.76E-04 1.5E-02 ADCY1, GRIA2, GRIK4, GRIN2B, ITPR1, ITPR3, PRKACB
hsa04923 Регуляция липолиза в адипоцитах 3.27E-04 1.5E-02 ADCY1, MGLL, PRKACB, PRKG1, PRKG2
hsa04270 Сокращение гладкомышечных клеток сосудов 3.97E-04 1.6E-02 ACTA2, ADCY1, ITPR1, ITPR3, MYH11, PRKACB, PRKG1
hsa04540 Щелевидное соединение 4.39E-04 1.6E-02 ADCY1, ITPR1, ITPR3, PRKACB, PRKG1, PRKG2
hsa04970 Секреция слюны 4.95E-04 1.6E-02 ADCY1, ITPR1, ITPR3, PRKACB, PRKG1, PRKG2

Определенные функциональные замены в ферментах ADH, которые вызывают различную эффективность превращения этанола в ацетальдегид, могут быть защитными. Goldman и Enoch [7] предположили, что генетические вариации в генах ALDH и ADH избирательно поддерживаются, и предложили две вероятные селективные силы: микотоксины и инфекционные заболевания. ADH5 участвует в механизме защиты от эндогенного формальдегида, детоксифицируя его, тем самым защищая клетку от этого генотоксина. В наших данных две популяции характеризуются высокими значениями теста nSL (эвенки (З), тувинцы) для kgp7824500, располагающегося в UTR3 гена ADH5, что также может быть связано с защитными функциями. Регион, в котором находится ADH5, ранее был отмечен как регион, находящийся под отбором у восточно-азиатских популяций [8].

В восточно-азиатском регионе одним из самых популярных кандидатов-участков является EDAR. Он кодирует белок, отвечающий за толщину волос и морфологию резцов, и неоднократно идентифицировался как кандидат на отбор у жителей Восточной Азии [810]. В нашем исследовании сигнал направленного отбора в этом гене, а также в близкорасположенном гене CCDC138 встречается в популяции хакасов-качинцев (Ш). Помимо этого рядом с EDAR располагается ген LIMS1, попадающий в один регион, находящийся под отбором у восточно-азиатских популяций [8]. Для популяций коряков, тувинцев наблюдаются высокие значения по гену LIMS1, белок которого участвует в регуляции выживаемости, пролиферации и дифференцировки клеток.

Ранее для коренного населения Сибири был обнаружен целый ряд генов, предположительно вовлеченных в процесс адаптации к холоду (THADA, ITPR3, GNGT1, PRKG1, RELN, CPT1A и LRP5) [3]. Среди них в наших популяциях сигналы направленного отбора встречаются у хантов (Р) – в гене ITPR3, играющем ключевую роль в экзокринной секреции, лежащей в основе энергетического метаболизма и роста, коряков – в гене PRKG1, отвечающем за сокращение гладкомышечных клеток сосудов.

Таким образом, показано, что все исследованные популяции сильно отличаются друг от друга по составу генов, которые демонстрируют влияние отбора. Наибольшее число значимых сигналов естественного отбора выявлено в популяциях хантов, коряков и чукчей. Среди локусов генома, несущих наиболее выраженные сигналы направленного отбора, в северных популяциях выделяются гены ADGRB3, ANO3, CDH13, CUEDC1, PCDH15. Различные комплексы генов демонстрируют вовлеченность в разные метаболические пути, отвечающие за синаптическую пластичность, межклеточный щелевой контакт, секрецию слюны, регуляцию липолиза в адипоцитах, сокращение гладкомышечных клеток сосудов.

В итоге было выявлено существенное число сигналов направленного естественного отбора, вероятно повлиявших на генетическую структуру популяции в процессе долговременной адаптации к климато-географическим условиям обитания в резко континентальном или арктическом климате.

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 19-34-90101.

Все процедуры, выполненные в исследовании с участием людей, соответствуют этическим стандартам институционального и/или национального комитета по исследовательской этике и Хельсинкской декларации 1964 г. и ее последующим изменениям или сопоставимым нормам этики.

От каждого из включенных в исследование участников было получено информированное добровольное согласие.

Авторы заявляют, что у них нет конфликта интересов.

Список литературы

  1. Степанов В.А., Харьков В.Н., Вагайцева К.В. и др. Сигналы направленного отбора в популяциях народов Сибири и европейской части России // Генетика. 2019. Т. 55. № 10. С. 1198–1207. https://doi.org/10.1134/S0016675819100126

  2. Hancock A.M., Alkorta-Aranburu G., Witonsky D.B., Di Rienzo A. Adaptations to new environments in humans: The role of subtle allele frequency shifts // Philosoph. Transactions Royal Soc. B: Biological Sci. 2010. V. 365. № 1552. P. 2459–2468. https://doi.org/10.1098/rstb.2010.0032

  3. Cardona A. Pagani L., Antao T. et al. Genome-wide analysis of cold adaptation in indigenous Siberian populations // PLoS One. 2014. V. 9. № 5. P. 98076. https://doi.org/10.1371/JOURNAL.PONE.0098076

  4. Чередниченко А.А., Трифонова Е.А., Вагайцева К.В. и др. Распространенность аллелей полиморфных вариантов генов, ассоциированных с иммунозависимыми заболеваниями, в популяциях Северной Евразии // Мол. биология. 2015. Т. 49. № 6. С. 984–992. https://doi.org/10.7868/S002689841506004X

  5. Mathieson I., Lazaridis I., Rohland N. et al. Genome-wide patterns of selection in 230 ancient Eurasians // Nature. 2015. V. 528. № 7583. P. 499–503. https://doi.org/10.1038/nature16152

  6. Szpiech Z.A., Hernandez R.D. Selscan: An efficient multithreaded program to perform EHH-based scans for positive selection // Mol. Biol. Evol. 2014. V. 31. № 10. P. 2824–2827. https://doi.org/10.1093/molbev/msu211

  7. Goldman D., Enoch M.A. Genetic epidemiology of ethanol metabolic enzymes: a role for selection // World Rev. Nutrition Dietetics. 1990. V. 63. P. 143–160.https://doi.org/10.1159/000418505

  8. Racimo F. Testing for ancient selection using cross-population allele frequency differentiation // Genetics. 2016. V. 202. № 2. P. 733–750. https://doi.org/10.1534/genetics.115.178095

  9. Sabeti P.C., Varilly P., Fry B. et al. Genome-wide detection and characterization of positive selection in human populations // Nature. 2007. V. 449. № 7164. P. 913–918. https://doi.org/10.1038/nature06250

  10. Grossman S.R., Shlyakhter I., Karlsson E.K. et al. A composite of multiple signals distinguishes causal variants in regions of positive selection // Science. 2010. V. 327. № 5967. P. 883–886. https://doi.org/10.1126/science.1183863

Дополнительные материалы отсутствуют.