БИОФИЗИКА, 2020, том 65, № 2, с. 276-279
МОЛЕКУЛЯРНАЯ БИОФИЗИКА
УДК 519.876.5
СЛЕДЫ ЭКОЛОГИЧЕСКОЙ АДАПТАЦИИ
В ГЕНОМАХ СТАРОМЕСТНЫХ СОРТОВ НУТА
© 2020 г. А.Б. Соколкова*, П.Л. Чанг**, Н. Карраскила-Гарсия**, Н.В. Нуждина***,
Д.Р. Кук**, С.В. Нуждин*, ****, М.Г. Самсонова*
*Санкт-Петербургский политехнический университет Петра Великого,
195251, Санкт-Петербург, Политехническая ул., 29
**Факультет патологии растений Калифорнийского университета в Дэвисе,
Дэвис, Калифорния 95616 США
***Факультет географии Калифорнийского университета в Лос-Анджелесе,
Лос-Анджелес, Калифорния 90095 США
****Университет Южной Калифорнии, CA 90089, Лос-Анджелес, США
E-mail: m.samsonova@spbstu.ru
Поступила в редакцию 04.12.2019 г.
После доработки 04.12.2019 г.
Принята к публикации 22.01.2020 г.
Банк семян Всероссийского института генетических ресурсов растений имени Н.И. Вавилова
(ВИР) содержит многочисленные местные сорта, собранные почти сто лет назад, которые могут не-
сти следы естественного отбора, действовавшего в ходе диверсификации сельскохозяйственных
культур. В работе проведен анализ 407 местных сортов, собранных из основных исторических цен-
тров выращивания нута и вторичной диверсификации. Предложена гипотеза о том, что некоторые
однонуклеотидные полиморфизмы связаны с сильным отбором к условиям окружающей среды, ко-
торые испытывал нут при одомашнивании и последующем географическом распространении. С
помощью пакета BayPass определены 13 полиморфизмов, которые группируются по условиям сре-
ды и являются сильными кандидатами как маркеры локальной адаптации.
Ключевые слова: нут, биоклиматический анализ, генотипирование путем секвенирования, однонуклео-
тидные полиморфизмы, неравновесное сцепление.
DOI: 10.31857/S0006302920020088
которого в России в настоящее время быстро рас-
В начале ХХ века (1911-1940) под руковод-
ством Н.И. Вавилова были предприняты систе-
тет. Изначально нут был одомашнен примерно
матические усилия по сбору и сохранению разно-
10 тыс. лет назад в регионе Плодородного полу-
образия культур, хранящихся в настоящее время
месяца (Ближний Восток) и затем распростра-
в коллекции Всероссийского института генетиче-
нился в Индию (~6000 лет назад), а также в Эфи-
ских ресурсов растений имени Н.И. Вавилова
опию и Северную Африку (~3000 лет назад) [3]. В
(ВИР) в Санкт-Петербурге [1]. Географический
ходе вторичной диверсификации нут стали куль-
разброс и генетическое разнообразие большин-
тивировать в ряде новых сред, климатических
ства культур, собранных в тот период, вероятно,
условий и методов выращивания, что, по всей ви-
должны отражать исторические условия их выра-
щивания, сложившиеся в предшествующие тыся-
димости, стало возможным благодаря селекции
челетия. Особенно интересной представляется
сегрегирующих в популяции мутаций или воз-
возможность идентифицировать следы в геноме
никновению новых мутаций. Для проверки дан-
исторического отбора на адаптацию к разнооб-
ной гипотезы были использованы методы
разным условиям окружающей среды [2].
биогеографии, геномики и вычислительной био-
В работе исследована такая возможность на
логии, с помощью которых были идентифициро-
данных для нута (Cicer arietinum), выращивание ваны конкретные гаплотипы, потенциально реа-
гирующие на отбор. Полученные результаты мо-
Сокращения: ОНП - однонуклеотидные полиморфизмы,
гут быть использованы в будущем для улучшения
SMS - оценка синтетической морфологии (Synthetic Mor-
phology Score), BF - фактор Байеса (Bayes factor).
сельскохозяйственных культур.
276
СЛЕДЫ ЭКОЛОГИЧЕСКОЙ АДАПТАЦИИ
277
Таблица 1. Список биоклиматических ковариат и их сокращенные обозначения
Биоклиматическая ковариата
Сокращение
Среднегодовая температура, °C * 10
BIO1
Средняя разница между максимальной и минимальной
BIO2
температурами/день , °C * 10
Изотермальность, %
BIO3
Температурная сезонность, стандартное отклонение *100
BIO4
Макс. температура самого теплого месяца, °C * 10
BIO5
Мин. температура самого холодного месяца, °C * 10
BIO6
Среднегодовой диапазон температуры, °C * 10
BIO7
Средняя температура самого влажного квартала, °C * 10
BIO8
Средняя температура самого теплого квартала, °C * 10
BIO10
Средняя температура самого холодного влажного квартала, °C * 10
BIO11
Осадки за год, мм
BIO12
Осадки самого влажного месяца, мм
BIO13
Осадки самого сухого месяца, мм
BIO14
Сезонность осадков, мм
BIO15
Осадки самого влажного квартала, мм
BIO16
Осадки самого сухого квартала, мм
BIO17
Осадки самого теплого квартала, мм
BIO18
Осадки самого холодного квартала, мм
BIO19
Цифровая модель рельефа, м
DEM
МАТЕРИАЛЫ И МЕТОДЫ
генетических маркеров, связанных с биоклима-
тическими переменными, специфичными для
Генетический материал и геномные данные.
конкретной местности. Для каждой биоклимати-
Данные были получены из растений, произрас-
ческой переменной (см. табл. 1) вычислялись
тавших в таких странах, как Эфиопия, Ливан,
Марокко, Турция, Индия и в более широких ре-
средние значения отдельно для каждой из шести
географически различных групп. Поскольку мно-
гионах Центральной Азии и Средиземноморья.
Данные генотипирования путем секвенирования
гие биоклиматические переменные сильно кор-
и однонуклеотидные полиморфизмы (ОНП) бы-
релированы, средние значения каждой из пяти
ли взяты из работы [4]. Все данные Illumina до-
групп сильно коррелированных переменных за-
ступны в базе данных Национального центра
меняли оценкой синтетической морфологии
биотехнологий, код BioProject PRJNA388691.
(Synthetic Morphology Score, SMS), которая явля-
ОНП были выделены с использованием GATK
ется первой главной компонентой данных
pipeline [5] и далее отфильтрованы с помощью
(табл. 2). Три биоклиматические переменные не
VCFtools [6]. 2579 ОНП прошли все фильтры,
были сильно коррелированы с любыми другими
407 образцов остались для дальнейшего анализа.
переменными, поэтому их средние значения ис-
Генетический и биоклиматический анализ. Па-
пользовались в анализе без преобразований. Та-
кет BayPass [7] был применен для идентификации ким образом, были построены восемь перемен-
Таблица 2. Оценки синтетической морфологии, высчитанные на основании биоклиматических ковариат
Оценки синтетической морфологии
Биоклиматические переменные
SMS1
BIO1, BIO3, BIO6, BIO8, BIO11, BIO15
SMS2
BIO12, BIO13, BIO16, BIO18
SMS3
BIO5, BIO10
БИОФИЗИКА том 65
№ 2
2020
278
СОКОЛКОВА и др.
Ковариаты биоклиматических признаков, BF
BF(dB)
36
0
7
28
14
21
28
35
20
42
49
56
63
12
>63
8
4
0
1
2
3
4
5
6
7
8
Номер хромосомы
Анализ ассоциаций с помощью BayPass. ОНП со значением BF > 15 показаны треугольниками. Когда одна позиция
ассоциируется с рядом биоклиматических ковариат с разным BF, представлен только наиболее значимый ОНП. Вни-
зу манхэттенского графика показана плотность распределения ОНП вдоль хромосом.
ных для исследования ассоциации с генетически-
фологии (табл. 1 и 2) и три усредненные некорре-
ми признаками с помощью BayPass. Анализ
лированные ковариаты (BIO2_av, BIO19_av,
проводили в предположении о независимости пе-
DEM_av). Каждая SMS представляет собой ли-
ременных. Каждый ОНП оценивали с помощью
нейную комбинацию усредненных значений кор-
алгоритма выборки по значимости [7], который
релированных биоклиматических ковариат, ко-
вычисляет значение фактора Байеса (Bayes Fac-
торая имеет максимально возможную дисперсию.
tor, BF), эмпирическое значение P-value и соот-
SMS1, SMS3 и SMS5 соответствуют биоклимати-
ветствующие регрессионные коэффициенты. Ас-
ческим ковариатам температуры, тогда как SMS2
социации считались значимыми при эмпириче-
и SMS4 соответствуют биоклиматическим пере-
ском значении P-value больше четырех. Чтобы
менным осадков. Для оценки значимости ассо-
количественно оценить силу ассоциации ОНП с
циации были использованы следующие крите-
переменными, была использована шкала оценки
рии: эмпирическое байесовское P-value больше
фактора в соответствии с правилом Джеффриса
четырех и (согласно правилу Джеффриса [8])
[8]: «очень убедительное доказательство» при
BF > 15.
15 < BF < 20 и «решающее доказательство» при
Анализ ассоциаций с помощью BayPass вы-
BF > 20. Манхэттенские графики были выполне-
явил тринадцать ОНП, достоверно связанных с
ны в R с использованием библиотеки CMplot [9].
ковариатами (рис. 1). Восемь ОНП на хромосоме
1 и один ОНП на хромосоме 2 были связаны с пе-
РЕЗУЛЬТАТЫ
ременной BIO2_av, представляющей среднюю
разницу между максимальной и минимальной
407 образцов были разделены на шесть отдель-
температурами в один день. Эти восемь ОНП на
ных групп, отражающих географическое положе-
хромосоме 1 локализованы в области длиной
ние: Эфиопия («ETHI»), Индия («IND»), Ливан
115 т.п.н. с сильным неравновесным сцеплением.
(«LEB»), Марокко («MOR»), Турция («TUR») и
Только один ОНП был связан с SMS5 (Ca4:
Центральная Азия («UZB»). Тест Манна-Уит-
30608189). SMS4 ассоциирован с двумя ОНП на
ни-Уилкоксона [10] использовали для выявле-
хромосоме 1 (Ca1: 23621481) и хромосоме 3 (Ca3:
ния различий между группами по каждой био-
36690022). Переменные SMS1 и SMS3, которые
климатической ковариате.
включают температурные характеристики, были
Был проведен анализ ассоциаций найденных
совместно ассоциированы с одним ОНП на хро-
ранее 2579 ОНП с градиентами окружающей сре-
мосоме 8 (Ca8: 10314452).
ды, с использованием пакета BayPass [7]. Этот па-
кет может идентифицировать генетические мар-
керы, связанные с популяционными переменны-
ЗАКЛЮЧЕНИЕ
ми, такими как биоклиматические переменные в
местах сбора. В соответствии с рекомендациями
В течение многих тысячелетий фермеры и се-
авторов пакета BayPass для каждой из шести гео-
лекционеры занимались отбором культур с жела-
графически различных групп были построены во-
емыми фенотипами [11]. Объединяя экологиче-
семь ковариат: пять оценок синтетической мор-
ские и геномные данные, теперь можно иденти-
БИОФИЗИКА том 65
№ 2
2020
СЛЕДЫ ЭКОЛОГИЧЕСКОЙ АДАПТАЦИИ
279
фицировать гаплотипы, отобранные местными
СПИСОК ЛИТЕРАТУРЫ
фермерами. В этой работе мы идентифицировали
13 однонуклеотидных полиморфизмов, ассоции-
1. М. А. Вишнякова, М. О. Бурляева, С. В. Булынцев
рованных с биоклиматическими переменными в
и др., С.-х. биология 52 (5), 976 (2017).
местах сбора образцов и маркирующих районы
2. E. Plekhanova, M. A. Vishnyakova, S. Bulyntsev, et al.,
генома, которые по всей видимости испытали
Sci. Rep. 7, 4816 (2017).
действие отбора, направленного на адаптацию к
региональным условиям выращивания при вто-
3. R. J. Redden and J. D. Berger, in Chickpea Breeding &
ричной диверсификации.
Management, Ed. by S. S. Yadav, R. Redden, W. Chen,
and B. Sharma (CABI, Wallingford, UK, 2007), pp. 1-13.
ФИНАНСИРОВАНИЕ РАБОТЫ
4. E. J. von Wettberg, P. L. Chang, A. Greenspan, et al.,
Биоклиматический и биогеографический ана-
Nature Comm.
9, Art. Nu.
649
(2018). doi:
лизы, а также анализ с помощью BayPass были
10.1038/s41467-018-02867-z.
выполнены при финансовой поддержке Россий-
ского научного фонда (грант
№ 16-16-00007
5. A. McKenna, M. Hanna, E. Banks, et al., Genome
(АБС, СВН, МГС)). Работа была также поддержа-
Res. 20, 1297 (2010).
на соглашением о сотрудничестве от Агентства
США по международному развитию в рамках
6. P. Danecek, A. Auton, G. Abecasis, et al., Bioinfor-
программы «Накорми будущее» AID-OAA-A-14-
matics 27, 2156 (2011).
00008 (ДРК, ПЛЧ, СВН), Фондом Зумберджа
7. M. Gautier, Genetics 201, 1555 (2015).
(СВН) и грантом IOS-1339346 от Программы ге-
нома растений Национального научного фонда
8. H. Jeffreys, Theory of Probability, 3rd ed. (Oxford Univ.
США (ДРК).
Press, Oxford, 1961).
9. CMplot:
Circle
Manhattan
Plot.
URL:
КОНФЛИКТ ИНТЕРЕСОВ
https://github.com/YinLiLin/R-CMplot
[Accessed:
Авторы заявляют об отсутствии конфликта
20th June 2018].
интересов.
10. H. B. Mann and D. R. Whitney, Ann. Math. Statistics
18 (1), 50 (1947).
СОБЛЮДЕНИЕ ЭТИЧЕСКИХ СТАНДАРТОВ
11. N. Maxted, M. E. Dulloo, and B. V. Ford-Lloyd, En-
Настоящая работа не содержит описания
hancing crop genepool use: capturing wild relative and
каких-либо исследований с использованием
landrace diversity for crop improvement (CABI, Oxford-
людей и животных в качестве объектов.
shire, UK, 2016).
Signatures of Ecological Adaptation in Genomes of Chickpea Landraces
A.B. Sokolkova*, P.L. Chang**, N. Carrasquila-Garcia**, N.V. Nuzhdina***, D.R. Cook**,
S.V. Nuzhdin*, ****, and M.G. Samsonova*
*Peter the Great St. Petersburg Polytechnic University, ul. Polytekhnicheskaya 29, St. Petersburg, 195251 Russia
**Faculty of Plant Pathology, University of California, Davis, CA 95616, USA
***Faculty of Geography, University of California, Los Angeles, CA 90095, USA
****University of Southern California, Los Angeles, CA 90089, USA
The seed bank of N.I. Vavilov All Russian Institute of Plant Genetic Resources (VIR) contains a wide range
of landraces, collected almost one hundred years ago, in which natural selection might leave signatures
through crop diversification. In this study, we analysed 407 landraces, sampled at centres of the chickpea or-
igin and at sites of secondary diversity. We hypothesize that a fraction of single nucleotide polymorphisms
might have exhibited strong selection to a range of environmental conditions that chickpea experienced
during domestication and subsequent geographic distribution. Applying BayPass package we identified
13 polymorphisms; they assort by environmental conditions and are strong local adaptation candidates.
Keywords: chickpea, bioclimatic analysis, sequencing genotyping, single nucleotide polymorphisms, linkage dis-
equilibrium
БИОФИЗИКА том 65
№ 2
2020