БИОФИЗИКА, 2021, том 66, № 3, с. 466-472
МОЛЕКУЛЯРНАЯ БИОФИЗИКА
УДК 519.876.5
ПОИСК АГРООСТРОВКОВ В ГЕНОМЕ НУТА
© 2021 г. А.Б. Соколкова*, С.В. Булынцев**, П.Л. Чанг***, Н. Карраскила-Гарсия***,
Д.Р. Кук***, Э. Веттберг****, М.А. Вишнякова*****, С.В. Нуждин*, ******, М.Г. Самсонова*
*Санкт-Петербургский политехнический университет Петра Великого,
195251, Санкт-Петербург, Политехническая ул., 29
**Кубанская опытная станция Федерального исследовательского центра «Всероссийский научно-исследовательский
институт растениеводства имени Н.И. Вавилова», 352183, Краснодарский край, п. Ботаника, Центральная ул., 2
***Калифорнийский университет в Дэвисе, 95616, Дэвис, США
****Университет Вермонта, 05405, Берлингтон, США
*****Федеральный исследовательский центр «Всероссийский научно-исследовательский институт
растениеводства имени Н.И. Вавилова», 190000, Санкт-Петербург, Большая Морская ул., 42-44
******Университет Южной Калифорнии, 90089, Лос-Анджелес, США
E-mail: m.samsonova@spbstu.ru
Поступила в редакцию 07.12.2020 г.
После доработки 07.12.2020 г.
Принята к публикации 25.12.2020 г.
Kонцентрация генов, контролирующих признаки доместикации в так называемых «островках одо-
машнивания, или агроостровках» затрудняет селекцию, поэтому информация о том, в каком месте
генома локализованы такие островки и с какими признаками доместикации они ассоциированы,
очень важна для дальнейших исследований, направленных на улучшение современных сортов. Для
получения информации о таких районах в геномах староместных сортов нута использована про-
грамма BayPass, которая оценивает ассоциацию однонуклеотидных полиморфизмов со специфич-
ными для популяций ковариатами, в качестве которых выбраны комплексы признаков синдрома
доместикации одинакового целевого назначения. Районы генома, с которыми эти ковариаты ассо-
циированы, локализуются на первой, пятой, шестой, седьмой и восьмой хромосомах. Эти области
являются потенциальными агроостровками, что косвенно подтверждается ранее полученными дан-
ными.
Ключевые слова: нут (Cicer arietinum L.), генотипирование путем секвенирования, однонуклеотидные
полиморфизмы, геномный анализ ассоциаций, адаптация.
DOI: 10.31857/S0006302921030066
ственные признаки, контролируемые большим
Окультуривание растений началось примерно
числом генов.
10000 лет назад и впоследствии независимо по-
вторялось во многих местах по всему миру. Этот
Таким образом, уже на начальных этапах се-
процесс включал выращивание и отбор растений
лекции, которые, по-видимому, были непреду-
мышленными, сильный отбор строго определен-
с более крупными съедобными частями и более
легким сбором урожая - признаками, которые
ных фенотипов должен был приводить к эффекту
бутылочного горлышка, т.е. к уменьшению гене-
позволяли производить излишки пищи. Такой
тического разнообразия в окультуриваемой попу-
комплeкс признаков, который принято называть
ляции за счет выбора только части аллелей генов
синдромом одомашнивания, часто перекрывает-
из генофонда диких видов [1]. Согласно совре-
ся у культур одинакового целевого назначения.
менным представлениям, окультуривание расте-
Так, например, у зернобобовых синдром одомаш-
ний происходило постепенно и обмен генами
нивания включает в себя более крупные семена,
между доместицируемыми и дикими формами
уменьшение их растрескиваемости и периода по-
все же был возможен в течение довольно длитель-
коя, а также изменение фенологии, т.е. количе-
ного времени [2], что приводило к гомогенизации
и препятствовало дивергенции окультуриваемых
Сокращения: ОНП - однонуклеотидные полиморфизмы,
и диких форм, в то время как селекция усиливала
SMS - оценка синтетической морфологии (Synthetic Mor-
phology Score), BF - фактор Байеса (Bayes Factor).
такую дивергенцию [3, 4].
466
ПОИСК АГРООСТРОВКОВ В ГЕНОМЕ НУТА
467
Наиболее вероятным результатом этих двух
Описание генотипирования путем секвениро-
разнонаправленных процессов может быть кон-
вания и отбора набора ОНП, использованных в
центрация генов, контролирующих признаки до-
данном исследовании, приведено в работе [7].
местикации на так называемых «островках одо-
Данные секвенирования доступны в базе данных
машнивания, или агроостровках», подобных
Национального центра биотехнологий, код Bio-
«островкам видообразования» комаров [5]. Эта
Project PRJNA388691. Поиск ОНП был произве-
гипотеза неявно исходит из соображения, что ге-
ден с помощью программы Genome Analysis Tool
ны синдрома одомашнивания с большей вероят-
Kit (GATK) [9], дальнейшая фильтрация ОНП
ностью сохранятся в популяции, несмотря на об-
была выполнена программой VCFtools [10]. Для
мен генами и рекомбинацию, если они находятся
анализа ассоциаций между фенотипическими
в неравновесном сцеплении и в одном или не-
признаками и ОНП были отобраны 2579 ОНП,
скольких местах в геноме. Сильная совместная
идентифицированных в 407 староместных образ-
локализация QTL, влияющих на несколько при-
цах нута.
знаков в нескольких регионах генома, обнару-
Анализ ассоциаций между фенотипическими
женная у многих культурных растений, убеди-
признаками и однонуклеотидными полиморфизма-
тельно подтверждает эту точку зрения [6].
ми. Для анализа ассоциаций между фенотипиче-
Нут - зернобобовое растение, используемое в
скими признаками и ОНП был применен пакет
качестве источника белка особенно широко в
BayPass [8]. Данный пакет может идентифициро-
странах Азии - не является исключением из этого
вать ОНП, связанные с фенотипическими при-
правила. Как показали наши исследования, неко-
знаками на уровне популяций. Для анализа были
торые гаплоблоки генома этого растения обога-
использованы 16 количественных фенотипиче-
щены однонуклеотидными полиморфизмами
ских признаков, оценка которых была произведе-
(ОНП), ассоциированными с признаками син-
на на Кубанской опытной станции ВИР в 2016 г.
дрома одомашнивания [7]. Хотя концентрация
(табл. 1). Описание фенотипирования, проведен-
генов окультуривания в агроостровках является
ного в 2016 г., приведено в работе [7]. Для каждого
результатом селекции, она часто препятствует
фенотипического признака вычисляли средние
дальнейшему улучшению растений, особенно в
значения отдельно для каждой из шести геогра-
случае, когда признаки отрицательно скоррели-
фически различных групп. По рекомендации ав-
рованы. Поэтому информация о том, в каком ме-
торов пакета BayPass [8] предварительно был про-
сте генома локализованы такие островки и с ка-
веден анализ корреляций между фенотипически-
ким комплексом признаков доместикации они
ми признаками. Коэффициенты корреляции
ассоциированы, очень важна для дальнейших ис-
Спирмена были рассчитаны с использованием
следований, направленных на улучшение совре-
функции «rcorr» из библиотеки «Hmisc» в R [11].
менных сортов.
Согласно результатам анализа корреляций, один-
Получить информацию о таких районах мож-
надцать признаков были отнесены к одной из че-
но с помощью программы BayPass [8], которая
тырех групп сильно коррелированных перемен-
оценивает ассоциацию однонуклеотидных поли-
ных. Средние значения каждой из этих четырех
морфизмов со специфичными для популяций ко-
групп заменялись оценкой синтетической мор-
вариатами, в качестве которых выбраны ком-
фологии (Synthetic Morphology Score, SMS), кото-
плексы признаков синдрома доместикации оди-
рая является первой главной компонентой дан-
накового целевого назначения. В этой работе мы
ных (табл. 2). Остальные пять фенотипических
применили BayPass к анализу шести популяций
переменных не были сильно коррелированы с
нута.
любыми другими переменными, поэтому их сред-
ние значения использовали в анализе без преоб-
разований. Таким образом, пакетом BayPass [8]
МАТЕРИАЛЫ И МЕТОДЫ
был проведен анализ ассоциаций между ОНП и
Генетический материал и геномные данные. Ге-
девятью ковариатами фенотипических призна-
нетический материал был получен из старомест-
ков. Анализ проводили в предположении о неза-
ных образцов нута коллекции ВИР, собранных из
висимости переменных. Каждый ОНП оценива-
основных исторических центров выращивания
ли с помощью алгоритма выборки по значимости
нута и его вторичной диверсификации: Эфио-
[8], который вычисляет значение фактора Байеса
пии, Ливана, Марокко, Турции, Индии и в более
(Bayes Factor, BF), эмпирическое значение
широких регионах Центральной Азии и Среди-
P-value и соответствующие регрессионные коэф-
земноморья. 407 образцов, использованных при
фициенты. Значимость ассоциации определяли
анализе, были разделены на шесть отдельных
по эмпирическому значению P-value (> 4), а силу
групп, отражающих географическое положение
ассоциации ОНП с переменными определяли по
мест сбора образцов: Эфиопия («ETHI»), Индия
шкале оценки фактора в соответствии с правилом
(«IND»), Ливан («LEB»), Марокко («MOR»), Тур-
Джеффриса [12]: «очень убедительное доказа-
ция («TUR») и Центральная Азия («C_ASIA»).
тельство» при 15 < BF < 20 и «решающее доказа-
БИОФИЗИКА том 66
№ 3
2021
468
СОКОЛКОВА и др.
Таблица 1. Фенотипические признаки, измеренные в 2016 г. на Кубанской опытной станции, отобранные для
анализа ассоциаций
Фенотипический признак
Единица измерения
Длительность цветения
сутки
Высота прикрепления нижнего боба
см
Время от посева до начала всходов
сутки
Длительность созревания
сутки
Время от начала всходов до начала цветения
сутки
Время от конца цветения до начала созревания
сутки
Масса 1000 семян
г
Ширина боба
мм
Длина боба
мм
Число семян с одного растения
шт
Число бобов с одного растения
шт
Вес семян с одного растения
г
Вес бобов
г
Высота растений
см
Вес растения без бобов
г
Вес всего растения (с бобами)
г
тельство» при BF > 20. Далее с помощью базы
которых была произведена на Кубанской опыт-
данных Legume information system [13] была про-
ной станции ВИР в 2016 г. (табл. 1). Для оценки
ведена аннотация значимо асоциированных по-
ассоциаций на уровне популяций 407 образцов,
лиморфизмов. Манхэттенские графики были вы-
использованных в анализе, были разделены на
полнены в R с использованием библиотеки CM-
шесть отдельных групп, отражающих географи-
plot [14].
ческое положение мест сбора образцов: Эфиопия
(«ETHI»), Индия («IND»), Ливан («LEB»), Ма-
рокко («MOR»), Турция («TUR») и Центральная
РЕЗУЛЬТАТЫ
Азия («C_ASIA») (рис. 1а).
Для анализа ассоциаций между ОНП и фено-
Для определения групп сильно коррелирован-
типическими ковариатами с учетом популяцион-
ных фенотипических признаков для 16 феноти-
ной структуры были использованы 16 количе-
пических признаков был проведен анализ корре-
ственных фенотипических признаков, оценка
ляций. Результаты анализа приведены на рис. 1б.
Таблица 2. Оценки синтетической морфологии фенотипических признаков
Оценка синтетической
Фенотипические признаки и коэффициенты корреляции между ними
морфологии (SMS)
SMS1
Количество дней цветения - количество дней от конца цветения до начала
созревания (r = -0.76*)
SMS2
Масса 1000 семян - ширина боба (r = 0.74*);
Масса 1000 семян - длина боба (r = 0.76*);
Ширина боба - длина боба (r = 0.86*)
SMS3
Число семян с одного растения - число бобов с одного растения (r = 0.85*);
Число семян с одного растения - вес семян с одного растения (r = 0.74*);
Число семян с одного растения - вес бобов (r = 0.60*);
Число бобов с одного растения - вес семян с одного растения (r = 0.82*);
Число бобов с одного растения - вес бобов (r = 0.77*);
Вес семян с одного растения - вес бобов (r = 0.88*)
SMS4
Вес растения без бобов - вес всего растения (с бобами) (r = 0.92*)
Примечание. * - p < 0.0001.
БИОФИЗИКА том 66
№ 3
2021
ПОИСК АГРООСТРОВКОВ В ГЕНОМЕ НУТА
469
Рис. 1. (а) - Географическое происхождение образцов и их отнесение к одной из шести географических групп; (б) -
результат анализа корреляций фенотипических признаков.
Одиннадцать признаков были отнесены к одной
Оценка синтетической морфологии SMS1 по-
из четырех групп сильно коррелированных пере-
лучена на основе двух последовательных вегета-
менных. В соответствии с рекомендациями авто-
ционных периодов, связанных сильной отрица-
ров пакета BayPass для каждой из шести геогра-
тельной корреляционной связью: количества
фически различных групп были построены де-
дней цветения и количества дней от конца цвете-
вять ковариат: четыре оценок синтетической
ния до начала созревания (табл. 2). Оценки син-
морфологии (SMS) (табл. 1 и 2) и пять усреднен-
тетической морфологии SMS2, SMS3 и SMS4 со-
ных некоррелированных ковариат.
ответствуют фенотипическим признакам, описы-
БИОФИЗИКА том 66
№ 3
2021
470
СОКОЛКОВА и др.
Рис. 2. Анализ ассоциаций с помощью BayPass. ОНП со значением фактора Байеса (BF) > 15 обозначены треугольниками.
Когда одна позиция ассоциируется с рядом фенотипических ковариат с разным BF, представлены все ассоциации.
вающим весовые характеристики растений,
исследованиях (исследованиях геномного анали-
бобов и семян, размеры бобов и количество бобов
за ассоциаций): ОНП значимо ассоциирован с
и семян с одного растения (табл. 2).
весовыми характеристиками растений при фено-
типировании на Кубани в 2016 г. [7], с периодом
Таким образом, с помощью программного па-
цветения на Кубани в 2017 г. [16]. Кроме того, в
кета BayPass [8] был проведен анализ ассоциаций
работе [17] при поиске программой BayPass [8]
между ОНП и девятью ковариатами фенотипиче-
ОНП, значимо ассоциированных с биоклимати-
ских признаков. Для оценки значимости ассоци-
ческими ковариатами в местах сбора образцов,
ации были использованы следующие критерии:
две биоклиматические переменные, включаю-
эмпирическое байесовское P-value > 4 и (соглас-
щие температурные характеристики, были сов-
но правилу Джеффриса [12]) фактор Байеса > 15.
местно ассоциированы с ОНП 8: 10314452. Также
данный ОНП находится на расстоянии ~25 кб от
Анализ ассоциаций с помощью BayPass [8] вы-
ОНП, ассоциированным с весом растения в рабо-
явил 14 ОНП, достоверно связанных с фенотипи-
те [18].
ческими ковариатами (рис. 2, табл. 3): семь ОНП
на первой хромосоме, два - на второй и по одно-
му ОНП на четвертой, пятой, шестой, седьмой и
ОБСУЖДЕНИЕ
восьмой хромосомах. Ранее нами в работе [7] был
проведен поиск блоков неравновесного сцепле-
Kонцентрация генов, контролирующих при-
ния (гаплоблоков), включающих в себя
2579
знаки доместикации в так называемых «остров-
ОНП, расположенных на хромосомах, с помо-
ках одомашнивания, или агроостровках» затруд-
щью программы Haploview [15]. Каждый гаплоб-
няет селекцию, поэтому информация о том, в ка-
лок рассматривался как набор ОНП, располо-
ком месте генома локализованы такие островки и
женных в данном гаплоблоке, и использовался
с какими признаками доместикации они ассоци-
для аннотации значимо асоциированных марке-
ированы, очень важна для дальнейших исследо-
ров. Также была проведена аннотация ОНП с по-
ваний, направленных на улучшение современных
мощью базы данных Legume information system
сортов. Получить информацию о таких районах
[13]. В результате два идентифицированных в
можно с помощью программы BayPass [2], кото-
анализе ОНП попадают в последовательность из-
рая оценивает ассоциацию ОНП со специфичны-
вестных генов и три ОНП входят в регионы не-
ми для популяций ковариатами, в качестве кото-
равновесного сцепления (табл. 3). Два ОНП (на
рых могут быть выбраны комплексы признаков
первой и пятой хромосомах) значимо ассоцииро-
синдрома доместикации одинакового целевого
ваны с двумя ковариатами - SMS3 и SMS4. ОНП
назначения. В этой работе мы применили BayPass
на восьмой хромосоме (8: 10314452) значимо ас-
к анализу шести популяций староместных сотров
социирован сразу с четырьмя фенотипическими
нута из коллекции ВИР. Фенотипические призна-
ковариатами - SMS1, SMS3, SMS4 и ковариатом
ки синдрома одомашнивания были сгруппирова-
высоты растений (табл. 3). Данный ОНП был
ны в пять групп разного целевого назначения -
идентифицирован нами и в предыдущих GWAS-
описывающие фенологию, вес семян, число семян
БИОФИЗИКА том 66
№ 3
2021
ПОИСК АГРООСТРОВКОВ В ГЕНОМЕ НУТА
471
Таблица 3. ОНП, выявленные по результатам анализа ассоциаций
между ОНП и девятью ковариатами
фенотипических признаков пакетом BayPass [4]
Блок неравновесного
Позиция
Хромосома
Признак
Ген
сцепления (гаплоблок)
SMS3
-
25737022
Ca_18581
SMS4
-
Средняя высота прикрепления
29930356
-
-
нижнего боба
Среднее время от начала всходов
33512355
-
-
1
до начала цветения
34754596
SMS4
-
Ca1_Block_36
35261112
SMS4
-
Ca1_Block_37
40608784
SMS4
-
-
Средняя высота прикрепления
44150305
-
-
нижнего боба
Средняя высота прикрепления
17432752
Ca_16006
-
нижнего боба
2
Средняя высота прикрепления
19604640
-
-
нижнего боба
Среднее время от начала всходов
38580554
4
-
Ca4_Block_61
до начала цветения
SMS3
-
-
12253018
5
SMS4
-
-
47657340
6
SMS4
-
-
19377547
7
SMS4
-
-
SMS1
-
-
SMS3
-
-
10314452
8
SMS4
-
-
Средняя высота растений
-
-
и характеристики растения. Районы генома, с ко-
КОНФЛИКТ ИНТЕРЕСОВ
торыми эти ковариаты ассоциированы, локали-
Авторы заявляют об отсутствии конфликта
зуются на первой, пятой, шестой, седьмой и вось-
интересов.
мой хромосомах. Эти области являются потенци-
альными агроостровками, что косвенно
подтверждается перекрыванием некоторых из
СОБЛЮДЕНИЕ ЭТИЧЕСКИХ НОРМ
идентифицированных районов с гаплоблоками,
Настоящая статья не содержит описания ка-
обогащенными ОНП. Интересно, что некоторые
ких-либо исследований с использованием людей
из этих районов совпадают также с районами, ас-
или животных в качестве объектов.
социированными с одиночными признаками при
проведении полногеномного поиска ассоциаций
СПИСОК ЛИТЕРАТУРЫ
в 2016 и 2017 гг. [7, 16], что является дополнитель-
ным указанием на правильность их классифика-
1. B. L. Gross and K. M. Olsen, Trends Plant Sci. 15, 529
ции как агроостровков.
(2010).
2. T. Pyhäjärvi, M. B. Hufford, S. Mezmouk, and J. Ross-
Ibarra, Genome Biol. Evol. 5, 1594 (2013).
ФИНАНСИРОВАНИЕ РАБОТЫ
3. L. A. F. Frantz, et al., Nat. Genet. 47, 1141 (2015).
4. S. Abbo and A. Gopher, Trends Plant Sci. 22 (6), 491
Работа выполнена при финансовой поддержке
(2017). DOI: 10.1016/j.tplants.2017.03.010
Российского научного фонда (грант № 16-16-
5. T. L. Turner, M. W. Hahn, and S. V. Nuzhdin, PLoS
00007).
Biol. 3, 1572 (2005).
БИОФИЗИКА том 66
№ 3
2021
472
СОКОЛКОВА и др.
6. R. Bohar, A. Chitkineni, and R. K. Varshney, Biotech-
12. H. Jeffreys, Theory of Probability, 3rd ed. (Oxford Univ.
niques 69 (3), 158 (2020). DOI: 10.2144/btn-2020-
Press, Oxford, 1961).
0066
13. S. Dash, J. D. Campbell, E. K. Cannon, et al., Nucl.
7. A. Sokolkova, et al., Int. J. Mol. Sci. 21, 3952 (2020).
Acids Res. 44, D1181 (2016).
8. M. Gautier, Genetics 201, 1555 (2015).
14. CMplot:
Circle
Manhattan
Plot.
URL
https://github.com/YinLiLin/RCMplot
(Accessed
9. A. McKenna, M. Hanna, E. Banks, et al., Genome
25th November, 2020).
Res. 20, 1297 (2010).
15. J. C. Barrett, B. Fry, J. Maller, and M. J. Daly, Bioin-
10. P. Danecek, A. Auton, G. Abecasis, et al., Bioinfor-
formatics 21, 263 (2005).
matics 27, 2156 (2011).
16. Соколкова А.Б. и др., Биофизика 66 (1), 40 (2021).
11. F. E. Harrell Jr, Hmisc: Harrell Miscellaneous. R pack-
age version
4.1-1
(2018). https://CRAN.R-proj-
17. Соколкова А.Б. и др., Биофизика 65 (2), 276 (2020).
ect.org/package=Hmisc (Accessed
20th October,
18. R. K. Varshney, M. Thudi, M. Roorkiwal, et al., Nat.
2020).
Genet. 51, 857 (2019). DOI: 10.1038/s41588-019-0401-3
Search for Agroislands in Chickpea Genome
A.B. Sokolkova*, S.V. Bulyntsev**, P.L. Chang***, N. Carrasquila-Garcia***, D.R. Cook***,
E. von Wettberg****, M.A. Vishnyakova*****, S.V. Nuzhdin*, ******, and M.G. Samsonova*
*Peter the Great St. Petersburg Polytechnic University, ul. Polytekhnicheskaya 29, St. Petersburg, 195251 Russia
**Kuban Experimental Station, Federal Research Center “Vavilov All-Russian Institute of Plant Genetic Resources”,
ul. Tsentralnaya 2, pos. Botanika, Krasnodar Region, 352183 Russia
***Faculty of Plant Pathology, University of California, Davis, CA 95616, USA
****University of Vermont, Burlington, Vermont, VT 05405, USA
*****Federal Research Center “N.I. Vavilov All-Russian Institute of Plant Genetic Resources”,
ul. Bolshaya Morskaya 42-44, St. Petersburg, 190000 Russia
******University of Southern California, Los Angeles, CA 90089, USA
The concentration of genes that control domestication traits in the so-called “agroislands” complicates se-
lection and, therefore, information about where such islands are located in the genome and with what traits
of domestication they are associated is very important for further research aimed at improving modern vari-
eties. To obtain information about such regions in the genomes of chickpea landraces, the BayPass program
was used to assess the association of single nucleotide polymorphisms with population-specific covariates, for
which complexes of the domestication syndrome traits of the same target purpose were selected. The regions
of the genome with which these covariates are associated are located on chromosomes 1, 5, 6, 7, and 8. These
regions are potential agroislands, which is indirectly confirmed by previously obtained data.
Keywords: chickpea (Cicer arietinum L.), genotyping by sequencing, single nucleotide polymorphisms, genomic
analysis of associations, adaptation
БИОФИЗИКА том 66
№ 3
2021