БИОФИЗИКА, 2020, том 65, № 1, с. 206-208
ПИСЬМА В РЕДАКЦИЮ
УДК 519.876.5
ГЕНЕТИЧЕСКАЯ ИДЕНТИФИКАЦИЯ СОРТОВ СОИ
С ИСПОЛЬЗОВАНИЕМ ОДНОНУКЛЕОТИДНЫХ ПОЛИМОРФИЗМОВ
© 2020 г. М.В. Грецова, М.Г. Самсонова
Санкт-Петербургcкий политехнический университет Петpа Великого,
195251, Санкт-Петербург, Политехническая ул., 29
E-mail: m.samsonova@spbstu.ru
Поступила в редакцию 18.11.2019 г.
После доработки 18.11.2019 г.
Принята к публикации 22.11.2019 г.
Разработан метод паспортизации сортов сои на основе однонуклеотидных полиморфизмов. Гене-
тический алгоритм был использован для выбора оптимального набора, состоящeго из 28 однонук-
леотидных полиморфизмов, который затем был применен для паспортизации 243 сортов. Для всех
сортов получены уникальные сигнатуры однонуклеотидных полиморфизмов, отличающиеся от
сигнатур любого другого сорта хотя бы в трех позициях.
Ключевые слова: генетическая идентификация, однонуклеотидные полиморфизмы, соя.
DOI: 10.31857/S000630292001024X
ставляется разумным для каждого гаплоблока
Генетическая паспортизация является востре-
рассматривать не более одного ОНП.
бованным инструментом для защиты прав селек-
ционеров при регистрации, сертификации и ком-
Поиск набора ОНП был реализован для вы-
мерческом распространении сортов [1, 2]. На се-
борки из 243 сортов сои, состоящей из 110 образ-
годняшний день наиболее перспективными
цов коллекции Всероссийского института гене-
представляются методы паспортизации, исполь-
тических ресурсов растений им. Н.И. Вавилова и
зующие ДНК-сигнатуры на основе молекуляр-
133 образцов коллекции компании
«СоКо»
ных маркеров, таких как однонуклеотидные по-
(Краснодар). Ранее эти образцы были генотипи-
лиморфизмы (ОНП), микросателлитные после-
рованы по технологии GBS [7]. Были взяты следу-
довательности и другие [3-5]. Преимуществами
ющие критерии фильтрации ОНП: 1) ОНП долж-
ОНП по сравнению с остальными типами ДНК-
ны принадлежать гаплоблокам; 2) частота, с кото-
маркеров являются их высокая частота встречае-
рой ОНП находится в каждом из гомозиготных
мости в популяции, плотность и эволюционная
состояний, должна быть не менее 0.2 - этот кри-
стабильность, а также наличие широкого спектра
терий задает степень полиморфизма позиции, в
подходов для их выявления [6]. Сочетание значе-
которой регистрируется ОНП; 3) результирую-
ний ОНП, характерное для некоторого сорта, на-
щий набор не должен содержать двух ОНП, при-
зывается ОНП-сигнатурой этого сорта. Организ-
надлежащих одному гаплоблоку. Для подбора оп-
тимального набора ОНП использовался генети-
мы разных сортов отличаются друг от друга в
ческий алгоритм.
большом количестве позиций ДНК, поэтому ис-
пользовать все найденные ОНП для идентифика-
Среди всех найденных в результате генотипи-
ции сорта неудобно [6]. Так возникает задача по-
рования были выбраны 14745 ОНП, для которых
иска такого небольшого набора ОНП, с помощью
частота встречаемости в выборке сортов состав-
которого можно идентифицировать сорта. Как
ляла не менее 0.8. Поиск гаплоблоков для имею-
правило, набор ОНП для построения сигнатуры
щегося набора ОНП был реализован отдельно для
находится в результате фильтрации исходного
каждой хромосомы в программе Haploview [8].
набора ОНП, в соответствии с некоторым набо-
Были найдены
12729 ОНП, принадлежащих
ром критериев. При фильтрации необходимо
1947 гаплоблокам. После этого среди них были
учитывать степень гомозиготности ОНП. Кроме
отобраны 5718 ОНП, удовлетворяющие второму
того, поскольку ОНП искомого набора не долж-
критерию, - частота нахождения ОНП в каждом
ны сильно коррелировать друг с другом, пред-
из гомозиготных состояний должна составлять не
менее 0.2. Наконец, для каждого гаплоблока был
Сокращениe: ОНП - однонуклеотидные полиморфизмы.
выбран единственный ОНП, по которому разли-
206
ГЕНЕТИЧЕСКАЯ ИДЕНТИФИКАЦИИ СОРТОВ СОИ
207
Результат работы генетического алгоритма. (а) - Пример полученных ОНП-сигнатур для десяти сортов сои. Черным
и белым цветом обозначены гомозиготные состояния локусов, серым цветом обозначены гетерозиготные состояния
локусов. (б) - Распределение количества ОНП, по которым отличается пара сортов.
чается наибольшее количество сортов. Таким об-
Генетический алгоритм на 2000 поколений
разом, в результате фильтрации был получен на-
был запущен четыре раза. Для каждого сорта была
бор из 1332 ОНП.
найдена сигнатура, состоящая из 28 ОНП и отли-
чающаяся от сигнатуры любого другого сорта хо-
Для поиска оптимального набора ОНП был за-
пущен генетический алгоритм; в качестве инди-
тя бы в трех позициях (см. рисунок).
видуумов в генетическом алгоритме были взяты
наборы ОНП; каждый набор содержал от 20 до
40 ОНП так, что каждая хромосома сои была
ФИНАНСИРОВАНИЕ РАБОТЫ
представлена в индивидууме одним или двумя
ОНП. Начальная популяция, содержавшая
Работа выполнена в рамках Федеральной це-
1000 индивидуумов, была сгенерирована случай-
левой программы (проект
№14.575.21.0136 от
ным образом. Отбор индивидуумов для формиро-
26.09.2017, уникальный идентификатор проекта
вания следующего поколения проводили в соот-
RFMEFI57517X0136).
ветствии с функцией приспособленности инди-
видуума x:
БЛАГОДАРНОСТИ
d
ij
f x) = min
,
i,
jS
Вычисления были проведены в суперкомпью-
N
терном центре «Политехнический» CПбПУ и
где dij - расстояние между сортами i и j, которое
кластере Университета Южной Калифорнии.
измеряется как количество ОНП в наборе x, по
которым эти сорта различаются, т.е. находятся в
Авторы выражают благодарность А.А. Иголки-
противоположных гомозиготных состояниях,
ной за ценные советы, рекомендации и помощь
N - количество ОНП в наборе, S - множество
при выполнении исследования.
сортов. Каждое следующее поколение популяции
формировали из 500 наиболее приспособленных
индивидуумов и их 500 потомков, полученных в
КОНФЛИКТ ИНТЕРЕСОВ
результате скрещиваний так, чтобы в каждом по-
томке каждая хромосома была представлена од-
Авторы заявляют об отсутствии конфликта
ним или двумя ОНП.
интересов.
БИОФИЗИКА том 65
№ 1
2020
208
ГРЕЦОВА, САМСОНОВА
СОБЛЮДЕНИЕ ЭТИЧЕСКИХ СТАНДАРТОВ
3. M. W. Ganal, T. Altmann, and M. S. Röder, Curr.
Opin. Plant Biol. 12, 2 (2009).
Настоящая работа не содержит описания ка-
4. D. L. Hyten, Y. Zhu, P. B. Cregan, et al., Crop Sci. 50,
ких-либо исследований с использованием людей
5 (2010).
и животных в качестве объектов.
5. D. I. Pacurar, M. L. Pacurar, N. Street, el al., J. Exp.
Bot. 63, 7 (2012).
СПИСОК ЛИТЕРАТУРЫ
6. Y. Lee, N. Jeong, J. H. Kim, et al., Plant J. 81, 4 (2015).
1. M. Agarwal, N. Shrivastava, and H. Padh., Plant Cell
7. А. Канапин, А. Самсонова, А. Соколкова и др.,
Rep. 27, 617 (2008).
Биофизика (2020) (в печати).
2. N. K. Korir, J. Han, L. Shangguan, et al., Biotech. 33,
8. J. C. Barrett, B. Fry, J. Maller, and M. J. Daly, Bioin-
2 (2013).
formatics 21, 2 (2005). .
Genetic Identification of Soybean Varieties Using Single Nucleotide
Polymorphism Markers
M.V. Gretsova and M.G. Samsonova
Peter the Great St. Petersburg Polytechnic University, ul. Polytekhnicheskaya 29, St. Petersburg, 195251 Russia
The seed certification method for soybean varieties has been developed based on single nucleotide polymor-
phisms. The genetic algorithm was employed to find optimal set consisting of 28 single nucleotide polymor-
phisms, which was then used to certify 243 varieties. For all varieties, unique signatures of single nucleotide
polymorphisms were determined. The signatures which were different from those of any other varieties were
considered to be unique if they differed at least in three positions.
Keywords: genetic identification, single nucleotide polymorphisms, soybean
БИОФИЗИКА том 65
№ 1
2020