Генетика, 2022, T. 58, № 3, стр. 299-310

Сравнительный анализ последовательностей генов транскрипционных факторов liguleless1 и liguleless1-like у образцов теосинте и современной кукурузы

М. А. Филюшин 1*, Э. Б. Хатефов 2, Е. З. Кочиева 1, А. В. Щенникова 1

1 Федеральный исследовательский центр “Фундаментальные основы биотехнологии” Российской академии наук
119071 Москва, Россия

2 Федеральный исследовательский центр Всероссийский институт генетических ресурсов растений им. Н.И. Вавилова
190000 Санкт-Петербург, Россия

* E-mail: michel7753@mail.ru

Поступила в редакцию 29.06.2021
После доработки 29.07.2021
Принята к публикации 30.09.2021

Полный текст (PDF)

Аннотация

Наиболее важным морфологическим признаком, определяющим архитектуру растения кукурузы, является угол наклона листа, который зависит от наличия и степени развитости структур язычка и ушка в месте отхождения листа от стебля. В данной работе у образцов двух теосинте (parviglumis и mexicana) и 37 инбредных линий современной кукурузы проведен анализ последовательностей гена liguleless1 и его паралога liguleless1-like, кодирующих транскрипционные факторы семейства SQUAMOSA PROMOTER-BINDING PROTEIN-LIKE, участвующие в формировании язычка и ушка листа. У теосинте parviglumis и линий кукурузы в геноме идентифицировано по два паралога – ZmLg1 и ZmLg1-like, а у теосинте mexicana – только ZmLg1-like. Белки ZmLg1 и ZmLg1-like имеют высокое структурное сходство (гомология 75–76%). При этом промоторы генов ZmLg1 и ZmLg1-like значительно различаются (сходство 3%), в том числе составом и количеством cis-регуляторных элементов. На основе полученных данных сформулировано несколько гипотез происхождения генов ZmLg1 и ZmLg1-like в геноме современной кукурузы.

Ключевые слова: кукуруза, теосинте parviglumis, теосинте mexicana, liguleless1, liguleless1-like.

Кукуруза (Zea mays ssp. mays) – одна из наиболее экономически значимых зерновых культур в мире, с ежегодным валовым сбором зерна более 1.1 млрд т (http://www.fao.org/). Повышение урожайности кукурузы является важнейшей задачей, так как она является, помимо пищевого продукта, сырьем для производства масла, этанола, биотоплива и других продуктов, спрос на которые увеличивается с каждым годом [1]. Возникновение кукурузы на юго-западе Мексики считается результатом одомашнивания и последующей селекции ее из равнинного теосинте (дикорастущего малозерного предшественника кукурузы) – однолетнего подвида кукурузы Z. mays ssp. parviglumis (далее parviglumis), в период приблизительно 6–9 тыс. лет назад [2, 3]. Распространение зоны возделывания в высокогорные районы Центральной Мексики сопровождалось интрогрессией в геном кукурузы генетического материала эндемичного высокогорного теосинте подвида Z. mays ssp. mexicana (далее mexicana), что, как считается, способствовало адаптации к температурным условиям высокогорья [4]. Анализ геномов современных генотипов кукурузы показал, что до 10% их генома происходит от теосинте mexicana [5].

Доместикация кукурузы привела к значительным изменениям морфологии растения, в том числе пространственной структуры надземной части растения, которая имеет решающее значение для получения урожая зерна и биомассы [6]. Наиболее важным признаком, определяющим архитектуру побегов, является наклон листа – угол между центральной жилкой листа и стеблем; чем меньше угол наклона, тем ближе лист к стеблю [7, 8]. У фенотипов с малым углом наклона уменьшается степень затенения нижних листовых ярусов и увеличивается урожайность благодаря повышенному фотосинтезу и возможности более плотной посадки [8, 9].

Угол наклона листа определяется наличием и степенью развития двух структур – язычка (лигулы, ligule) и ушка (auricle) [10]. Язычок представляет собой тонкий пленчатый отросток в месте соединения листовой пластины и черешка, а ушко – расширенную нижнюю часть листовой пластины. Данные структуры характерны для большинства Poaceae. Генетические исследования представителей Мятликовых показали, что формирование и степень развитости язычка и ушка контролируются целым рядом качественных и количественных генов и локусов [8, 1117]. Наибольшее количество работ сфокусировано на исследовании данного вопроса у кукурузы. С помощью мутагенеза были выявлены влияющие на формирование язычка и ушка в листе кукурузы гены liguleless1 (ZmLg1) [18], liguleless2 (ZmLg2) [19], liguleless3 (ZmLg3) [20] и liguleless4 (ZmLg4) [21].

У кукурузы наиболее изучен гомолог Lg1ZmLg1 [9, 2225]. Считается, что именно гену ZmLg1 принадлежит ключевая роль в формировании язычка и ушка листьев кукурузы. У генотипов кукурузы, гомозиготных по рецессивным аллелям гена ZmLg1 (lg1/lg1), язычок и ушко не формируются, в результате чего образуется острый угол между листом и стеблем [18]. Такой же эффект вызывает выключение гена ZmLg1 методом геномного редактирования [26]. Ген ZmLg1 (Zm00001d002005; хромосома 2) кодирует транскрипционный фактор (ТФ) семейства SQUAMOSA PROMOTER-BINDING PROTEIN-LIKE (SPL) [18]. При аннотации генома кукурузы сорта B73 на хромосоме 10 идентифицирован ген ZmLg1-like (Zm00001d026491), гомологичный ZmLg1. Ранее данный ген кукурузы не изучался. Целью работы стала идентификация генов ZmLg1 и ZmLg1-like у теосинте parviglumis и их сравнительный анализ с гомологичными последовательностями у образцов современной кукурузы Z. mays ssp. mays и теосинте mexicana.

МАТЕРИАЛЫ И МЕТОДЫ

В работе использовали семена образца теосинте parviglumis, любезно предоставленные ВИГРР им. Н.И. Вавилова (кат. № 350984; собраны в 1983 г.). Из ткани семян выделяли геномную ДНК (DNeasy Plant Mini Kit, Qiagen, Германия). Полногеномные последовательности генов ZmLg1 и ZmLg1-like амплифицировали с помощью ПЦР с разработанными нами праймерами ZmLg1F/R (5'-ATCGATCGAGATATCGTGTCA-3'/5'-TGTGGAGCACTTAAATGGCT-3') и ZmLg1-likeF/R (5'-CCGATCGATCCATCGAACAT-3'/5'-TATGTCCACATTACAGCAATGG-3'). ПЦР-продукты ожидаемой длины (~3500 пн) вырезали из агарозного геля, очищали с помощью набора Zymoclean Gel DNA Recovery Kit (Zymo Research, США) и клонировали в плазмидный вектор pAL2-T (Quick-TA kit, Евроген, Россия). Полученные клоны (по 5 для каждого гена) секвенировали на ABI Prism 3700 DNA Analyzer (ЦКП Биоинженерия, ФИЦ Биотехнологии РАН) с использованием стандартных праймеров M13F/M13R и разработанных нами праймеров ZmLg1in1F/ZmLg1-like_in1F (5'-GCTTTCCTCTGGATACGTG-3'/5'-TGACTTTGC- TGGTCAGCTG-3'; специфичны для секвенирования экзона II ZmLg1 и ZmLg1-like соответственно).

Для сравнительного анализа проводили поиск полногеномных последовательностей генов ZmLg1 и ZmLg1-like у всех обнаруженных в базе данных NCBI образцов кукурузы (37 инбредных линий) и теосинте mexicana (табл. 1). Официальные сведения о наклоне листа и особенностях развития язычка и ушка у данных линий отсутствуют. В качестве референса для поиска использовали кодирующие последовательности генов ZmLg1 и ZmLg1-like инбредной линии B73 (NM_001112073.2 и XM_008665460.2 соответственно). Для каждого анализируемого образца кукурузы, теосинте и видов Poaceae извлекали промоторные области ZmLg1 и ZmLg1-like (1000 пн перед старт-кодоном), которые сравнивали между собой (референс – соответствующие последовательности B73) и (только для кукурузы и теосинте) анализировали на присутствие cis-активных элементов (PlantCare; http://bioinformatics.psb.ugent.be/webtools/plantcare/html/) и сайтов связывания с ТФ (PlantPan 3.0; http://plantpan.itps.ncku.edu.tw/).

Таблица 1.

Характеристика последовательностей гомологов генов ZmLg1 и ZmLg1-like у различных генотипов кукурузы Z. mays

Образец кукурузы Гомологи ZmLg1 (Zm00001d002005) Гомологи ZmLg1-like (Zm00001d026491)
локализация в геноме длина гена, пн CDS, пн белок, ао MW, кДа pI локализация в геноме длина гена, пн CDS, пн белок, ао MW, кДа pI
parviglumis Н/д* Н/д* 1206 401 43.57 7.46 Н/д* Н/д* 1203 400 43.82 7.79
mexicana Ген не найден chr10:34 597 319–34 601 159 3841 1212 403 44.04 7.80
B73 chr2:4 493 647–4 496 920 3274 1200 399 43.35 7.45 chr10:148 507 874–148 511 109 3236 1191 396 43.27 7.81
B73-Ab10 chr2:4 249 889–4 253 162 3274 1200 399 43.35 7.45 chr10:164 907 841–164 911 259 3419 1206 401 43.86 7.49
B97 chr2:4 213 309–4 216 617 3309 1200 399 43.37 7.44 chr10:147 024 826–147 028 111 3286 1209 402 43.95 7.80
CML52 chr2:3 980 668–3 983 983 3316 1209 402 43.75 7.47 chr10:148 829 300–148 832 749 3450 1200 399 43.65 7.80
CML69 chr2:4 079 294–4 082 620 3327 1209 402 43.49 7.45 chr10:148 729 500–148 732 816 3317 1197 398 43.53 7.80
CML103 chr2:4 366 280–4 369 577 3298 1206 401 43.48 7.44 chr10:147 075 013–147 078 334 3322 1197 398 43.53 7.80
CML228 chr2:4 454 729–4 457 904 3176 1212 403 43.73 7.46 chr10:147 382 245–147 385 590 3346 1221 406 44.32 7.79
CML247 chr2:4 582 220–4 585 535 3316 1209 402 43.50 7.45 chr10:151 772 499–151 776 255 3757 1200 399 43.68 7.80
CML277 chr2:4 177 735–4 181 035 3301 1212 403 43.75 7.45 chr10:147 396 760–147 400 045 3286 1206 401 43.78 7.80
CML322 chr2:4 563 046–4 566 403 3358 1209 402 43.60 7.46 chr10:147 548 375–147 551 697 3323 1197 398 43.53 7.80
CML333 chr2:4 387 804–4 391 195 3392 1209 402 43.74 7.47 chr10:147 901 197–147 904 529 3333 1200 399 43.68 7.80
DK105 chr2:4 643 039–4 646 353 3315 1200 399 43.37 7.44 chr10:150 411 177–150 414 478 3302 1209 402 43.93 7.80
EP1 chr2:4 959 714–4 963 054 3341 1209 402 43.74 7.46 chr10:163 552 267–163 555 847 3581 1206 401 43.80 7.80
F7 chr2:4 704 491–4 707 761 3271 1200 399 43.36 7.45 chr10:156 425 981–156 429 296 3316 1209 402 43.93 7.80
Hp301 chr2:4 356 128–4 359 426 3299 1206 401 43.60 7.47 chr10:146 490 517–146 493 776 3260 1200 399 43.64 7.80
Ia453-sh2 chr2:4 394 324–4 397 606 3283 1209 402 43.62 7.76 chr10:146 739 469–146 742 803 3335 1209 402 43.94 7.80
Il14H chr2:4 097 534–4 100 848 3315 1209 402 43.67 7.47 chr10:147 833 571–147 836 901 3331 1209 402 43.94 7.80
K0326Y chr2:4 189 752–4 193 022 3271 1200 399 43.36 7.45 chr10:145 991 404–145 994 721 3318 1209 402 43.93 7.80
Ki3 chr2:4 350 050–4 353 377 3328 1212 403 43.79 7.46 chr10:146 914 251–146 917 574 3324 1197 398 43.53 7.80
Ki11 chr2:5 009 105–5 012 432 3328 1212 403 43.79 7.46 chr10:149 071 502–149 074 805 3304 1200 399 43.62 7.47
Ky21 chr2:4 319 378–4 322 666 3289 1206 401 43.58 7.46 chr10:148 144 209–148 147 446 3238 1191 396 43.27 7.81
LH244 chr2:4 113 643–4 116 916 3274 1200 399 43.36 7.45 chr10:151 923 475–151 926 847 3373 1218 405 44.17 7.79
M37W chr2:4 323 888–4 327 085 3198 1212 403 43.87 7.80 chr10:149 857 104–149 860 423 3320 1209 402 43.93 7.80
M162W chr2:4 265 554–4 268 849 3296 1215 404 43.74 7.46 chr10:149 384 070–149 387 384 3315 1200 399 43.65 7.80
Mo17 chr2:4 190 797–4 194 086 3290 1212 403 43.71 7.46 chr10:145 210 045–145 213 339 3295 1215 404 44.14 7.79
Mo18W chr2:4 828 299–4 831 572 3274 1209 402 43.71 7.46 chr10:144 981 265–144 984 531 3267 1197 398 43.49 7.80
MS71 chr2:4 365 848–4 369 132 3285 1209 402 43.62 7.79 chr10:144 795 916–144 800 431 4516 1209 402 43.93 7.80
NC350 chr2:4 616 702–4 619 999 3298 1209 402 43.58 7.45 chr10:151 139 554–151 142 885 3332 1197 398 43.49 7.80
NC358 chr2:4 467 285–4 470 600 3316 1209 402 43.50 7.45 chr10:151 353 526–151 356 849 3324 1212 403 44.07 7.79
Oh7B chr2:4 186 176–4 189 485 3310 1197 398 43.24 7.45 chr10:104 891 174–104 894 510 3337 1215 404 44.17 7.49
Oh43 chr2:5 127 313–5 130 618 3306 1209 402 43.62 7.45 chr10:147 853 527–147 856 789 3263 1200 399 43.64 7.80
P39 chr2:4 602 718–4 605 988 3271 1200 399 43.37 7.45 chr10:144 392 125–144 395 385 3261 1209 402 43.94 7.80
PE0075 chr2:4 739 618–4 742 912 3295 1203 400 43.41 7.79 chr10:150 702 174–150 705 508 3335 1206 401 43.80 7.80
Tx303 chr2:4 136 317–4 139 588 3272 1197 398 43.26 7.79 chr10:148 695 524–148 698 798 3275 1200 399 43.62 7.80
Tzi8 chr2:4 462 263–4 465 547 3285 1209 402 43.62 7.79 chr10:150 481 622–150 492 005 10384 1212 403 44.08 7.49
W22 chr2:4 218 612–4 221 922 3311 1200 399 43.37 7.44 chr10:144 969 220–144 972 565 3346 1200 399 43.66 7.49
Zm00056a chr2:4 309 882–4 313 177 3296 1212 403 43.74 7.46 chr10:149 808 710–149 812 006 3297 1209 402 43.90 7.80

* Н/д – нет данных, так как были секвенированы только экзоны.

Структурный и филогенетический анализ последовательностей проводили в программе MEGA 7.0 (https://www.megasoftware.net/). Консервативные домены и мотивы в белках определяли с помощью NCBI-CDD (http://www.ncbi.nlm.nih.gov/Structure/ cdd/wrpsb.cgi) и MEME 5.3.3 (http://meme-suite.org/ tools/meme; параметры поиска: максимальное число мотивов – 15, минимальная длина – 6, максимальная длина – 300).

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Структурная характеристика гомологов генов ZmLg1 и ZmLg1-like у образцов кукурузы

В геномах 37 образцов инбредных линий кукурузы, доступных в базе данных NCBI, были определены последовательности, гомологичные генам ZmLg1 (Zm00001d002005) и ZmLg1-like (Zm00001d026491) (табл. 1). Последовательности ZmLg1 и ZmLg1-like у образцов кукурузы локализовались на хромосомах 2 и 10 соответственно.

В геноме теосинте mexicana нами был идентифицирован только гомолог гена ZmLg1-like, также расположенный на хромосоме 10. В отличие от теосинте mexicana у теосинте parviglumis удалось амплифицировать, клонировать и секвенировать кодирующие последовательности обоих генов ZmLg1 и ZmLg1-like (табл. 1). Поскольку 10% генома современной кукурузы является результатом интрогрессии генетического материала теосинте mexicana [4, 5], можно предположить, что хотя инбредные линии кукурузы унаследовали ген ZmLg1 однозначно от теосинте parviglumis, происхождение ZmLg1-like может быть связано как с parviglumis, так и с mexicana.Кроме того, это предполагает более недавнее возникновение ZmLg1 в сравнении с ZmLg1-like, возможно, в результате дупликации ZmLg1-like.

Сравнение генов ZmLg1 и ZmLg1-like друг с другом выявило значительные различия, что допускает наличие функциональной диверсификации данных паралогов. Было определено, что длина гена ZmLg1 у анализируемых образцов кукурузы варьирует от 3176 (CML228) до 3392 пн (CML333), а гена ZmLg1-like – от 3236 (B73) до 10384 пн (Tzi8). Оба гена содержат три экзона, при этом первый и второй экзоны разделены протяженным интроном I размером ~1860 пн (гомологи ZmLg1) и ~1950 пн (ZmLg1-like; кроме Tzi8, 8912 пн). Проведенный анализ интрона I линии Tzi8 в программе NCBI blastn выявил фрагменты, гомологичные ретротранспозону cin4 (Y00086.1). Длина интрона II составила 212–230 пн (ZmLg1) и 255–260 пн (ZmLg1-like; кроме MS71, 1458 пн, за счет вставки, гомологичной транспозону Dissociation, JF421358.1).

Размер кодирующей последовательности ZmLg1 и ZmLg1-like варьирует как у теосинте parviglumis и mexicana, так и у генотипов современной кукурузы от 1191 до 1218 пн (табл. 1). Вариабельность кДНК ZmLg1 и ZmLg1-like внутри группы анализируемых генотипов кукурузы и в сравнении с теосинте составляет 2.67 и 2.77% соответственно. Сравнение кДНК ZmLg1 линий кукурузы и теосинте parviglumis выявило шесть однонуклеотидных полиморфных сайтов (SNP в положениях 513, 519, 522, 583, 594 и 603 по референсу B73). кДНК ZmLg1-like кукурузы и теосинте parviglumis были одинаковы и отличались от кДНК ZmLg1-like теосинте mexicana по двум SNP (в положениях 876 и 999 по референсу B73).

Последовательности предполагаемых ТФ ZmLg1 и ZmLg1-like у образцов 37 линий кукурузы сходны между собой на 75–76% и имеют в своем составе консервативный SBP-домен (pfam03110), идентичный на 96% (три полиморфных сайта).

Домен SBP ZmLg1 35 образцов (за исключением линии CML277) кукурузы инвариантен, а у образцов теосинте parviglumis и линии CML277 – содержит по одному замещению ао (S195G и H222Q соответственно) (рис. 1). Во внедоменных областях ZmLg1 выявлено 11 вариабельных сайтов (3.16% от выровненной длины) (рис. 1).

Рис. 1.

Последовательности белков Lg1-like и Lg1 образцов кукурузы Z. mays ssp. mays cv. B73 (B73), Z. mays ssp. parviglumis (parviglumis), Z. mays ssp. mexicana (mexicana) и гомологов Lg1/Lg1-like сорго (S. bicolor; XM_002447206.2), проса (P. hallii; XM_025968913.1), риса (O. sativa; XM_015778551.2) и ячменя (H. vulgare; chr2HLR890097.1: 629754948–629758561). Последовательность домена SBP выделена красной рамкой; темно-синим фоном указаны высококонсервативные остатки аминокислот.

Последовательность SBP-домена ZmLg1-like у анализируемых образцов кукурузы также была инвариантна, а во внедоменных областях выявлено 15 полиморфных сайтов (3.67% от выровненной длины) (рис. 1). Домен SBP ZmLg1-like теосинте parviglumis и mexicana не имеет специфичных замещений в сравнении с ZmLg1-like образцов кукурузы. Между собой гомологи ZmLg1-like теосинте parviglumis и mexicana различаются пятью вариабельными сайтами, не обладающими специфичностью для того или другого теосинте и встречающимися во внедоменных последовательностях ZmLg1-like анализируемых образцов кукурузы (рис. 1).

Высокий консерватизм ДНК-связывающего SBP-домена у паралогов ZmLg1 и ZmLg1-like предполагает сохранение функции данных ТФ в отношении связывания с промоторами генов-мишеней. В то же время отдельные замещения и индели во внедоменных областях паралогов (рис. 1) могут оказывать влияние на пространственную структуру белков, их связывание с белковыми партнерами, а также на способность активировать/репрессировать транскрипцию генов-мишеней.

Интересно, что поиск гомологичных ZmLg1/ ZmLg1-like последовательностей в геномах других диплоидных видов Poaceae (Aegilops tauschii, Brachipodium distachyon, Hordeum vulgare, виды Oryza, Panicum hallii, Phyllostachis praecox, Sorgum bicolor, Setaria italica, Setari aviridis) обнаружил присутствие не двух, а только одного гомолога. В случае полиплоидных видов Poaceae показано присутствие двух и более гомологов, в зависимости от числа субгеномов. Так, каждый из субгеномов тетраплоидных видов Triticum dicoccoides [27] и Panicum virgatum [28], а также гексаплоидного вида Triticum aestivum [29] содержит по одному гомологу ZmLg1/ZmLg1-like. В то же время из четырех субгеномов октаплоидного Saccharum spontaneum [30] только в трех присутствует по одной гомологичной последовательности ZmLg1/ZmLg1-like. Таким образом, только в геномах современной кукурузы и ее предшественника теосинте parviglumis присутствуют оба паралога ZmLg1 и ZmLg1-like.

Проведенное сравнение белковых последовательностей гомологов Lg1/Lg1-like видов Poaceae с паралогами ZmLg1 и ZmLg1-like кукурузы и теосинте показало, что данные гомологи ближе несколько к ZmLg1 (идентичность 66.8–84.5%), чем к ZmLg1-like (64.9–78.6%). Это предполагает более недавнее возникновение ZmLg1-like в сравнении с ZmLg1 и то, что теосинте mexicana после события дупликации гена-предшественника мог потерять паралогичный ген ZmLg1.

На рис. 1 приведено выравнивание последовательностей кодируемых белков ZmLg1 и ZmLg1-like линии B73, теосинте parviglumis и mexicana (только ZmLg1-like) и гомологов Lg1/Lg1-like сорго (S. bicolor), проса (P. hallii), риса (O. sativa) и ячменя (H. vulgare). Последовательность домена SBP ZmLg1 линии B73, теосинте parviglumis, S. bicolor, P. hallii и O. sativa одинакова и отличается от SBP Lg1/Lg1-like H. vulgare одним замещением ао, что снова подтверждает консервативность функции ДНК-связывания данных ТФ.

Все найденные последовательности Lg1/Lg1-like были использованы для консенсусного и филогенетического анализов (рис. 2). Было показано, что профиль консервативных мотивов, характерный для Lg1/Lg1-like образцов кукурузы, теосинте и других видов Poaceae, относящихся к подсемействам из сестринских клад (BOP и PACMAD), имеет только одно отличие – расположение мотива 13 [L(Q/V)S(H/A)(H/P)G(F/T)(P/T)FH(S/Q)] (рис. 2,б). Данный консенсус присутствует у Lg1 ближе к N‑концу, а у Lg1-like – к С-концу, за исключением мотива 13 Lg1/Lg1-like Ph. praecox (рис. 2,б), однако в данном случае нельзя исключать неправильную/ошибочную сборку гена. В целом консенсусный профиль гомологов Lg1/Lg1-like видов Poaceae оказывается ближе к профилю ZmLg1-like, но не ZmLg1.

Рис. 2.

Филогенетический и структурный анализы белков Lg1 и Lg1-like кукурузы и других представителей Poaceae. а – филогения видов Poaceаe на основе последовательностей белков Lg1 (выделены зеленым шрифтом) и Lg1-like (выделены синим шрифтом) образцов кукурузы Z. mays ssp. mays (Zm), теосинте Z. mays ssp. parviglumis (parviglumis) и теосинте Z. mays ssp. mexicana (mexicana), а также гомологичных белков SBP8 других представителей Poaceae: Aegilops tauschii (XM_020336542.2), Brachypodium distachyon (XM_010242245.3), Hordeum vulgare (chr2H LR890097.1: 629754948–629758561), Oryza brachyantha (XM_006652878), Oryza rufipogon (AB776992.1), Oryza sativa (XM_015778551.2), Panicum hallii (XM_025968913.1), Panicum virgatum (субгеном K (XM_039918410.1), субгеном N (XM_039965747.1)), Phyllostachys praecox (GEDH01023394), Saccharum spontaneum (субгеном A (QVOL01000017.1: 17014874–17018085), субгеном B (CM010700.1: 1718074–1925946), субгеном D (QVOL01000020.1: 5016041–5019243)), Setaria italica (XM_004960078.2), Setaria viridis (XM_034728245.1), Sorghum bicolor (XM_002447206.2), Triticum aestivum (субгеном A (CM022214.1: 778844152–778847881), субгеном B (CM022215.1: 760634885–760638727), субгеном D (CM022216.1: 640209793–640213448)), Triticum dicoccoides (субгеном A (XM_037623746.1), субгеном B (XM_037631654.1)). Дендрограмма построена методом Neghbor-Joining (модель JTT, 1000 бутстреп-реплик) в программе MEGA 7.0; б – консервативные мотивы, выявленные в анализируемых белках с помощью MEME5.3.3.

На основе аминокислотных последовательностей ZmLg1 и ZmLg1-like образцов кукурузы (B73, CML247, EP1, F7 и Mo17), теосинте parviglumis и mexicana и гомологов Lg1/Lg1-like других Poaceae была построена дендрограмма (рис. 2,а). Было показано формирование кластера, объединяющего два субкластера ZmLg1 и ZmLg1-like; субкластер ZmLg1-like имеет сестринскую группу гомологов Lg1/Lg1-like S. bicolor и S. spontaneum (рис. 2,а). Остальные гомологи Lg1/Lg1-like видов Poaceae составили второй кластер, имеющий базовое расположение по отношению к первому (рис. 2,а). В целом полученное разделение видов Poaceae соответствует их общепризнанной кластеризации [31]. Исходя из филогении, с большой долей уверенности можно сказать, что гомологи Lg1/Lg1-like Sorgum несколько ближе к ZmLg1-like, как и в случае консенсусного анализа.

Таким образом, несмотря на более высокий уровень идентичности последовательности гомологов Lg1/Lg1-like других Poaceae с ZmLg1, данные консенсусного и филогенетического анализов указывают на более недавнее происхождение гена ZmLg1 по отношению к ZmLg1-like в результате дупликации последнего в геноме теосинте parviglumis.

Сравнительный анализ промоторных участков гомологов генов ZmLg1 и ZmLg1-like у образцов кукурузы

С учетом полученных структурных данных можно предположить, что гомологи ZmLg1 и ZmLg1-like могут играть сходные роли в формировании язычка и ушка у Z. mays, по крайней мере связываясь с промоторами одних и тех же генов-мишеней. Однако функциональные различия могут определяться не только вариабельностью внедоменных областей данных белков, но и особенностями экспрессии генов ZmLg1 и ZmLg1-like, включая не только уровень транскрипции, но и ее включение/выключение в ответ на различные внешние и внутренние факторы.

Поэтому нами был проведен поиск cis-регуляторных элементов в промоторных областях гомологов генов ZmLg1 и ZmLg1-like. Из базы данных NCBI для всех анализируемых образцов кукурузы и теосинте были извлечены последовательности, гомологичные участку длиной 1000 пн до старт-кодона генов ZmLg1 и ZmLg1-like референсной линии B73. Их сравнительное выравнивание показало, что сходство промоторов между генотипами достаточно высоко и составляет 86–100% (ZmLg1) и 88–93% (ZmLg1-like).

Как между генами, так и внутри групп промоторы ZmLg1 и ZmLg1-like различаются составом и количеством регуляторных элементов (табл. 2). Промоторы обоих генов содержат целый ряд сайтов, ассоциированных с ответом на стресс и в меньшей степени на гормоны. Для промотора ZmLg1 специфичны элементы CAT-box, CCAAT-box, WRE3, MYB и TCCC-motif, а для промотора ZmLg1-like – box 4 и circadian (табл. 2).

Таблица 2.

Регуляторные элементы и их количество в промоторных областях (∼1000 пн) генов ZmLg1-like и ZmLg1 анализируемых генотипов кукурузы и теосинте

Примечание. Подчеркнуты элементы, специфичные для каждого из генов. * Последовательность не анализировалась из-за протяженной (1547 пн) вставки, гомологичной мобильному элементу ILS1 (U07956.1).

Из 16 типов элементов, присутствующих в промоторе гомологов ZmLg1, большинство относятся к STRE (различные типы стрессов; 167 сайтов), CAAT-box (энхансер транскрипции; 130) и Sp1 (световой стресс; 117) (табл. 2). Промоторы гомологов ZmLg1-like содержат 14 типов элементов, четыре из которых представлены избыточно – CAAT-box (энхансер транскрипции; 256), STRE (различные типы стрессов; 118), ABRE (ответ на абсцизовую кислоту; 116) и A-box (базовый регуляторный элемент; 111) (табл. 2). Учитывая свойства данных типов элементов, можно предположить, что оба гена достаточно активно вовлечены в ответ растения на различные стрессы (STRE). Еще один важный тип элементов – ARE (анаэробный стресс) присутствует в промоторах почти всех гомологов ZmLg1, а в случае ZmLg1-like – только у одного из анализируемых генотипов (Tx303). Действительно, показано, что ZmLg1 участвует в определении устойчивости кукурузы к фитофторозу, вызываемому грибковым возбудителем Setosphaeria turcica [23].

Инициация формирования язычка и ушка входит в программу развития морфологии листа и, скорее всего, не является результатом ответа растения на стресс. Поэтому в промоторах ZmLg1 и ZmLg1-like образца кукурузы B73 был проведен дополнительный поиск мотивов связывания с ТФ (табл. 3). Было обнаружено, что у обоих генов имеются сайты связывания ТФ 21 семейства, что предполагает широкий спектр регуляторных сетей, в которых могут быть задействованы ZmLg1 и ZmLg1-like. Наибольшее количество мотивов ассоциировано с ТФ семейств AP2/ERF, bHLH, GATA и SBP. Сайты связывания ТФ AP2/B3/RAV, CAMTA, E2F/DP и WRKY присутствуют только в промоторе ZmLg1, тогда как HD-ZIP и TBP – только в промоторе ZmLg1-like (табл. 3).

Таблица 3.

Количество найденных мотивов связывания различных семейств транскрипционных факторов в промоторных областях (∼1000 пн) генов ZmLg1 и ZmLg1-like (B73)

Семейство ТФ ZmLg1 ZmLg1-like
AP2/ERF 37 31
AP2; B3; RAV 7 0
ARF; B3 1 1
AT-Hook 1 5
bHLH 30 15
bZIP 11 19
C2H2 1 2
CAMTA 4 0
Dof 4 5
E2F/DP 2 0
EIL 7 2
GATA 41 25
GeBP 3 3
HD-ZIP 0 9
LBD 2 1
MYB-related 1 1
NAC 2 1
SBP 53 88
TALE 3 3
TBP 0 4
WRKY 8 0

Известно, что большинство ТФ WRKY участвуют в ответе растений на стрессы [32]. Отсутствие сайтов связывания с WRKY в промоторе ZmLg1-like свидетельствует о его возможной меньшей роли в ответе на стрессы в сравнении с ZmLg1. В подтверждение этому, в промоторе ZmLg1-like нет сайтов связывания с ТФ семейств AP2/B3/RAV и CAMTA, члены которых участвуют в реакции на абиотические стрессы (холод, обезвоживание, тепловой шок и механический стресс) и этилен, а также в репродуктивном развитии [32, 33]. С другой стороны, в промоторе ZmLg1-like специфически присутствуют сайты связывания ТФ семейства HD-ZIP, вовлеченные в ответ растения на стрессы и гормоны [34]. Можно предположить, что оба гена ZmLg1 и ZmLg1-like участвуют в ответе на стресс, используя при этом разные регуляторные элементы активации транскрипции.

Сходство последовательностей промоторов генов ZmLg1 и ZmLg1-like составило всего 3%. Однако был обнаружен высококонсервативный (сходство 96.7–100%)фрагмент длиной 62 пн в положении –163 (ZmLg1 B73) и –97 (ZmLg1-like B73). Анализ в PlantCare выявил в данном фрагменте два элемента типа A-box, которые являются базовыми регуляторными элементами, а также два элемента STRE, участвующих в ответах на стрессы.

Мы сравнили промоторы ZmLg1 и ZmLg1-like с аналогичными последовательностями гомологов Lg1/Lg1-like других видов Poaceae. Сходство (68%) было обнаружено только для промоторов ZmLg1 и Lg1/Lg1-like сорго (рис. 3), хотя на дендрограмме (рис. 2,а) Lg1/Lg1-like сорго кластеризуется с ZmLg1-like.

Рис. 3.

Филогения видов Poaceae на основе последовательностей промоторов (~1000 пн до старт-кодона) гомологов Lg1/Lg1-like.

Имеющиеся исследования свидетельствуют о вероятном сходстве роли гомологов Lg1 и Lg1-like в архитектуре листа видов Poaceae. Так, у кукурузы показана функция гена ZmLg1 в формировании язычка и ушка листьев [18, 26], а у T. aestivum и O. sativa – такая же роль генов-гомологов ZmLg1/ ZmLg1-like (вероятнее ZmLg1-like) – TaSPL8 и OsLG1 соответственно [11, 25, 35]. Это также предполагает избыточность функции паралогов ZmLg1-like и ZmLg1 у кукурузы и теосинте parviglumis.

Говоря о происхождении гомологов ZmLg1 и ZmLg1-like, можно предположить несколько гипотез: более недавнее происхождение ZmLg1 в сравнении с ZmLg1-like в результате дупликации последнего у теосинте parviglumis (1); дупликация гена-предшественника у общего предка теосинте mexicana и parviglumis и последующая потеря гена ZmLg1 у mexicana (2); появление двух паралогов гена у parviglumis в результате интрогрессии генетического материала из mexicana (3). Для правильных выводов, кроме биоинформационного анализа последовательностей Lg1/Lg1-like (включая промоторы), необходимо прямое клонирование и секвенирование данных генов у других видов Zea и близкородственных видов трибы Andropogoneae.

Как уже говорилось, гены ZmLg1 и ZmLg1-like кодируют ТФ семейства SPL. Данные гены являются одной из двух ключевых составляющих модуля miR156/SPL, который определяет многочисленные признаки роста и развития растения, включая зависящий от возраста регуляторный путь цветения [36, 37]. Однако анализ последовательностей генов ZmLg1 и ZmLg1-like (включая регуляторные области) показал, что они не содержат участков, комплементарных miR156. Это подтверждает ранее показанное отсутствие таких участков в ZmLG1 (ZmSBP15) [38] и предполагает отсутствие влияния ZmLg1 и ZmLg1-like на время цветения кукурузы.

Ранее с использованием метода геномного редактирования были получены линии кукурузы с мутациями в гене ZmLG1, которые изменяли угол наклона листа [39]. Данные мутации приводили к протяженным делециям в аминокислотной последовательности ZmLG1, но не к замещениям отдельных аминокислот [39]. Сведения о влиянии отдельных замещений аминокислот на фенотип наклона листа, которые могли бы быть использованы для сравнения с анализируемыми в данной работе последовательностями, отсутствуют.

Таким образом, в настоящей работе впервые были идентифицированы и охарактеризованы последовательности генов-паралогов ZmLg1 и ZmLg1-like, включая их промоторные области, у инбредных линий кукурузы и образцов теосинте. Проведенные структурный и литературный анализы позволили сделать выводы о возможных функциях паралогов: участие в определении угла наклона; ответ на стрессы; отсутствие влияния на время цветения кукурузы. Показано, что высокогомологичные гены ZmLg1 и ZmLg1-like значительно отличаются промоторной областью, в частности набором стресс-чувствительных cis-регуляторных элементов. Сходство белковых последовательностей предполагает сходную функцию ТФ ZmLg1 и ZmLg1-like, однако различия в регуляторных областях могут свидетельствовать о включении данной функции в ответ на разные внешние влияния. Также мы предполагаем, что с помощью различий в регуляции экспрессии двух паралогичных генов расширяется спектр ответа растения кукурузы на различные виды стресса.

Работа выполнена при финансовой поддержке гранта РНФ (№ 21-16-00008) и Министерства науки и высшего образования РФ.

Настоящая статья не содержит каких-либо исследований с использованием в качестве объекта животных.

Настоящая статья не содержит каких-либо исследований с участием в качестве объекта людей.

Авторы заявляют, что у них нет конфликта интересов.

Список литературы

  1. Duvick D.N., Smith J.S.C., Cooper M. Long-term selection in a commercial hybrid maize breeding program // Plant Breeding Reviews: Long-Term Selection: Crops, Animals, and Bacteria / Ed. Janick J. Oxford, UK: John Wiley & Sons, 2004. P. 109–151.

  2. Piperno D.R., Ranere A.J., Holst I. et al. Starch grain and phytolith evidence for early ninth millennium B.P. maize from the Central Balsas River Valley, Mexico // Proc. Natl Acad. Sci. USA. 2009. V. 106. P. 5019–5024. https://doi.org/10.1073/pnas.0812525106

  3. van Heerwaarden J., Doebley J., Briggs W.H. et al. Genetic signals of origin, spread, and introgression in a large sample of maize landraces // Proc. Natl Acad. Sci. USA. 2011. V. 108. P. 1088–1092. https://doi.org/10.1073/pnas.1013011108

  4. Gonzalez-Segovia E., Pérez-Limon S., Cíntora-Martínez G.C. et al. Characterization of introgression from the teosinte Zea mays ssp. mexicana to Mexican highland maize // PeerJ. 2019. V. 7. Article e6815. https://doi.org/10.7717/peerj.6815

  5. Yang N., Xu X.W., Wang R.R. et al. Contributions of Zea mays subspecies mexicana haplotypes to modern maize // Nature Commun. 2017. V. 8. Article 1874. https://doi.org/10.1038/s41467-017-02063-5

  6. Strable J. Developmental genetics of maize vegetative shoot architecture // Mol. Breeding. 2021. V. 41. Article 19. https://doi.org/10.1007/s11032-021-01208-1

  7. Lambert R.J., Johnson R.R. Leaf angle, tassel morphology, and the performance of maize hybrids // Crop Sci. 1978. V. 18. P. 499–502.

  8. Zhang N., Huang X. Mapping quantitative trait loci and predicting candidate genes for leaf angle in maize // PLoS One. 2021. V. 16. Article e0245129. https://doi.org/10.1371/journal.pone.0245129

  9. Yu Y. Liguleless1, a conserved gene regulating leaf angle and a target for yield improvement in wheat // Plant Physiol. 2019. V. 181(1). P. 4–5. https://doi.org/10.1104/pp.19.00872

  10. Buescher E.M., Moon J., Runkel A. et al. Natural variation at sympathy for the ligule controls penetrance of the semidominant Liguleless narrow-R mutation in Zea mays // G3 (Bethesda). 2014. V. 4. P. 2297–2306. https://doi.org/10.1534/g3.114.014183

  11. Dresvyannikova A.E., Watanabe N., Muterko A.F. et al. Characterization of a dominant mutation for the liguleless trait: Aegilops tauschii liguleless (Lgt) // BMC Plant Biol. 2019. V. 55. Article 19. https://doi.org/10.1186/s12870-019-1635-z

  12. Moon J., Candela H., Hake S. The Liguleless narrow mutation affects proximal-distal signaling and leaf growth // Development. 2013. V. 140. P. 405–412. https://doi.org/10.1242/dev.085787

  13. Wang R., Liu C., Chen Z. et al. Oryza sativa LIGULELESS 2s determine lamina joint positioning and differentiation by inhibiting auxin signaling // New Phytol. 2021. V. 229. P. 1832–1839. https://doi.org/10.1111/nph.16970

  14. Anderson A., St Aubin B., Abraham-Juárez M.J. et al. The second site modifier, sympathy for the ligule, encodes a homolog of Arabidopsis ENHANCED DISEASE RESISTANCE4 and rescues the Liguleless narrow maize mutant // Plant Cell. 2019. V. 31. P. 1829–1844. https://doi.org/10.1105/tpc.18.00840

  15. Okagaki R.J., Haaning A., Bilgic H. et al. ELIGULUM-A regulates lateral branch and leaf development in barley // Plant Physiol. 2018. V. 176. P. 2750–2760. https://doi.org/10.1104/pp.17.01459

  16. Ku L.X., Zhao W.M., Zhang J. et al. Quantitative trait loci mapping of leaf angle and leaf orientation value in maize (Zea mays L.) // Theor. Appl. Genet. 2010. V. 121. P. 951–959. https://doi.org/10.1007/s00122-010-1364-z

  17. Dzievit M.J., Li X., Yu J. Dissection of leaf angle variation in maize through genetic mapping and meta-analysis // Plant Genome. 2019. V. 12. Article 180024. https://doi.org/10.3835/plantgenome2018.05.0024

  18. Moreno M.A., Harper L.C., Krueger R.W. et al. Liguleless1 encodes a nuclear-localized protein required for induction of ligules and auricles during maize leaf organogenesis // Genes Dev. 1997. V. 11. P. 616–628. https://doi.org/10.1101/gad.11.5.616

  19. Walsh J., Waters C.A., Freeling M. The maize gene liguleless2 encodes a basic leucine zipper protein involved in the establishment of the leaf blade-sheath boundary // Genes Dev. 1998. V. 12. P. 208–218. https://doi.org/10.1101/gad.12.2.208

  20. Muehlbauer G.J., Fowler J.E., Freeling M. Sectors expressing the homeobox gene liguleless3 implicate a time-dependent mechanism for cell fate acquisition along the proximal-distal axis of the maize leaf // Development. 1997. V. 124. P. 5097–5106.

  21. Fowler J., Freeling M. Liguleless 4, a new dominant mutation that alters the sheath-blade boundary in maize leaves // MNL. 1991. V. 65. P. 30–31.

  22. Ren Z., Wu L., Ku L. et al. ZmILI1 regulates leaf angle by directly affecting liguleless1 expression in maize // Plant Biotechnol J. 2020. V. 18. P. 881–883. https://doi.org/10.1111/pbi.13255

  23. Kolkman J.M., Strable J., Harline K. et al. Maize introgression library provides evidence for the involvement of liguleless1 in resistance to northern leaf blight // G3 (Bethesda). 2020. V. 10. P. 3611–3622. https://doi.org/10.1534/g3.120.401500

  24. Johnston R., Wang M., Sun Q. et al. Transcriptomic analyses indicate that maize ligule development recapitulates gene expression patterns that occur during lateral organ initiation // Plant Cell. 2014. V. 26. P. 4718–4732. https://doi.org/10.1105/tpc.114.132688

  25. Lee J., Park J.J., Kim S.L. et al. Mutations in the rice liguleless gene result in a complete loss of the auricle, ligule, and laminar joint // Plant Mol. Biol. 2007. V. 65. P. 487–499. https://doi.org/10.1007/s11103-007-9196-1

  26. Li C., Liu C., Qi X. et al. RNA-guided Cas9 as an in vivo desired-target mutator in maize // Plant Biotechnol. J. 2017. V. 15. P. 1566–1576. https://doi.org/10.1111/pbi.12739

  27. Avni R., Nave M., Barad O. et al. Wild emmer genome architecture and diversity elucidate wheat evolution and domestication // Science. 2017. V. 357(6346). P. 93–97. https://doi.org/10.1126/science.aan0032

  28. Lovell J.T., MacQueen A.H., Mamidi S. et al. Genomic mechanisms of climate adaptation in polyploid bioenergy switchgrass // Nature. 2021. V. 590. P. 438–444. https://doi.org/10.1038/s41586-020-03127-1

  29. Zimin A.V., Puiu D., Hall R. et al. The first near-complete assembly of the hexaploid bread wheat genome, Triticum aestivum// Gigascience. 2017. V. 6. P. 1–7. https://doi.org/10.1093/gigascience/gix097

  30. Zhang J., Zhang X., Tang H. et al. Allele-defined genome of the autopolyploid sugarcane Saccharum spontaneum L. // Nat. Genet. 2018. V. 50. P. 1565–1573. https://doi.org/10.1038/s41588-018-0237-2

  31. Grass Phylogeny Working Group II. New grass phylogeny resolves deep evolutionary relationships and discovers C4 origins // New Phytol. 2012. V. 193. P. 304–312. https://doi.org/10.1111/j.1469-8137.2011.03972.x

  32. Yamasaki K., Kigawa T., Seki M. et al. DNA-binding domains of plant-specific transcription factors: structure, function, and evolution // Trends Plant Sci. 2013. V. 18. P. 267–276. https://doi.org/10.1016/j.tplants.2012.09.001

  33. Iqbal Z., Shariq Iqbal M., Singh S.P., Buaboocha T. Ca2+/Calmodulin complex triggers CAMTA transcriptional machinery under stress in plants: signaling cascade and molecular regulation // Front. Plant Sci. 2020. V. 11. Article 598327. https://doi.org/10.3389/fpls.2020.598327

  34. Gong S., Ding Y., Hu S. et al. The role of HD-Zip class I transcription factors in plant response to abiotic stresses // Physiol. Plant. 2019. V. 167. P. 516–525. https://doi.org/10.1111/ppl.12965

  35. Liu K., Cao J., Yu K. et al. Wheat TaSPL8 modulates leaf angle through auxin and brassinosteroid signaling // Plant Physiol. 2019. V. 181. P. 179–194. https://doi.org/10.1104/pp.19.00248

  36. Wu G., Poethig R.S. Temporal regulation of shoot development in Arabidopsis thaliana by miR156 and its target SPL3 // Development. 2006. V. 133. P. 3539–3547. https://doi.org/10.1242/dev.02521

  37. Wang H., Wang H. The miR156/SPL module, a regulatory hub and versatile toolbox, gears up crops for enhanced agronomic traits // Mol. Plant. 2015. V. 8. P. 677–688. https://doi.org/10.1016/j.molp.2015.01.008

  38. Wei H., Zhao Y., Xie Y., Wang H. Exploiting SPL genes to improve maize plant architecture tailored for high-density planting // J. Exp. Bot. 2018. V. 69(20). P. 4675–4688. https://doi.org/10.1093/jxb/ery258

  39. Li C., Liu C., Qi X. et al. RNA-guided Cas9 as an in vivo desired-target mutator in maize // Plant Biotechnol. J. 2017. V. 15(12). P. 1566–1576. https://doi.org/10.1111/pbi.12739

Дополнительные материалы отсутствуют.