БИОХИМИЯ, 2020, том 85, вып. 7, с. 851 - 862
УДК 577.12
СПЛАЙСОСОМНЫЕ ИНТРОНЫ:
СВОЙСТВА, ФУНКЦИИ И ЭВОЛЮЦИЯ
Обзор
2,3,4
© 2020
И.В. Поверенная1,2*,
М.А. Ройтберг
1 Институт общей генетики им. Н.И. Вавилова РАН, 119991 Москва, Россия;
электронная почта: ipoverennaya@gmail.com
2 Институт математических проблем биологии РАН - филиал Института прикладной математики
им. М.В. Келдыша РАН, 142290 Пущино, Московская обл., Россия
3 Московский физико-технический институт (Национальный исследовательский университет),
141701 Долгопрудный, Московская обл., Россия
4 Национальный исследовательский университет «Высшая школа экономики», 101000 Москва, Россия
Поступила в редакцию 26.03.2020
После доработки 25.05.2020
Принята к публикации 25.05.2020
Для большинства эукариотических генов свойственны сплайсосомные интроны - некодирующие последо!
вательности, которые вырезаются из пре!мРНК генов с помощью специального комплекса сплайсосомы в
процессе сплайсинга мРНК. Интроны бывают как в белок!кодирующих, так и в РНК!кодирующих генах,
причем могут встречаться как в кодирующей области, так и в нетранслируемых областях генов. В связи с вы!
соким уровнем полиморфизма последовательности интронов крайне изменчивы, поэтому долгое время
функции интронов связывали только с альтернативным сплайсингом, а эволюцию интронов обычно рас!
сматривали не как эволюцию отдельной единицы генома, а в рамках эволюции экзон!интронной структу!
ры гена. В представленном обзоре рассмотрены теории происхождения интронов; эволюционные события
в экзон!интронной структуре, такие как приобретение, потеря и слайдинг (смещение) интронов; функции
интронов, известные к настоящему моменту; а также как изменение таких свойств интрона, как длина и фа!
за, могут влиять на регуляцию процессов с участием генов.
КЛЮЧЕВЫЕ СЛОВА: сплайсосомные интроны, фаза интрона, длина интрона, эволюция, слайдинг, экзон!
интронная структура.
DOI: 10.31857/S0320972520070015
ВВЕДЕНИЕ
сорной», и считали, что она не несет особой
смысловой нагрузки, то долгое время стоял воп!
Интроны были открыты в 1977 году в двух
рос о функциональной значимости интронов.
независимых исследованиях [1, 2], в которых
Сейчас возможные функции интронов принято
было показано, что гены эукариот, в отличие от
разделять на три категории: 1) функции, связан!
генов прокариот, содержат вставочные последо!
ные со сплайсингом; 2) общие функции нк!
вательности, которые удаляются из пре!мРНК
ДНК; 3) хранение регуляторных элементов и бе!
вскоре после транскрипции во время дозрева!
лок!кодирующих генов внутри себя [4]. В пер!
ния мРНК. Такие вставочные последователь!
вом случае, кроме участия интронов в альтерна!
ности было предложено назвать интронами (от
тивном сплайсинге (АС) и их вклада в разнооб!
английского «INTRagenic regiON» - «внутри!
разие и мультидоменность белковых структур,
генный регион»), а разделяемые ими фрагменты
важна также регуляторная роль сплайсинга в
гена - экзонами («EXpressed regiON» - «экс!
других молекулярно!биологических процессах.
прессирующийся регион») [3].
Например, известно, что мРНК, из которых уже
Так как интроны относятся к некодирующей
были вырезаны интроны, лучше экспортируют!
ДНК (нк!ДНК), которую раньше называли «му! ся из ядра, чем их копии без вырезанных интро!
нов [5]. Важным механизмом регуляции экс!
Принятые сокращения: ЭИС - экзон!интронная
прессии генов, по!видимому, является скорость
структура; нк - некодирующие последовательности; АС -
альтернативный сплайсинг; ППИ - параллельное приоб!
сплайсинга. Более того, само наличие интронов
ретение интронов.
в гене влияет на регуляцию его экспрессии [6,
* Адресат для корреспонденции.
7]. Расположение интронов также важно: хотя
851
852
ПОВЕРЕННАЯ, РОЙТБЕРГ
большинство интронов локализованы в кодиру!
ных интронов могут быть вложенные гены,
ющей последовательности, точно установлено,
иногда на обратной цепи (подробнее в разделе
что некоторые интроны расположены в 5!не!
«Функции интронов»). Длина данных интронов
транслируемой области, где участвуют в регуля!
широко варьируется между видами: от несколь!
ции экспрессии генов у животных и растений
ких десятков (у простейших) до сотен тысяч
[8]. Помимо всего, интроны, видимо, являются
нуклеотидов у млекопитающих. Плотность ин!
энхансерами мейотического кроссинговера
тронов (то есть количество интронов на ген) в
между белок!кодирующими последовательнос!
эукариотах также сильно варьируется: от не!
тями, поскольку вероятность кроссинговера
скольких интронов на геном до десятков интро!
между экзонами, разделенными длинными ин!
нов на ген [4]. Вследствие такого разброса плот!
тронами, гораздо больше, чем между такими же
ности и длин интронов эукариотов условно ста!
последовательностями, но без интронов [9]. И
ли разделять на интрон!бедные (большинство
наконец, в качестве примера для третьей катего!
одноклеточных эукариот) и интрон!богатые
рии функций интронов можно привести следу!
(животные, растения и т.д.) геномы. Было пока!
ющее наблюдение: почти во всех эукариотичес!
зано [15], что для организмов с плотностью <3
ких геномах в 5!областях генов, кодирующих
интронов на 1000 п.н. в среднем характерна не!
рибосомальные белки, есть интроны, содержа!
большая длина интронов и нет значимой корре!
щие регуляторные элементы [10].
ляции между плотностью и длиной интронов, в
В настоящий момент известно три типа ин!
то время как для более интрон!богатых геномов
тронов: интроны группы I и группы II, а также
можно наблюдать сильную положительную кор!
сплайсосомные интроны. Интроны групп I и II
реляцию. Тем не менее даже среди интрон!бога!
были обнаружены в ДНК некоторых бактерий и
тых организмов выделяются позвоночные, ко!
клеточных органелл. Интроны группы I были
торые имеют значительное количество очень
также найдены в рибосомальных РНК простей!
длинных интронов. Несмотря на найденные
ших и в ядрышках некоторых грибов. Для ин!
корреляции, исключения были обнаружены как
тронов групп I и II характерно наличие особых
среди интрон!богатых, так и среди интрон!бед!
РНК структур, благодаря которым они способ!
ных геномов. Интрон!бедные и интрон!богатые
ны к автосплайсингу (то есть, самовырезанию
организмы различаются не только разной плот!
из незрелой мРНК). Основное отличие между
ностью интронов, но и распределением интро!
интронами обеих групп заключается в разных
нов в геноме: для интрон!богатых геномов ха!
механизмах автосплайсинга. У таких интронов
рактерно относительно равномерное распреде!
также есть собственные открытые рамки считы!
ление интронов по геному, в то время как в ин!
вания, содействующие как их удалению из РНК,
трон!бедных геномах интроны перепредставле!
так и распространению интронов по геному че!
ны в 5!областях генов [16].
рез процесс обратной транскрипции. В настоя!
Интересно, что многочисленные интроны
щий момент идентифицировано ~1500 интро!
были также найдены в длинных нк!РНК. Срав!
нов группы I и 200 представителей группы II
нительный анализ более чем 3000 последова!
[11].
тельностей РНК такого типа показал, что, воз!
Третий и самый многочисленный тип интро!
можно, для длинных нк!РНК свойственно сох!
нов - сплайсосомные интроны - были найдены
ранение экзон!интронной структуры (ЭИС)
в ядерных геномах почти всех известных эука!
[17].
риот (исключение составляет нуклеоморф) [12].
В отличие от интронов группы I и II, сплайсо!
сомные интроны не имеют способностей к авто!
ИНТРОНЫ И СПЛАЙСИНГ
сплайсингу, и для их вырезания из пре!мРНК
нужен специальный аппарат - сплайсосома, ко!
Сплайсосомные интроны можно разделить
торая представляет из себя сложный биомолеку!
на две группы в зависимости от того, какая
лярный комплекс, состоящий из 5 цепей малой
сплайсосома принимает участие в вырезании
ядерной РНК и сотни белков.
интрона из пре!мРНК. Большая часть интронов
Несмотря на важные различия между разны!
вырезается с помощью U2 сплайсосомы, остав!
ми типами интронов, сходство механизмов
шаяся часть - с помощью U12 сплайсосомы.
сплайсинга интронов группы II и сплайсосом!
Для правильного распознавания и дальнейшего
ных интронов указывает на возможность эволю!
удаления интрона крайне важны консенсусные
ционного родства между ними [13, 14].
последовательности на экзон!интронных гра!
Последовательность сплайсосомных интро!
ницах. Наиболее распространенные интроны
нов обычно квази!случайная и не имеет откры!
U2 типа, то есть интроны, вырезаемые U2
той рамки считывания, хотя внутри очень длин!
сплайсосомой, содержат GT динуклеотид на
БИОХИМИЯ том 85 вып. 7 2020
ОБЗОР ПО СПЛАЙСОСОМНЫМ ИНТРОНАМ
853
5!донорном сайте сплайсинга (далее ДСС) и
Подверженный ошибкам сплайсинг (вслед!
AG динуклеотид на
3!акцепторном сайте
ствие слабого донорного сайта) мог в конечном
сплайсинга (далее АСС).
итоге привести к функциональному альтерна!
Поскольку сайты сплайсинга с |GT в ДСС и
тивному сплайсингу. Считается, что АС возник
AG| в АСС встречаются повсеместно, их стало
еще на ранних этапах эволюции эукариот путем
принято называть каноническими. Среди нека!
накопления аберрантных сплайс!форм в усло!
нонических сайтов самыми частыми являются
виях слабого отрицательного отбора. По!види!
|GC!AG| и |AT!AC| пары конечных динуклеоти!
мому, все альтернативные транскрипты в начале
дов в интронах U2 типа и U12 типа соответ!
были неработающими, и функциональные АС!
ственно. У человека такие сайты сплайсинга
формы развивались постепенно и независимо в
встречаются в ~0,9 и ~0,09% интронов [18]. У
разных таксонах. При этом считается, что АС в
растений было показано схожее распределение
значительной степени способствовал повыше!
сайтов сплайсинга (в среднем): 98,7% для |GT!
нию уровня фенотипической сложности у мле!
AG|, 1,2% для |GC!AG|, 0,06% для |AT!AC| и
копитающих, и что активное накопление ин!
0,09% для всех остальных [19]. В геномах млеко!
тронов дало эволюционное преимущество, так
питающих доля интронов с другими неканони!
как позволило увеличить потенциально воз!
ческими вариантами, которые, как считается,
можное число белковых изоформ. [23].
имеют U2!U12!подобные сайты сплайсинга,
например |GT!TG| или |AT!AG|, занимает всего
порядка 0,02%, хотя, вероятно, их число сильно
ПРОИСХОЖДЕНИЕ ИНТРОНОВ
недооценено из!за несовершенства геномных
аннотаций [20].
Происхождение сплайсосомных интронов
Катализ вырезания интронов с неканони!
представляет большой интерес как в изучении
ческими сайтами сплайсинга осуществляет U12
интронов, как самостоятельных элементов ге!
сплайсосома, в то время как интроны с |GT!AG|
нома, так и в изучении эволюции всего генома в
обычно вырезаются U2 сплайсосомой (хотя из!
целом. Эволюция экзон!интронной организа!
вестны случаи сплайсинга и U12 сплайсосо!
ции эукариотических генов до сих пор является
мой). Вопрос о том, какая сплайсосома была
предметом долгого ожесточенного спора между
первой, все еще остается актуальным. В данный
сторонниками двух теорий: раннего и позднего
момент наибольшую поддержку имеет гипотеза,
происхождения интронов. Теория раннего про!
что ранние интроны вырезались с помощью U2
исхождения интронов утверждает, что уже на са!
сплайсосомы, тем не менее, согласно данным
мых ранних этапах эволюции жизни белок!ко!
последних реконструкций, обе сплайсосомы
дирующие последовательности содержали мно!
были представлены в последнем общем предке
гочисленные интроны, и что эти интроны игра!
эукариот (last common eukaryotic ancestor -
ли ключевую роль в создании новых белков пу!
LECA).
тем рекомбинации последовательностей, коди!
В настоящее время известны 2 основных ме!
рующих отдельные маленькие белковые или
ханизма распознавания сигнала сплайсинга: оп!
пептидные элементы. Теория позднего проис!
ределение по экзону и определение по интрону.
хождения интронов гласит, что интроны образо!
Эффективность сплайсинга в первом случае за!
вались только в эукариотах и непрерывно на!
висит от длины экзонов и не зависит от длины
капливались в ходе эволюции эукариот. Недав!
интронов. Обратное верно для второго случая
ние открытия показали несостоятельность тео!
[21]. Можно предположить, что определение по
рии ранних интронов (по крайней мере, в ее из!
экзону в какой!то момент замещается определе!
начальной формулировке) [24], хотя, по всей
нием по интрону, так как в исследовании
видимости, самосплайсирующиеся интроны су!
Sverdlov et al. [22] было показано, что в новых
ществовали уже на ранних стадиях, и, вероятно,
интронах сигнал сплайсинга базируется на кон!
именно они стали предками сплайсосомных
цах соседних экзонов, но со временем он сме!
интронов в эукариотах [4]. Теория поздних ин!
щается на концы самого интрона.
тронов стала профилирующей, однако также
В качестве сайта протосплайсинга, т.е. сайта,
претерпела некоторые изменения, так как было
в который может встроиться интрон, была при!
показано, что общий предок эукариот содержал
знана консенсусная последовательность
значительное число интронов, и со временем
(A/C)AG||G. Выбор сайта протосплайсинга для
происходило не только накопление интронов,
de novo интронов, по!видимому, происходит
но и их потеря [4].
случайным образом, при этом скорость измене!
Rogozin et al. [4] сформулировали синтети!
ния сайта протосплайсинга не отличается от
ческую гипотезу, в основе которой лежит пред!
скорости изменения случайного сайта.
положение, что заселение древнего эукариоти!
БИОХИМИЯ том 85 вып. 7 2020
854
ПОВЕРЕННАЯ, РОЙТБЕРГ
ческого генома интронами было запущено ми!
вили, что позиция многих интронов является
тохондриальным эндосимбиозом. Согласно
консервативной: в ортологичных генах живот!
этой гипотезе, альфа!протеобактериальный
ных, грибов и растений позиции интронов сов!
предок митохондрии содержал много интронов
падают в 25-30% случаев [27]. Консерватив!
группы II (что согласовывается с данными о пе!
ность позиций интронов говорит о том, что ли!
репредставленности таких интронов в некото!
бо сами интроны являются ортологичными, ли!
рых альфа!протеобактериях), которые мигриро!
бо интроны любят встраиваться конкретно в
вали в ДНК хозяина, где стали сплайсосомными
этот сайт протосплайсинга. Второй вариант на!
интронами. Эта гипотеза подтверждается дан!
зывается параллельным приобретением интро!
ными реконструкции последнего общего эука!
нов (ППИ) и обычно наблюдается у эволюци!
риотического предка (LECA), которые показа!
онно далеких организмов (например, между
ли, что ранние эукариотические геномы на 80%
растениями и животными доля ППИ может до!
состояли из последовательностей, полученных
ходить до 20% от всех позиций интронов) [28].
из интронов группы II [15, 25]. Помимо этого,
Надо отметить, что в 2016 г. вышла работа Roy
результаты реконструкции LECA показали, что
[29], в которой опровергались раннее показан!
плотность интронов в LECA сравнима с плот!
ные случаи ППИ в геномах Daphnia и поддержи!
ностью интронов в современных умеренно ин!
валась гипотеза, что одинаковая позиция интро!
трон!богатых геномах (предки, как минимум, 3
нов в ортологичных генах означает, что данные
из 5 таксономических супергрупп - Chromalve!
интроны произошли от общего предка. Так или
olata, Plantae и Unikonts (животные, растения и
иначе, значительное большинство интронов,
амебоподобные) - вероятнее всего, имели ин!
находящихся в одной и той же позиции ортоло!
трон!богатые геномы, хотя геномных данных об
гичных генов, по!видимому, действительно яв!
оставшихся супергруппах недостаточно для ка!
ляются наследственными.
ких!либо выводов). По всей вероятности, зак!
Но несмотря на консервативность позиций,
реплению интронов в геноме должен был способ!
плотность интронов в эукариотах сильно варьи!
ствовать эффект бутылочного горлышка - со!
руется, и расположение интронов в ортологич!
кращения генофонда популяции (т.е. ее генети!
ных генах не всегда совпадает даже в близких
ческого разнообразия) вследствие прохождения
видах [30]. Различные реконструкции ЭИС при!
периода, во время которого по различным при!
вели к выводам, что в процессе эволюции генов
чинам происходит критическое уменьшение ее
и интронов происходили как значительные по!
численности, в дальнейшем восстановленное.
тери, так и значительные приобретения интро!
Бутылочное горлышко, в свою очередь, могло
нов (последние тяжело детектировать), но если
быть вызвано симбиозом пре!эукариотической
процесс потери интронов преобладает на корот!
клетки с альфа!протеобактерией [25]. Рекон!
ких эволюционных расстояниях, то массовые
струкция LECA позволила сделать авторам вы!
вставки интронов, скорее всего, происходили во
вод о том, что эволюция эукариотических генов
время больших эволюционных событий (напри!
в основном шла по пути потери интронов, зна!
мер, при возникновении царства Животных).
чительное приобретение интронов происходило
Тем не менее необходимо учитывать, что по!
лишь на некоторых этапах разветвления эволю!
лученные выводы были сделаны по результатам
ционного дерева. При этом силы отрицательно!
реконструкции эволюции ЭИС высоко!консер!
го отбора для потери большинства интронов
вативных генов, так как для других областей ге!
достаточно только для популяций больших раз!
нома реконструкцию делать сложнее, и резуль!
меров, таких как одноклеточные (Ne, ~ 107-108),
таты часто получаются не очень точными. А в
а не для высших растений и позвоночных жи!
консервативных белок!кодирующих последова!
вотных (Ne, ~ 105-106) и (Ne, ~ 104-105) соответ!
тельностях приобретение интронов происходит
ственно) [26], поэтому первые потеряли почти
редко, в то время как для слабо!консервативных
все интроны, в то время как у вторых большин!
белок!кодирующих последовательностей и ге!
ство интронов все же сохранилось.
нов, образованных из мобильных элементов и
нетранслируемых регионов, приобретение ин!
тронов является довольно частым явлением
ЭВОЛЮЦИЯ ИНТРОНОВ В РАМКАХ
[31].
ЭКЗОН+ИНТРОННОЙ СТРУКТУРЫ
Исследования генов!паралогов показали
значительное численное превосходство ново!
Позиция интрона - место между конкрет!
приобретенных интронов над потерянными, что
ными экзонами, в которое встраивается ин!
приводит к предположению, что дупликация ге!
трон, - также называется сайтом протосплай!
нов усилила вставку интронов. Сравнение ЭИС
синга. Различные эволюционные анализы выя!
у ранних эукариотических генов!паралогов вы!
БИОХИМИЯ том 85 вып. 7 2020
ОБЗОР ПО СПЛАЙСОСОМНЫМ ИНТРОНАМ
855
явило, что позиции интронов в этих генах не
Интересно, но интронные потери являются
консервативны, что, по всей видимости, гово!
наиболее частыми вариациями количества ко!
рит о том, что эти гены образовались в начале
пий генов (CNV), кодирующих белки у челове!
эволюции эукариот, когда происходили интен!
ка: 12 986 интронных делеций были обнаружены
сивная дупликация генов и активное заселение
в 4147 генах (включая 1154 основных генов и
генов самосплайсирующимися интронами
1638 генов, связанных с болезнью) [37]. В итоге
группы II [32].
можно наблюдать чрезвычайную вариабель!
Молекулярные механизмы приобретения и по+
ность популяции по размеру, где у 40 генов было
тери интронов. Как было упомянуто выше, в эво!
найдено от 10 до 150 аллелей разной длины.
люции эукариотических организмов потери
Интронные потери нередки у эволюционно
интронов происходили чаще, чем их приобрете!
древних генов, которые высоко консервативны
ния [28]. Молекулярные механизмы этих двух
на уровне белковой последовательности. Судя
основных эволюционных событий, связанных с
по всему, изменчивость экзон!интронной
интронами, остаются не до конца изученными,
структуры генов, кодирующих белки, вносит
хотя в настоящий момент уже существуют не!
важный вклад в изменчивость экспрессии и
сколько частично подтвержденных моделей.
сплайсинга генов в популяциях человека [37].
Основным предложенным механизмом потери
Слайдинг интронов. Помимо потери и приоб!
интрона считается гомологичная рекомбинация
ретения существует еще такое событие эволю!
между кДНК, полученными в итоге обратной
ции интронов, как смещение (слайдинг) - фак!
транскрипции, и геномными копиями соответ!
тически это перемещение интрон!экзонных гра!
ствующих генов, в результате чего образуется
ниц на небольшие расстояния (1-60 п.н.). Суще!
новая аллель без интрона. Этот механизм назы!
ствует предположение, что слайдинг возникает
вают ретротранспозицией или RTMIL (Reverse
посредством альтернативного сплайсинга: в гене
Transcriptase-Mediated Intron Loss - в буквальном
появляется новый сайт сплайсинга рядом со ста!
переводе потеря интрона через обратную тран!
рым, что приводит к АС, а затем по каким!то
скрипцию). Экспериментально потеря интрона
причинам старый сайт сплайсинга исчезает [36].
была показана в геноме дрожжей еще в 1991 го!
Вследствие крайней редкости слайдинг ин!
ду [33].
тронов долгое время не рассматривался как от!
Среди моделей для приобретения интрона
дельный объект изучения, а шел в дополнение к
выделяют вставку интрона во время восстанов!
другим эволюционным событиям. Например,
ления разрывов двухцепочечной ДНК, вставку
Yenerall et al. [38] в процессе изучения возмож!
интрона группы II, вставку интрон!подобного
ных механизмов приобретения и потери интро!
мобильного элемента, интронизацию (часть эк!
нов среди 11 видов Drosophila обнаружили 189
зона становится интроном), перенос интрона из
случаев приобретения интрона, 297 случаев по!
гена!паралога, а также транспозицию интро!
тери и 1 случай слайдинга. Lehmann et al. [39]
нов - модель с обратным сплайсингом, где ин!
выдвинули предположение, что некоторые но!
трон, не успевший полностью покинуть сплай!
вые позиции интронов в консервативных генах
сосому, включается в мРНК, не содержащую
Drosophila появились благодаря слайдингу ин!
интронов (при этом данный интрон может быть
тронов или дупликации экзонов. Возможные
из другой пре!мРНК). Последние две модели
случаи слайдинга были также описаны в работах
также предполагают гомологическую рекомби!
Krauss et al. [40] и Поверенной и соавт. [41]. По!
нацию, как один из этапов. Lee и Stevens [34]
веренная и соавт. [41] также подняли вопрос о
удалось экспериментально подтвердить два слу!
связи слайдинга интронов с присутствием нека!
чая приобретения интрона через транспозицию
нонических сайтов сплайсинга.
интронов в генах дрожжей (до этого события
Надо отметить, что само существование
приобретения интрона были только предсказа!
слайдинга интрона, как явления, долго было
ны с помощью филогенетического анализа).
предметом многочисленных споров. Впервые
При этом, согласно исследованиям Sverdlov et al.
слайдинг постулировался сторонниками гипоте!
[35] и Tarr o et al. [36], транспозиция интронов не
зы о раннем происхождении интронов для объ!
является единственным механизмом вставки
яснения удивительного открытия: позиции ор!
интрона для других организмов. Следует отме!
тологичных интронов иногда варьируются у ор!
тить, что механизмы массовых вставок интронов
тологичных генов [42]. В то же время сторонни!
(например, у самых ранних эукариот) вполне
ки гипотезы о позднем происхождении интро!
могут отличаться от механизмов относительно
нов утверждали, что слайдинг интронов, если и
медленного процесса приобретения интронов у
происходит, то мало влияет на разнообразие по!
ныне существующих эукариот, что усложняет
зиций интронов [43]. Более того, Bocco и Csűrös
определение точных механизмов вставок.
[44] оспаривали ранее показанные случаи слай!
БИОХИМИЯ том 85 вып. 7 2020
856
ПОВЕРЕННАЯ, РОЙТБЕРГ
динга, найденные в оомицетах, и заключали, что
интрона относительно рамки считывания. Как
почти всегда слайдинг интрона является всего
известно, интрон, расположенный в кодирую!
лишь артефактом аннотации. Но, согласно ре!
щей последовательности, может прерывать рам!
зультатам статистического анализа позиций ин!
ку считывания гена в любой позиции: между
трона в разных семействах генов по методу Мон!
двумя кодонами, между первым и вторым нук!
те!Карло, смещение интрона на одну позицию
леотидами одного кодона и между вторым и
является достоверным эволюционным событи!
третьим нуклеотидом кодона. В первом случае,
ем, даже несмотря на свою относительную ред!
если интрон расположен между двумя кодона!
кость (встречается менее чем у 5% всех интро!
ми, ему присваивается фаза 0. Интроны, распо!
нов). А вот доказательств о слайдинге интронов
ложенные между первым и вторым или вторым
на большие расстояния получено не было [45].
и третьим нуклеотидами, имеют фазу 1 или 2 со!
Tarr o et al. [36] выдвинули предположение,
ответственно.
что позиционное разнообразие интронов об!
В ходе целого ряда научных работ, посвящен!
условлено двумя пересекающимися процессами:
ных распределению фаз интронов, выяснилось,
фоновым процессом непрерывного перемеще!
что почти во всех изученных организмах наблю!
ния интронов путем слайдинга и вспышками об!
дается количественное преобладание интронов
ширного приобретения или потери новых ин!
фазы 0 над интронами других фаз (исключе!
тронных последовательностей. Таким образом,
ние - оболочник Oikopleura с равномерным
слайдинг является важным источником возник!
распределением интронов разных фаз); более
новения новых интронов (по крайней мере в не!
того, если фазу 0 имеют ~50% интронов, то фазу
которых филогенетических линиях), что подтвер!
1 и фазу 2 - 30 и 20% соответственно [42, 48].
ждается сравнительным анализом близкораспо!
Описанная закономерность получила название
ложенных интронов из
12 геномов рода
«правило 50/30/20» или «соотношение 5 : 3 : 2» и
Drosophila, где было показано, что слайдинг ин!
объяснялась процессом «перетасовки» экзонов
тронов является относительно частой причиной
[49], корреляцией интронов фазы 1 и 2 с консер!
новых позиций интронов в данном виде [39].
вативными участками последовательности [50],
Возникновение и фиксация случаев слай!
и даже особой структурой белка [51]. В рамках
динга в процессе эволюции, вероятно, происхо!
теории о раннем происхождении интронов пре!
дит через АС [36]. Согласно данной гипотезе,
обладание интронов фазы 0 объяснялось тем,
слайдинг интрона часто встречается в низко!
что часть существующих в настоящий момент
консервативных регионах белок!кодирующих
интронов была представлена еще в последнем
генов, где повышена частота АС (например, 5!
общем предке эукариот и прокариот и соединя!
и 3!областей многих генов), но редко в консер!
ла близлежащие мини!гены, которые позднее
вативных участках белок!кодирующих генов.
превратились в экзоны. Таким образом, данные
Для слайдинга интрона на 1 нуклеотид Fekete et
интроны должны были иметь нулевую фазу. Од!
al. [46] предложили возможный молекулярный
нако данная теория никак не объясняла факт
механизм, связанный с участием альтернативно
большей частоты интронов фазы 1 над интрона!
сплайсированного промежуточного соедине!
ми фазы 2. А вот, согласно теории поздних ин!
ния: так называемого «stwintron» (в буквальном
тронов, неравномерность распределения фаз
переводе, сплайсосомные близнецы!интро!
интронов отражает неслучайность приобретения
ны) - структуры, в которой один интрон факти!
интронов в ходе эволюции [52]. Для некоторых
чески представляет собой два вложенных друг в
видов было показано преобладание сайтов про!
друга интрона. Пример сдвига интрона на 1 нук!
тосплайсинга в фазе 0, тем не менее этим нельзя
леотид был описан для гена глобина в геномах
полностью объяснить преобладание интронов
амфибий и рыб [47].
фазы 0, т.к. предполагается, что интроны встра!
Фактическое влияние слайдинга на эволю!
иваются в случайные сайты протосплайсинга.
цию эукариотических генов будет точно опреде!
Еще одно возможное объяснение «правила
лено только тогда, когда будут доступны много!
50/30/20» было дано Long и Deutsch [53] в 1999
численные наборы близкородственных геномов
году. Они предложили использовать фазы
и разработаны строгие методы статистического
сплайсосомных интронов для изучения эволю!
анализа.
ции экзон!интронной организации. Авторы об!
наружили сильную корреляцию между распре!
делением фаз интронов и консервативностью
СВОЙСТВА ИНТРОНОВ
последовательности сигналов сплайсинга в
близлежащих экзонах: наиболее представленная
Фаза интрона. Одной из важных характерис!
фаза 0 соответствовала высокому уровню кон!
тик интрона является его фаза - положение
сервативности, в то время как фаза 2, характер!
БИОХИМИЯ том 85 вып. 7 2020
ОБЗОР ПО СПЛАЙСОСОМНЫМ ИНТРОНАМ
857
ная для меньшей части интронов, обычно встре!
Длина интрона может оказывать влияние
чалась в случаях с низким уровнем консерватив!
как на регуляцию экспрессии гена, так и на ско!
ности. Интроны фазы 1 занимали промежуточ!
рость эволюции данного гена. Щепеткова и
ное положение. С учетом экспериментально по!
Гельфанд [64] исследовали корреляцию между
казанного пагубного влияния мутаций в экзонах
сигналами сплайсинга и длинами прилегающих
недалеко от сайтов сплайсинга авторами был
экзонов и интронов. Было показано, что инфор!
предложен возможный генетический механизм
мационное содержание сайтов сплайсинга в ге!
эволюции экзон!интронной структуры, предпо!
нах Caenorabditis elegans и Drosophila melanogaster
лагающий, что недопредставленность интронов
зависит от длины прилегающего интрона.
фазы 2 может являться результатом направлен!
Marais et al. [65] и Wu и Hurst [66] исследовали
ной потери интрона, вызванной наличием вред!
негативную корреляцию между длиной интрона
ных мутаций [53].
и строгостью эволюционного отбора на уровне
Помимо количественного распределения
аминокислотных последовательностей. Суще!
фаз интронов было обнаружено, что интроны
ствование негативной корреляции между внут!
фазы 1 чаще всего встречаются в 5!концевых
ривидовой дивергенцией и длиной интрона у
участках гена, и их частота существенно снижа!
Drosophila melanogaster и Drosophila simulans было
ется к 3!концу. Строго обратная ситуация была
показано Haddrill et al. [67], подтвердившими,
показана для интронов фазы 0 [54].
что длинные интроны эволюционируют мед!
Астахова и соавт. [55] показали нарушение
леннее, чем короткие. Коэволюцию длины ин!
«золотого правила» распределения фаз в генах с
тронов можно наблюдать в коэкспрессирую!
большим содержанием длинных интронов: та!
щихся генах и в генах, чьи продукты образуют
кие интроны предпочитают иметь фазу 1, а не
единый белковый комплекс. Наиболее наглядно
обычно перепредставленную фазу 0. Надо отме!
это можно увидеть в генах, участвующих в кле!
тить, что перепредставленность фазы 0 также
точном цикле [68].
часто объясняется тем, что интроны фазы 0 со!
По утверждению Pozzoli et al. [69] длина ин!
здают большую гибкость для процесса кодиро!
трона и межгенных участков, сама по себе, не
вания белка, поскольку они не затрагивают кон!
играет адаптивной роли в регуляции экспрессии
цевые нуклеотиды экзонов, где обычно распо!
генов, а отражает необходимость сохранения
ложены сайты сплайсинга [56].
консервативных интронных элементов. Хотя
Длина интрона. Еще одним немаловажным
количество некодирующих функциональных
свойством интрона является его длина. Соглас!
элементов может объяснить изменение размера
но данным Halligan и Keightley [57], последова!
генома, было показано, что на высоко экспрес!
тельности длиной <40 п.н. не могут сформиро!
сированные интроны воздействует дополни!
вать полноценный интрон. Средняя длина ин!
тельное давление, снижающее стоимость их
трона варьирует в разных организмах, но расп!
транскрипции. С другой стороны, факт того, что
ределение длин интронов в интрон!богатых ор!
в высоко экспрессируемых генах находятся ма!
ганизмах имеет правый тяжелый хвост, показы!
ленькие интроны, подтверждает гипотезу о
вающий наличие очень длинных интронов [55].
транскрипционной эффективности и/или эко!
Одним из наиболее известных фактов про
номии [70, 71]. Косвенным свидетельством мо!
длины интронов является повышенная длина
жет являться исследование [72], в котором было
1!го интрона [58]. Farlow et al. [59] и Shepard et
показано, что рептилии и птицы имеют более
al. [60] анализировали время протекания сплай!
короткие интроны, чем млекопитающие, и что
синга в зависимости от длины интрона. Особен!
длина интрона у нелетающих птиц длиннее, чем
ности сплайсинга длинных интронов были опи!
у летающих, которые тратят большое количест!
саны Sibley et al. [61]. Vinogradov [62] показал,
во энергии на полет.
что интроны в конститутивных генах короче,
Связь между длиной интрона и GC!составом
чем в тканеспецифичных. Также было показано,
впервые была упомянута Duret et al. [73], про!
что альтернативные кассетные экзоны фланки!
анализировавшими несколько геномов позво!
руются более длинными, чем конститутивные,
ночных: было замечено, что в GC!богатых генах
интронами; хотя это не наблюдается в случаях
интроны короче. Это наблюдение также подтвер!
альтернативных акцепторного или донорного
ждается Versteeg et al. [74]. В то же время в гено!
сайтов сплайсинга [23]. В исследовании Астахо!
мах костистых рыб не обнаружили никакую ли!
ва и соавт. [55] была найдена корреляция между
нейную корреляцию между длиной интрона и
длинами соседних интронов в генах животных.
его GC составом [75].
Seoighe и Korir [63] показали консервативность
Интересная теория о механизме эволюции
суммарной длины интронов в генах эмбрио!
длины интрона была предложена Zhang et al.
нального развития у млекопитающих.
[76]. Авторы показали, что интроны могут ока!
БИОХИМИЯ том 85 вып. 7 2020
858
ПОВЕРЕННАЯ, РОЙТБЕРГ
зывать влияние на экспрессию и регуляцию ге!
ся неясным, насколько буферный эффект по!
на посредством взаимодействия с соответствую!
следовательностей интрона более выигрышен с
щими последовательностями мРНК. При этом
точки зрения эволюционного преимущества над
интрон состоит из, как минимум, двух субъеди!
энергетическим бременем.
ниц (downstream и upstream части), соединен!
В последнее время во многих исследованиях
ных между собой линкерами. Длина субъедини!
описываются свидетельства преимуществ, при!
цы довольно консервативна - ~60 п.н., а вот
носимых интронами в эукариотические клетки,
длина линкера может сильно варьировать. Дли!
для оправдания всех энергетических затрат. В
на всего интрона увеличивается не постепенно,
обзоре Jo и Choi [79] функциональные роли
а путем добавления новых структурных субъеди!
интронов разделены на две категории: прямые
ниц и линкеров между ними. При этом 5!об!
(такие как регуляция АС, усиление экспрессии
ласть интрона или первая структурная субъеди!
генов, контроль транспорта мРНК или сборки
ница - это уже зрелая последовательность, в то
хроматина) и непрямые (например, наличие в
время как 3!область - незрелый, т.е. еще эво!
интронах связанных с признаком однонуклео!
люционирующий регион. Таким образом, эво!
тидных полиморфизмов или разных генов неко!
люция длины интрона идет от 5 к 3! концу, со!
дирующих функциональных РНК; изменение
здавая новые субъединицы, посредством посте!
длины интрона в вопросе эффективности есте!
пенного умножения фрагментов 3!области.
ственного отбора).
Интересно, что распределение длины и степень
Основную функцию интронов часто связы!
совпадения оптимальных фрагментов согласу!
вают с возникновением АС: хотя интроны не
ются с особенностями последовательностей
вносят непосредственного вклада в протеом, од!
микроРНК и малой интерферирующей РНК.
но их присутствие позволяет увеличить потен!
Эти результаты указывают на то, что взаимодей!
циально возможное количество продуктов бе!
ствие между интронами и последовательностя!
лок!кодирующих генов благодаря альтернатив!
ми мРНК является разновидностью функцио!
ному сплайсингу.
нального взаимодействия РНК-РНК [77]. В то
У многих эукариот, включая млекопитаю!
же время интроны и мРНК, по!видимому, вмес!
щих, растения, дрожжи и насекомых, интроны
те коэволюционируют для успешного выполне!
могут влиять на экспрессию генов даже при от!
ния своих биологических функций.
сутствии сайта связывания для транскрипцион!
ных факторов. Этот феномен был назван «ин!
трон!опосредованным усилением экспрессии»
ФУНКЦИИ ИНТРОНОВ
[80]. Само присутствие интронов влияет не
только на скорость транскрипции, но также на
Наличие интронов в геноме является энерге!
стабильность мРНК и на ее экспорт из ядра. Бо!
тическим бременем для многих клеток, ведь для
лее того, интроны также могут увеличить эф!
транскрипции интронов и их дальнейшего вы!
фективность трансляции мРНК [80]. Например,
резания из пре!мРНК с помощью сложных
Lim et al. [81] предсказали эффективность
сплайсосомных механизмов клеткам может по!
трансляции по наличию экзон!интронной
требоваться много энергии. Сохранение интро!
структуры в 5!нетранслируемой области гена.
нов в ходе эволюции может быть объяснено
Вырезанные из пре!мРНК последователь!
только при условии, что преимущества наличия
ности интронов, по сути, являются нк!РНК, ко!
интронов превосходят их негативное влияние на
торые быстро разрушаются. Однако, согласно
энергетические затраты. Однако, согласно ис!
последним исследованиям [82, 83], такие выре!
следованию Lynch [78], интроны - это просто
занные интроны успевают быть задействован!
эгоистичные ДНК, заселившие белок!кодирую!
ными в TOR связанной сети сигнала роста в
щие гены в эукариотических геномах и сумев!
Saccharomyces cerevisiae. Систематическое удале!
шие сохраниться из!за эффекта бутылочного
ние всех известных интронов в генах почкую!
горлышка в популяциях. Тем не менее интроны
щихся дрожжей указывает на то, что в большин!
все же могут давать некоторые преимущества в
стве случаев клетки с делецией интронов разру!
качестве мутационного буфера в эукариотичес!
шаются при истощении питательных веществ
ких геномах, защищая кодирующие последова!
быстрее, чем нормальные клетки. Таким обра!
тельности от воздействия случайно возникаю!
зом, интроны оказываются медиаторами кле!
щих вредных мутаций. Так как интроны в сред!
точного ответа при голодании.
нем гораздо длиннее экзонов, большинство слу!
Длинные интроны, особенно в 5!области,
чайно встречающихся мутаций в генах попада!
часто обогащены регуляторными элементами и,
ют в интроны и не влияют на последовательнос!
таким образом, могут являться предметом отбо!
ти и функции белка. Надо признать, что остает!
ра [42, 84]. Некоторые интроны содержат не
БИОХИМИЯ том 85 вып. 7 2020
ОБЗОР ПО СПЛАЙСОСОМНЫМ ИНТРОНАМ
859
только различные регуляторные элементы, но и
интронной структуры эукариотических генов,
последовательности, участвующие в формирова!
которая была предметом длительных и интен!
нии структуры хроматина, хотя остается неяс!
сивных научных споров. Наиболее актуальная
ным, есть ли существенные отличия в таком обо!
теория происхождения сплайсосомных интро!
гащении регуляторных и структурных элементов
нов предполагает, что они образовались из са!
между последовательностью интрона и другими
мосплайсирующихся интронов группы II, со!
нк!ДНК [85]. В состав многих интронов также
держащихся в альфа!протеобактериальном
часто входят разнообразные гены нк!РНК, осо!
предке митохондрии при заселении древнего
бенно много генов малой ядрышковой РНК [86]
предка эукариотических организмов, и с тех пор
и генов - предшественников микроРНК [87].
происходит как постепенная потеря интронов,
В 2013 г. Vakhrusheva et al. [88] на ортологич!
так и их появление. При этом молекулярные ме!
ных интронах человека, мыши и рыб, иглобрю!
ханизмы потери и приобретения интронов мо!
ха и фугу, рассматривали связь длины интрона,
гут отличаться у разных организмов. Третье эво!
его возможных функций и эволюции. Было по!
люционное событие - слайдинг интронов -
казано, что если у интрона есть некий консерва!
случается столь редко, что все еще есть сомне!
тивный или регуляторный участок, то его орто!
ния в его достоверности.
лог тоже, скорее всего, будет иметь консерва!
Несмотря на то, что последовательность
тивный или регуляторный участок, даже если
интрона крайне изменчива в связи со слабым
последовательности совершенно различаются.
действием отрицательного отбора, такие его ха!
Также интроны с сохранившимися консерва!
рактеристики, как фаза и длина, могут обладать
тивными участками имеют большую длину, чем
неожиданной консервативностью и, в случае
те их ортологи, которые эти участки потеряли.
длин, могут даже влиять на регуляцию тран!
Известны случаи, когда внутри последова!
скрипции.
тельности интрона находятся отдельные белок!
Хотя основной функцией интронов считает!
кодирующие гены. Такие вложенные гены были
ся создание потенциала для появления новых
найдены у многих эукариотических организмов
вариантов белка, интроны также могут влиять
и встречаются относительно часто: у человека
на скорость и эффективность экспрессии гена.
известно, как минимум, 158 белок!кодирующих
Присутствие интронов в генах значительно ус!
генов, расположенных внутри интронов [89], а у
ложняет не только структуру генома, но и регу!
плодовой мухи количество вложенных генов
ляцию связанных с ним процессов, что в итоге
составляет почти 10% от общего числа генов [89].
создает большую гибкость для адаптации орга!
При этом функционально ген!хозяин и вложен!
низма и дает достаточно преимуществ над всеми
ный ген могут быть совсем не связаны, их
энергическими затратами, потраченными на со!
экспрессионные профили также могут мало кор!
держание интронов и их сохранение в ходе эво!
релировать [90]. Сравнительный анализ вложен!
люции.
ных генов у нематод, плодовых мух и позвоноч!
ных показал, что в ходе эволюции таких генов
становится все больше, и их накопление увели!
Финансирование. Исследование выполнено
чивает сложность организации геномов [91].
при финансовой поддержке Российского фонда
фундаментальных исследований (грант № 18!
Суммируя вышенаписанное, сплайсосом!
34!00932).
ные интроны, исторически относящиеся к «му!
Конфликт интересов. Авторы заявляют об от!
сорной» ДНК, играют важную роль в жизни
сутствии конфликта интересов.
многих эукариотических клеток, и их закрепле!
Соблюдение этических норм. Настоящая
ние в генах в ходе эволюции больше не вызыва!
статья не содержит описания выполненных ав!
ет удивления. Эволюция сплайсосомных интро!
торами исследований с использованием людей
нов неразрывно связана с эволюцией экзон!
и животных в качестве объектов.
СПИСОК ЛИТЕРАТУРЫ
1.
Chow, L. T., Gelinas, R. E., Broker, T. R., and Roberts, R. J.
4.
Rogozin, I. B., Carmel, L., Csuros, M., and Koonin, E. V.
(1977) An amazing sequence arrangement at the 5!ends of
(2012) Origin and evolution of spliceosomal introns, Biol.
adenovirus 2 messenger RNA, Cell, 12, 1!8, doi: 10.1016/
Direct., 7, 11, doi: 10.1186/1745!6150!7!11.
0092!8674(77)90180!5.
5.
Luo, M. J., and Reed, R. (1999) Splicing is required for
2.
Berget, S. M., Moore, C., and Sharp, P. A. (1977) Spliced
rapid and efficient mRNA export in metazoans, Proc. Natl.
segments at the 5!terminus of adenovirus 2 late mRNA,
Acad. Sci. USA, 96, 14937!14942.
Proc. Natl. Acad. Sci. USA, 74, 3171!3175.
6.
Patel, A. A., and Steitz, J. A. (2003) Splicing double:
3.
Gilbert, W. (1978) Why genes in pieces, Nature, 271, 501,
insights from the second spliceosome, Nat. Rev. Mol. Cell
doi: 10.1038/271501a0.
Biol., 4, 960!970, doi: 10.1038/nrm1259.
БИОХИМИЯ том 85 вып. 7 2020
860
ПОВЕРЕННАЯ, РОЙТБЕРГ
7.
Patel, A. A., McCarthy, M., and Steitz, J. A. (2002) The
25.
Koonin, E. V. (2009) Intron!dominated genomes of early
splicing of U12!type introns can be a rate!limiting step in
ancestors of eukaryotes, J. Hered., 100, 618!623, doi:
gene expression, EMBO J., 21, 3804!3815, doi: 10.1093/
10.1093/jhered/esp056.
emboj/cdf297.
26.
Charlesworth, B. (2009) Fundamental concepts in genet!
8.
Chorev, M., and Carmel, L. (2012) The function of
ics: effective population size and patterns of molecular evo!
introns, Front. Genet., 3, 1!15, doi: 10.3389/fgene.2012.
lution and variation, Nat. Rev. Genet., 10, 195!205, doi:
00055.
10.1038/nrg2526.
9.
Fedorova, L., and Fedorov, A. (2003) Introns in gene evo!
27.
Fedorov, A., Merican, A. F., and Gilbert, W. (2002) Large!
lution, Genetica, 118, 123!131.
scale comparison of intron positions among animal, plant,
10.
Parenteau, J., Durand, M., Morin, G., Gagnon, J.,
and fungal genes, Proc. Natl. Acad. Sci. USA, 99, 16128!
Lucier, J.!F., Wellinger, R. J., Chabot, B., and Abou Elela, S.
16133, doi: 10.1073/pnas.242624899.
(2011) Introns within ribosomal protein genes regulate the
28.
Carmel, L., Rogozin, I. B., Wolf, Y. I., and Koonin, E. V.
production and function of yeast ribosomes, Cell, 147, 320!
(2007) Patterns of intron gain and conservation in eukaryotic
331, doi: 10.1016/j.cell.2011.08.044.
genes, BMC Evol. Biol., 7, 192, doi: 10.1186/1471!2148!7!192.
11.
Cannone, J. J., Subramanian, S., Schnare, M. N., Collett,
29.
Roy, S. W. (2016) How common is parallel intron gain?
J. R., D’Souza, L. M., Du, Y., Feng, B., Lin, N.,
rapid evolution versus independent creation in recently
Madabusi, L. V., Müller, K. M., Pande, N., Shang, Z., Yu, N.,
created introns in Daphnia, Mol. Biol. Evol., 33, 1902!
and Gutell, R. R. (2002) The comparative RNA web
1906, doi: 10.1093/molbev/msw091.
(CRW) site: an online database of comparative sequence
30.
Mourier, T., and Jeffares, D. C. (2003) Eukaryotic intron
and structure information for ribosomal, intron, and other
loss, Science, 300, 1393, doi: 10.1126/science.1080559.
RNAs, BMC Bioinformatics, 3, 2.
31.
Hong, X., Scofield, D. G., and Lynch, M. (2016) Intron
12.
Lane, C. E., van den Heuvel, K., Kozera, C., Curtis, B. A.,
size, abundance, and distribution within untranslated
Parsons, B. J., Bowman, S., and Archibald, J. M. (2007)
regions of genes, Mol. Biol. Evol., 23, 2392!2404, doi:
Nucleomorph genome of Hemiselmis andersenii reveals
10.1093/molbev/msl111.
complete intron loss and compaction as a driver of protein
32.
Sverdlov, A. V., Csuros, M., Rogozin, I. B., and Koonin, E. V.
structure and function, Proc. Natl. Acad. Sci. USA, 104,
(2007) A glimpse of a putative pre!intron phase of eukary!
19908!19913, doi: 10.1073/pnas.0707419104.
otic evolution, Trends Genet., 23, 105!108, doi: 10.1016/
13.
Rogers, J. H. (1989) How were introns inserted into
j.tig.2007.01.001.
nuclear genes? Trends Genet., 5, 213!216.
33.
Derr, L. K., Strathern, J. N., and Garfinkel, D. J. (1991)
14.
Cavalier!Smith, T. (1991) Intron phylogeny: a new
RNA!mediated recombination in S. cerevisiae, Cell, 67,
hypothesis, Trends Genet., 7, 145!148.
355!364, doi: 10.1016/0092!8674(91)90187!4.
15.
Csuros, M., Rogozin, I. B., and Koonin, E. V. (2011) A
34.
Lee, S., and Stevens, S. W. (2016) Spliceosomal introno!
detailed history of intron!rich eukaryotic ancestors inferred
genesis, Proc. Natl. Acad. Sci. USA, 113, 6514!6519, doi:
from a global survey of 100 complete genomes, PLoS
10.1073/pnas.1605113113.
Comput. Biol., 7, 1!9, doi: 10.1371/journal.pcbi.1002150.
35.
Sverdlov, A. V., Babenko, V. N., Rogozin, I. B., and
16.
Sakurai, A., Fujimori, S., Kochiwa, H., Kitamura!Abe, S.,
Koonin, E. V. (2004) Preferential loss and gain of introns in
Washio, T., Saito, R., Carninci, P., Hayashizaki, Y., and
3 portions of genes suggests a reverse!transcription mech!
Tomita, M. (2002) On biased distribution of introns in var!
anism of intron insertion, Gene,
338,
85!91, doi:
ious eukaryotes, Gene, 300, 89!95.
10.1016/j.gene.2004.05.027.
17.
Ponjavic, J., Ponting, C. P., and Lunter, G.
(2007)
36.
Tarr o, R., Ayala, F. J., and Rodr guez Trelles, F. (2008)
Functionality or transcriptional noise? Evidence for selec!
Alternative splicing: a missing piece in the puzzle of intron
tion within long noncoding RNAs, Genome Res., 17, 556!
gain, Proc. Natl. Acad. Sci. USA, 105, 7223!7228, doi:
565, doi: 10.1101/gr.6036807.
10.1073/pnas.0802941105.
18.
Parada, G. E., Munita, R., Cerda, C. A., and Gysling, K.
37.
Rigau, M., Juan, D., Valencia, A., and Rico, D. (2019)
(2014) A comprehensive survey of non!canonical splice
Intronic CNVs and gene expression variation in human
sites in the human transcriptome, Nucleic Acids Res., 42,
populations, PLoS Genet., 15, e1007902, doi: 10.1371/
16.
journal.pgen.1007902.
19.
Pucker, B., and Brockington, S. F. (2018) Genome!wide
38.
Yenerall, P., Krupa, B., and Zhou, L. (2011) Mechanisms
analyses supported by RNA!Seq reveal non!canonical
of intron gain and loss in Drosophila, BMC Evol. Biol., 11,
splice sites in plant genomes, BMC Genomics, 19, 980, doi:
364, doi: 10.1186/1471!2148!11!364.
10.1186/s12864!018!5360!z.
39.
Lehmann, J., Eisenhardt, C., Stadler, P. F., and Krauss, V.
20.
Alioto, T. S. (2007) U12DB: a database of orthologous
(2010) Some novel intron positions in conserved
U12!type spliceosomal introns, Nucleic Acids Res., 35,
Drosophila genes are caused by intron sliding or tandem
D110!D115, doi: 10.1093/nar/gkl796.
duplication, BMC Evol. Biol., 10, 156, doi: 10.1186/1471!
21.
Schellenberg, M. J., Ritchie, D. B., and MacMillan, A. M.
2148!10!156.
(2008) Pre!mRNA splicing: a complex picture in higher
40.
Krauss, V., Pecyna, M., Kurz, K., and Sass, H. (2005)
definition, Trends Biochem. Sci., 33, 243!246, doi:
Phylogenetic mapping of intron positions: a case study of
10.1016/j.tibs.2008.04.004.
translation initiation factor eIF2γ, Mol. Biol. Evol., 22, 74!
22.
Sverdlov, A. V., Rogozin, I. B., Babenko, V. N., and
84, doi: 10.1093/molbev/msh255.
Koonin, E. V. (2003) Evidence of splice signal migration
41.
Поверенная И. В., Горев Д. Д., Астахова Т. В., Цитович И. И.,
from exon to intron during intron evolution, Curr. Biol., 13,
Яковлев В. В., Ройтберг, М. А. (2017) Слайдинг и ва!
2170!2174, doi: 10.1016/j.cub.2003.12.003.
риабельность длины интронов для генов, обогащен!
23.
Kim, E., Magen, A., and Ast, G. (2007) Different levels of
ных длинными интронами фазы 1, Матем. биология и
alternative splicing among eukaryotes, Nucleic Acids Res.,
биоинформ., 12, 302!316, doi: 10.17537/2017.12.302.
35, 125!131, doi: 10.1093/nar/gkl924.
42.
De Souza, S. J., Long, M., Klein, R. J., Roy, S., Lin, S.,
24.
Nguyen, H. D., Yoshihama, M., and Kenmochi, N. (2006)
and Gilbert, W. (1998) Toward a resolution of the introns
Phase distribution of spliceosomal introns: implications for
early/late debate: only phase zero introns are correlated
intron origin, BMC Evol. Biol., 6, 69, doi: 10.1186/1471!
with the structure of ancient proteins, Proc. Natl. Acad. Sci.
2148!6!69.
USA, 95, 5094!5099.
БИОХИМИЯ том 85 вып. 7 2020
ОБЗОР ПО СПЛАЙСОСОМНЫМ ИНТРОНАМ
861
43.
Stoltzfus, A., Logsdon, J. M., Palmer, J. D., and
62.
Vinogradov, A. E. (2006) “Genome design” model: evidence
Doolittle, W. F. (1997) Intron “sliding” and the diversity of
from conserved intronic sequence in human!mouse com!
intron positions, Proc. Natl. Acad. Sci. USA, 94, 10739!
parison, Genome Res., 16, 347!354, doi: 10.1101/gr.4318206.
10744.
63.
Seoighe, C., and Korir, P. K. (2011) Evidence for intron
44.
Bocco, S. S., and Csűrös, M. (2016) Splice sites seldom
length conservation in a set of mammalian genes associat!
slide: intron evolution in oomycetes, Genome Biol. Evol., 8,
ed with embryonic development, BMC Bioinformatics, 12,
2340!2350, doi: 10.1093/gbe/evw157.
Suppl. 9, S16, doi: 10.1186/1471!2105!12!S9!S16.
45.
Rogozin, I. B., Lyons!Weiler, J., and Koonin, E. V. (2000)
64.
Щепеткова И. Л., Гельфанд М. С. (1997) Некоторые
Intron sliding in conserved gene families, Trends Genet.,
статистические особенности сайтов сплайсинга поз!
16, 430!432, doi: 10.1016/s0168!9525(00)02096!5.
воночных и беспозвоночных, Биофизика, 42, 82!89.
46.
Fekete, E., Flipphi, M., Ág, N., Kavalecz, N., Cerqueira, G.,
65.
Marais, G., Nouvellet, P., Keightley, P. D., and
Scazzocchio, C., and Karaffa, L. (2017) A mechanism for
Charlesworth, B. (2005) Intron size and exon evolution in
a single nucleotide intron shift, Nucleic Acids Res., 45,
Drosophila, Genetics, 170, 481!485, doi: 10.1534/genetics.
9085!9092, doi: 10.1093/nar/gkx520.
104.037333.
47.
Roesner, A., Fuchs, C., Hankeln, T., and Burmester, T.
66.
Wu, X., and Hurst, L. D. (2015) Why selection might be
(2005) A globin gene of ancient evolutionary origin in
stronger when populations are small: intron size and densi!
lower vertebrates: evidence for two distinct globin families
ty predict within and between!species usage of exonic
in animals, Mol. Biol. Evol., 22, 12!20, doi: 10.1093/
splice associated cis!motifs, Mol. Biol. Evol., 32, 1847!
molbev/msh258.
1861, doi: 10.1093/molbev/msv069.
48.
Long, M., de Souza, S. J., Rosenberg, C., and Gilbert, W.
67.
Haddrill, P. R., Charlesworth, B., Halligan, D. L., and
(1998) Relationship between “proto!splice sites” and
Andolfatto, P. (2005) Patterns of intron sequence evolution
intron phases: evidence from dicodon analysis, Proc. Natl.
in Drosophila are dependent upon length and GC content,
Acad. Sci. USA, 95, 219!223.
Genome Biol., 6, R67, doi: 10.1186/gb!2005!6!8!r67.
49.
Fedorov, A., Suboch, G., Bujakov, M., and Fedorova, L.
68.
Keane, P. A., and Seoighe, C. (2016) Intron length coevo!
(1992) Analysis of nonuniformity in intron phase distribu!
lution across mammalian genomes, Mol. Biol. Evol., 33,
tion, Nucleic Acids Res., 20, 2553!2557.
2682!2691, doi: 10.1093/molbev/msw151.
50.
Endo, T., Fedorov, A., de Souza, S. J., and Gilbert, W.
69.
Pozzoli, U., Menozzi, G., Comi, G. P., Cagliani, R.,
(2002) Do introns favor or avoid regions of amino acid
Bresolin, N., and Sironi, M. (2007) Intron size in mam!
conservation? Mol. Biol. Evol.,
19,
521!252, doi:
mals: complexity comes to terms with economy, Trends
10.1093/oxfordjournals.molbev.a004107.
Genet., 23, 20!24, doi: 10.1016/j.tig.2006.10.003.
51.
Gilbert, W., de Souza, S. J., and Long, M. (1997) Origin of
70.
Castillo!Davis, C. I., Mekhedov, S. L., Hartl, D. L.,
genes, Proc. Natl. Acad. Sci. USA, 94, 7698!7703.
Koonin, E. V., and Kondrashov, F. A. (2002) Selection for
52.
Logsdon, J. M. (1998) The recent origins of spliceosomal
short introns in highly expressed genes, Nat. Genet., 31,
introns revisited, Curr. Opin. Genet. Dev., 8, 637!648.
415!418, doi: 10.1038/ng940.
53.
Long, M., and Deutsch, M. (1999) Association of intron
71.
Rao, Y. S., Wang, Z. F., Chai, X. W., Wu, G. Z., Zhou, M.,
phases with conservation at splice site sequences and evolu!
Nie, Q. H., and Zhang, X. Q. (2010) Selection for the
tion of spliceosomal introns, Mol. Biol. Evol., 16, 1528!1534.
compactness of highly expressed genes in Gallus gallus,
54.
Ruvinsky, A., Eskesen, S. T., Eskesen, F. N., and Hurst, L. D.
Biol. Direct, 5, 35, doi: 10.1186/1745!6150!5!35.
(2005) Can codon usage bias explain intron phase distribu!
72.
Zhang, Q., and Edwards, S. V. (2012) The evolution of
tions and exon symmetry? J. Mol. Evol., 60, 99!104, doi:
intron size in amniotes: a role for powered flight? Genome
10.1007/s00239!004!0032!9.
Biol. Evol., 4, 1033!1043, doi: 10.1093/gbe/evs070.
55.
Астахова Т. В., Ройтберг М. А., Цитович И. И., Яков!
73.
Duret, L., Mouchiroud, D., and Gautier, C.
(1995)
лев В. В. (2014) Закономерности, связанные с распре!
Statistical analysis of vertebrate sequences reveals that long
делением длин интронов, Матем. биология и биоин-
genes are scarce in GC!rich isochores, J. Mol. Evol., 40,
форм., 9, 482!490.
308!317, doi: 10.1007/bf00163235.
56.
Ruvinsky, A., and Ward, W. (2008) Intron framing exonic
74.
Versteeg, R., van Schaik, B. D. C., van Batenburg, M. F.,
nucleotides: a compromise between protein coding and
Roos, M., Monajemi, R., Caron, H., Bussemaker, H. J.,
splicing constraints, Open Evol. J., 2, 7!12, doi: 10.2174/
and van Kampen, A. H. C. (2003) The human transcrip!
1874404400802010007.
tome map reveals extremes in gene density, intron length,
57.
Halligan, D. L., and Keightley, P. D. (2006) Ubiquitous
GC content, and repeat pattern for domains of highly and
selective constraints in the Drosophila genome revealed by
weakly expressed genes, Genome Res., 13, 1998!2004,
a genome!wide interspecies comparison, Genome Res., 16,
doi: 10.1101/gr.1649303.
875!884, doi: 10.1101/gr.5022906.
75.
Chaurasia, A., Tarallo, A., Bernà, L., Yagi, M., Agnisola, C.,
58.
Bradnam, K. R., and Korf, I. (2008) Longer first introns
and D’Onofrio, G. (2014) Length and GC content vari!
are a general property of eukaryotic gene structure, PLoS
ability of introns among teleostean genomes in the light of
One, 3, e3093, doi: 10.1371/journal.pone.0003093.
the metabolic rate hypothesis, PLoS One, 9, e103889,
59.
Farlow, A., Dolezal, M., Hua, L., and Schlötterer, C.
doi: 10.1371/journal.pone.0103889.
(2012) The genomic signature of splicing!coupled selec!
76.
Zhang, Q., Li, H., Zhao, X.!Q., Xue, H., Zheng, Y.,
tion differs between long and short introns, Mol. Biol.
Meng, H., Jia, Y., and Bo, S.!L. (2016) The evolution
Evol., 29, 21!24, doi: 10.1093/molbev/msr201.
mechanism of intron length, Genomics, 108, 47!55,
60.
Shepard, S., Mc Creary, M., and Fedorov, A. (2009) The
doi: 10.1016/j.ygeno.2016.07.004.
peculiarities of large intron splicing in animals, PLoS One,
77.
Sathe, L., Bolinger, C., Mannan, M. A., Dever, T. E., and
4, e7853, doi: 10.1371/journal.pone.0007853.
Dey, M. (2015) Evidence that base!pairing interaction
61.
Sibley, C. R., Emmett, W., Blazquez, L., Faro, A.,
between intron and mRNA leader sequences inhibits initi!
Haberman, N., Briese, M., Trabzuni, D., Ryten, M.,
ation of HAC1 mRNA translation in yeast, J. Biol. Chem.,
Weale, M. E., Hardy, J., Modic, M., Curk, T., Wilson, S. W.,
290, 21821!21832, doi: 10.1074/jbc.M115.649335.
Plagnol, V., and Ule, J. (2015) Recursive splicing in long
78.
Lynch, M. (2002) Intron evolution as a population!genet!
vertebrate genes, Nature, 521, 371!375, doi: 10.1038/
ic process, Proc. Natl. Acad. Sci.,
99,
6118!6123,
nature14466.
doi: 10.1073/pnas.092595699.
БИОХИМИЯ том 85 вып. 7 2020
862
ПОВЕРЕННАЯ, РОЙТБЕРГ
79.
Jo, B.!S., and Choi, S. S. (2015) Introns: the functional
ed matrix attachment regions, Trends Genet., 19, 119!124,
benefits of introns in genomes, Genomics Inform., 13, 112!
doi: 10.1016/S0168!9525(03)00016!7.
118, doi: 10.5808/GI.2015.13.4.112.
86. Tycowski, K. T., Shu, M. D., and Steitz, J. A. (1993) A small
80.
Shaul, O. (2017) How introns enhance gene expression,
nucleolar RNA is processed from an intron of the human gene
Int. J. Biochem. Cell Biol., 91, 145!155, doi: 10.1016/
encoding ribosomal protein S3, Genes Dev., 7, 1176!1190.
j.biocel.2017.06.016.
87. Rearick, D., Prakash, A., McSweeny, A., Shepard, S. S.,
81.
Lim, C. S., T Wardell, S. J., Kleffmann, T., and Brown,
Fedorova, L., and Fedorov, A. (2011) Critical association
C. M. (2018) The exon!intron gene structure upstream of
of ncRNA with introns, Nucleic Acids Res., 39, 2357!2366,
the initiation codon predicts translation efficiency,
doi: 10.1093/nar/gkq1080.
Nucleic Acids Res., 46, 4575!4591, doi: 10.1093/nar/
88. Vakhrusheva, O. A., Bazykin, G. A., and Kondrashov, A. S.
gky282.
(2013) Genome!level analysis of selective constraint with!
82.
Parenteau, J., Maignon, L., Berthoumieux, M., Catala, M.,
out apparent sequence conservation, Genome Biol. Evol., 5,
Gagnon, V., and Abou Elela, S. (2019) Introns are media!
532!541, doi: 10.1093/gbe/evt023.
tors of cell response to starvation, Nature, 565, 612!617,
89. Kumar, A. (2009) An overview of nested genes in eukaryot!
doi: 10.1038/s41586!018!0859!7.
ic genomes, Eukaryot. Cell, 8, 1321!1329, doi: 10.1128/
83.
Morgan, J. T., Fink, G. R., and Bartel, D. P. (2019)
EC.00143!09.
Excised linear introns regulate growth in yeast, Nature,
90. Lee, Y. C. G., and Chang, H.!H. (2013) The evolution and
565, 606!611, doi: 10.1038/s41586!018!0828!1.
functional significance of nested gene structures in
84.
Majewski, J., and Ott, J. (2002) Distribution and charac!
Drosophila melanogaster, Genome Biol. Evol., 5, 1978!1985,
terization of regulatory elements in the human genome,
doi: 10.1093/gbe/evt149.
Genome Res., 12, 1827!1836, doi: 10.1101/gr.606402.
91. Assis, R., Kondrashov, A. S., Koonin, E. V., and
85.
Glazko, G. V., Koonin, E. V., Rogozin, I. B., and
Kondrashov, F. A. (2008) Nested genes and increasing
Shabalina, S. A. (2003) A significant fraction of conserved
organizational complexity of metazoan genomes, Trends
noncoding DNA in human and mouse consists of predict!
Genet., 24, 475!478, doi: 10.1016/j.tig.2008.08.003.
SPLICEOSOMAL INTRONS: FEATURES, FUNCTIONS, AND EVOLUTION
Review
2,3,4
I. V. Poverennaya1,2* and M. A. Roytberg
1 Vavilov Institute of General Genetics, Russian Academy of Sciences,
119991 Moscow, Russia; E-mail: ipoverennaya@gmail.com
2 Institute of Mathematical Problems of Biology RAS — the Branch of Keldysh Institute of Applied Mathematics
of Russian Academy of Sciences, 142290 Puschino, Moscow Region, Russia
3 Moscow Institute of Physics and Technology (National Research University),
141701 Dolgoprudny, Moscow Region, Russia
4 National Research University, Higher School of Economics, 101000 Moscow, Russia
Received March 26, 2020
Revised May 25, 2020
Accepted May 25, 2020
Spliceosomal introns contained in most eukaryotic genes are non!coding sequences excised from pre!mRNA by a
special complex called spliceosome during mRNA splicing. Introns occur in both protein!coding and RNA!coding
genes, and even more, can be found in the coding and untranslated regions of genes. Due to a high rate of polymor!
phism, the intron sequences may vary greatly and intron function used to be associated only with its presence for alter!
native splicing. Therefore, intron evolution has been seen not as the evolution of an individual genome element, but
rather as the evolution of a gene intron!exon structure. Here we review the intron origin theories: evolutionary events
in the exon!intron structure such as intron gain, loss, and sliding; intron functions known to date; and how changes
of such intron features as length and phase can affect the regulation of processes involving genes.
Keywords: spliceosomal introns, intron phase, intron length, evolution, sliding, exon!intron!structure
БИОХИМИЯ том 85 вып. 7 2020