БИОФИЗИКА, 2023, том 68, № 1, с. 5-10
МОЛЕКУЛЯРНАЯ БИОФИЗИКА
УДК 577.3
КОНФОРМАЦИОННЫЕ АСПЕКТЫ ФОРМИРОВАНИЯ СТРУКТУР
ОСТОВА ПОЛИПЕПТИДНЫХ ЦЕПЕЙ В БЕЛКАХ.
СВЯЗЬ КОНФОРМАЦИОННОЙ СТАБИЛЬНОСТИ/ЛАБИЛЬНОСТИ
С ТИПОМ β-ИЗГИБОВ
© 2023 г. И.Ю. Тоpшин*, #, И.В. Филатов**, А.В. Батяновский***, К.В. Смирнов****,
А.А. Анашкина**** Н.Г. Есипова****, В.Г. Туманян****
*Вычислительный центр им. А.А. Дородницина Федерального исследовательского центра
«Информатика и управление» PАН, ул. Вавилова, 40, Москва, 119333, Россия
**Моcковcкий физико-технический институт, Институтский пер.,
9, Долгопрудный Моcковcкой области, 141700, Россия
***Институт биофизики клетки и клеточной инженерии НАН Беларуси,
ул. Академическая, 27, Минск, 220072, Беларусь
****Институт молекулярной биологии им. В.А. Энгельгаpдта PАН, ул. Вавилова, 32, Москва, 119991, Россия
#E-mail: tiy135@yahoo.com
Поступила в редакцию 14.11.2022 г.
После доработки 11.12.2022 г.
Принята к публикации 14.12.2022 г.
Для оценки характера связи между интегральной конформационной стабильностью тетрапептидов
и главными типами β-изгибов (также являющихся тетрапептидами) рассчитаны спектр-диаграм-
мы, асимметрия распределения конформационно-стабильных и конформационно-нестабильных
тетрапептидов. Показано, что β-изгибы типов I', II и II' состоят, в основном, конформационно-ла-
бильных пептидов, что согласуется с контекстно-предопределенным характером их структуры. По-
скольку, как мы показали ранее, в этом случае конформация навязывается внешними условиями
(конкретно, замыканием цикла), превалирование конформационно-лабильных пептидов облегча-
ет формирование структуры за счет внешних факторов. Тип I β-изгиба представляет собой исклю-
чение: в нем пептиды с разной конформационной лабильностью распределены достаточно равно-
мерно. Можно предположить, что формирование β-изгиба I-го типа не является контекстно-обу-
словленным.
Ключевые слова: конформационно стабильные/лабильные сегменты белка, локальная структура белка,
конформационный анализ, β-изгибы, статистический анализ, молекулярная динамика.
DOI: 10.31857/S0006302923010015, EDN: NYMYUD
Общие представления о β-изгибах сводятся к
Для β-изгиба характерна четко очерченная ло-
тому, что это - типовой структурный элемент
кальная структура (иначе говоря, определенный
белка, представляющий интерес как сам по себе,
тип вторичной структуры), причем определенно-
так и в качестве составной части определенного
го размера. В отличие от α-спирали, β-структуры
или левой спирали PPII (при исследовании кото-
уровня иерархии структуры белка. Эта иерархия,
рых встает вопрос об их длине и о критериях, ис-
вообще говоря, не может не отражать процесса
пользуемых для определения длины), длина β-из-
складывания белка в глобулу (так называемый
гиба - строго четыре аминокислотных остатка.
фолдинг) и комплексы глобул. Значение пробле-
Важно и то, что β-изгиб - небольшой структур-
мы β-изгибов подчеркивается тем обстоятель-
ный мотив, конформация которого определяется
ством, что в некоторых белках их доля достигает
малым числом степеней свободы, что делает воз-
80%, т.е. они встречаются чаще α-спиралей и β-тя-
можным применение переборных алгоритмов.
жей. По оценке, сделанной в работе [1], каждый
Среди структурных функций β-изгиба самая оче-
четвертый остаток входит в состав β-изгиба. Зача-
видная связана с изменением хода полипептид-
стую β-изгибы являются компонентом более
ной цепи на обратный, что отражено в альтерна-
сложного структурного элемента, прежде всего
тивном названии β-изгиба - «обратный поворот»
так называемых β-шпилек [2, 3].
(reverse turn). Такого рода изменение хода поли-
5
6
ТОPШИН и др.
пептидной цепи способствует ее компактизации
ностей становится очевидным, в частности, из
и формированию белковой глобулы.
рассмотрения карт Рамачандрана для β-изгибов:
Таким образом, доля β-изгибов в белках доста-
точки на картах для остатков i+1 и/или i+2 в изги-
бах сконцентрированы в запрещенных областях
точно велика, их структурное и функциональное
карты Рамачандрана (см., например, работу [6]).
значение вполне очевидно. Между тем в имею-
щихся представлениях о β-изгибах до сих пор
Более или менее «свободной» конформационной
присутствуют существенные пробелы и противо-
картой характеризуется только β-изгиб типа I.
речия. В частности, аннотация этих типов
Возникает вопрос: каким образом β-изгиб приоб-
ретает конформацию, которая представляется
локальной структуры и способы их прогнозиро-
энергетически «напряженной»? Второй вопрос:
вания, исходя из аминокислотной последова-
тельности, нуждаются в дальнейшем совершен-
коль скоро энергетически «напряженная» струк-
ствовании. Действительно, хотя в прогнозирова-
тура уже образовалась, как компенсируется «не-
нии β-изгибов наметился заметный прогресс, он
благоприятная» энергия, свойственная этой
структуре?
связан не с углублением наших представлений об
этом типе структуры, а с применением более эф-
Ответ на первый вопрос был исследован на-
фективных методов интеллектуального анализа
шим коллективом путем привлечения геометри-
данных и так называемого машинного обучения
ческих представлений об уменьшении числа не-
(метод поддерживающих векторов, сверточные
зависимых конформационных параметров в цик-
нейронные сети и др. [4, 5]). Дальнейший рост ка-
ле, образованном олигопептидом [7]. Вследствие
чества прогнозирования ограничен не только
замыкания цикла (через водородную cвязь между
трудностями в исходной аннотации β-изгибов, но
первым и последним остатками β-изгиба) число
и тем, что фактически приходится решать две раз-
независимых конформационных параметров
личные задачи: нахождение места β-изгиба в по-
уменьшается наcтолько, что определение кон-
липептидной цепи и определение типа изгиба.
формации может быть сведено к чисто геометри-
Следует добавить, что чисто биоинформацион-
ческому расчету. Такой геометрический анализ
ный подход, при котором исследуется схожесть
был проведен в работе [8] для основных типов
аминокислотных последовательностей, имеет
β-изгибов c использованием независимых мето-
ограниченную область применения. Дальнейшее
дов - оригинальной процедуры геометрии рас-
углубление понимания проблемы β-изгибов сле-
стояний (distance geometry) и процедуры перебо-
дует искать на пути анализа физико-химических
ра конформаций. Было продемонстрировано, что
свойств этих локальных структур.
число геометрически возможных конформаций в
Как для всего белка, так и для β-изгибов одной
этом случае сводится к двум: первое из найден-
из важнейших проблем является поиск взаимо-
ных решений совпадает с данными рентгено-
связей между структурой изгибов, аминокислот-
структурного анализа, а второе хотя и геометри-
ными последовательностями собственно β-изги-
чески корректно, но приходится на абсолютно за-
бов («текст») и последовательностями фланкиру-
прещенные области карты Рамачандрана (т.е.
ющих областей, играющих роль «контекста». В
соответствует крайне выраженным стерическим
настоящей работе поставлена и получила посиль-
затруднениям). Таким образом, вследствие замы-
ное решение оригинальная задача о взаимосвязи
кания водородной связи образуется своеобраз-
основных структурных черт конкретного типа β-
ный «топологический замок» и этот фактор кон-
изгиба и конформационной подвижности/ла-
текста приводит к формированию конформации
бильности составляющих его сегментов. Такая
β-изгиба.
взаимосвязь может дать возможность прогнози-
рования β-изгибов посредством оценки конфор-
Что касается ответа на второй вопрос, то оче-
мационной стабильности/лабильности его сег-
видно, что даже при фиксированной геометрии
ментов.
β-изгиба энергия соответствующей локальной
структуры не может быть слишком «неблагопри-
ятной», иначе произойдет кардинальная пере-
О КОНТЕКСТЕ β-ИЗГИБОВ
стройка и реализуется существенно иная структу-
В СТРУКТУРАХ БЕЛКОВ
ра. Наличие конформационно нестабильных сег-
Проблемы взаимосвязи структуры и последо-
ментов позволило бы неблагоприятной энергии
вательности аминокислот, стабилизации струк-
«рассосаться» по многим степеням свободы, и,
туры, роли «текста» и «контекста» в случае β-из-
тем самым, «лишнее» напряжение было бы снято.
гибов сводятся к решению конкретных задач оп-
Включение конформационно лабильных сегмен-
тимизации по геометрическим и энергетическим
тов увеличивает число степеней свободы и эф-
критериям. Подчеркнем, что формирование всех
фекта цикла не наблюдается. Итак, сегменты с
типов β-изгибов (а не только изгибов II' типа) со-
вынужденной (навязанной) конформацией, взя-
пряжено с преодолением стереохимических пре-
тые сами по себе, a priori должны были бы быть
пятствий. Наличие таких стереохимических труд-
конформационно лабильными.
БИОФИЗИКА том 68
№ 1
2023
КОНФОРМАЦИОННЫЕ АСПЕКТЫ ФОРМИРОВАНИЯ СТРУКТУР
7
КОНФОРМАЦИОННАЯ СТАБИЛЬНОСТЬ
(1 - минимальная конформационная стабиль-
β-ИЗГИБОВ И КОНФИГУРАЦИИ
ность, 5 - максимальная конформационная ста-
ТЕТРАПЕПТИДОВ
бильность).
В связи с изложенным мы пришли к необходи-
В общем списке из 122100 тетрапептидов были
мости оценить конформационную стабильность
выделены тетрапептиды, для второго и третьего
тетрапептидов, образующих β-изгибы, с помо-
остатков которых преимущественной конформа-
щью разработанных нами ранее оценок конфор-
цией (т.е. конформацией, встречавшейся чаще
мационной лабильности/стабильности тетрапеп-
любой другой) являлся β-изгиб одного из четырех
тидов (см. работу [9]). Напомним, что интерес к
типов (I, I', II, II'). Определения β-изгибов соот-
β-изгибам как к особым фрагментам вторичной
ветствовали критериям из работы [6]. Далее пред-
структуры связан с тем, что, с одной стороны,
ставлены результаты анализа тетрапептидов, пре-
конформация β-изгиба может быть навязана кон-
имущественной конформацией которых (более
текстом в структуре белка. С другой стороны,
50% конформаций из найденных в PDB для дан-
имеющиеся алгоритмы прогнозирования β-изги-
ного пептида) являлся один из четырех типов из-
бов позволяют успешно проводить такое прогно-
гибов (I, I', II, II'). Таких тетрапетидов было най-
зирование (с аккуратностью распознавания 75-
дено всего 64769.
82%) при рассмотрении достаточно небольшого
Среди этих тетрапептидов с преимуществен-
контекста в последовательностях вокруг β-изги-
ной конформацией в виде одного из типов β-из-
бов (5-7 остатков). Поэтому представляет инте-
гибов наиболее часто встречались пептиды с β-
рес изучить, как именно соотносится наличие
изгибом типа I, соответствующие (в большинстве
структуры β-изгибов с конформационной ста-
случаев) α-спиралям (в широком смысле, вклю-
бильностью/лабильностью составляющих их тет-
чая спирали 3/10) или их «кэпирующим» фраг-
рапептидов («текстов») и фланкирующих обла-
ментам (63770 тетрапептидов). Тетрапептиды,
стей («контекстов») и есть ли вообще такое соот-
наиболее частой конформацией которых являет-
ношение.
ся β-изгиб других трех типов, встречались гораздо
Как показано в нашей предыдущей работе по
реже: тип I' - 331 тетрапептид, тип II - 41 тетра-
мерам конформационной стабильности/лабиль-
пептид, тип II' - 627 тетрапептидов. Обращает на
ности s1-s5 [9], в файлах из банка данных PDB
себя внимание, что изгибу II', самому напряжен-
найдено 122100 различных тетрапептидов, кото-
ному со стереохимической точки зрения, соот-
рые встречались не менее пяти раз в различных
ветствует большее количество различных амино-
структурах. При более редкой встречаемости пеп-
кислотных последовательностей тетрапептидов.
тидов (менее пяти случаев по всему банку данных
Следует подчеркнуть, что приведенные выше
PDB) использование разработанных мер конфор-
данные являются новыми, уникальными и не
мационной лабильности s1-s5, основанных на
имеющими мировых аналогов, так как относятся
сборе статистики конформаций, не вполне обос-
не к частоте встречаемости конформаций (кото-
новано статистически.
рая обычно представлена в имеющейся литерату-
Нахождение в PDB всего 122100 из ~160000
ре), а к тетрапептидам (сегментам длиной четыре
комбинаторно возможных тетрапептидов указы-
аминокислоты с определенной последовательно-
вает, скорее всего, на особенности аминокислот-
стью), конформации которых преимущественно
ных последовательностей кристаллизуемых бел-
ассоциированы с указанными выше типами изги-
ков, которые составляют 90% от объема данных в
бов, т.е. эти данные имеют отношение собствен-
PDB (остальные 10% структур определены с при-
но к «тексту», а не к «контексту» β-изгиба.
менением методов ЯМР или электронной микро-
Для анализа взаимоотношений между кон-
скопии). В подтверждение этому можно отме-
формационной стабильностью тетрапептидов и
тить, что частоты встречаемости одних и тех же
β-изгибами четырех типов (I, I', II, II') использо-
три- и тетрапептидов существенно разнятся в ба-
вали: 1) - спектр-диаграммы значений bi; 2) - эм-
зах данных PDB и UNIPROT [10].
пирические функции распределения значений
Для каждого из тетрапептидов, найденных в
интегральной оценки конформационной ста-
файлах PDB, были вычислены меры конформа-
бильности bi: 3) - анализ распределения тетра-
ционной лабильности s1-s5 [9]. Затем, для каждо-
пептидов, преимущественно соответствующих
го i-го тетрапептида была вычислена интеграль-
β-изгибам между верхней и нижней частью обще-
ная оценка конформационной стабильности bi по
го списка из 122100 тетрапептидов, упорядочен-
ного по убыванию значений bi. Все три независи-
формуле
b
=
5-
ω
s i),
где веса ωk для каждой
i
k k
k
=1,5
мых метода анализа показали схожие результаты.
из мер конформационной лабильности sk опреде-
Спектр-диаграммы позволяют наглядно оце-
лялись так, чтобы значение bi произвольного тет-
нить различия в частоте встречаемости пептидов
рапептида лежало в диапазоне значений от 1 до 5
заданного типа (тип β-изгиба) при различных
БИОФИЗИКА том 68
№ 1
2023
8
ТОPШИН и др.
Рис. 1. Спектр-диаграммы значений bi β-изгибов. По оси абсцисс отложен ранк стабильности тетрапептида, вычисля-
емый как порядковый номер значения bi в списке тетрапептидов, упорядоченных по убыванию значений bi. Очевидна
большая частота встречаемости (более высокая плотность линий) конформационно лабильных пептидов для трех ти-
пов изгибов (I', II, II'). Спектр-диаграмма для изгиба типа I, очевидно, представляет собой равномерное распределе-
ние линий по всем значениям ранков.
значениях bi. По оси абсцисс спектр-диаграммы
чались выраженным избытком глицина и сни-
отложен ранк стабильности тетрапептида, вычис-
женной встречаемостью аланина, глутамата,
ляемый как порядковый номер значения bi в
фенилаланина, изолейцина, лизина, лейцина, ар-
гинина, валина (таблица). По сравнению с встре-
списке тетрапептидов, упорядоченных по убыва-
чаемостью аминокислот в среднем по банку
нию значений bi. Визуальный анализ спектр-диа-
данных PDB, достоверными по критерию χ2 были
грамм значений bi показал, что конформационно
только различия для глицина, аланина, изолей-
лабильные пептиды встречаются гораздо чаще
цина, лейцина и валина. Конформационно
для трех типов изгибов - I', II, и особенно II'
стабильные пептиды в этой подвыборке не пока-
(рис. 1).
зали достоверных различий в аминокислотном
Рассмотрим статистические оценки распреде-
составе.
ления пептидов с преимущественной конформа-
цией в виде β-изгибов по значениям bi. Анализ
Анализ эмпирических функций распределе-
конформационно-лабильных пептидов, которые
ния значений bi (рис. 2) показал очевидные сме-
встречались гораздо чаще для трех типов изгибов
щения кривых эмпирических функций распреде-
(I', II и II'), показал, что данные пептиды отли-
ления. β-изгибов типов I', II и II' в сторону более
БИОФИЗИКА том 68
№ 1
2023
КОНФОРМАЦИОННЫЕ АСПЕКТЫ ФОРМИРОВАНИЯ СТРУКТУР
9
Таблица 1. Частоты встречаемости (в %) различных аминокислот в конформационно-лабильных мотивах
Выборка
A
C
D
E
F
G
H
I
K
L
M
N
P
Q
R
S
T
V
W
Y
Конформа-
ционно-ла-
бильные для
3.1
3.4
6.9
3.8
3.6
24.5
4.6
2.5
3.9
2.5
3.3
6.2
4.9
4.1
3.8
5.3
4.2
2.5
3.1
4.0
типов I', II
и II’
Среднее по
выборке из
5.9
2.8
5.6
5.7
5.0
5.9
4.1
5.5
5.4
6.0
3.3
5.1
5.2
4.9
5.4
5.6
5.5
5.8
2.8
4.8
PDB
низких значений bi, т.е. в сторону более конфор-
достоверны по критерию χ2 (P < 0.008 во всех трех
мационно-лабильных пептидов. Например, сред-
случаях).
нее значение bi для изгиба типа I составило
Таким образом, результаты проведенного ана-
2.4 ± 0.2 (среднее ± стандартное отклонение), а
лиза показали, что среди β-изгибов типов I', II и
для изгиба типа I', II' и II - 2.22 ± 0.2, 2.1 ± 0.15 и
II' достоверно чаще встречаются конформацион-
2.05 ± 0.12 соответственно.
но лабильные пептиды. Очевидно, что предлагае-
Анализ распределения соответствующих β-из-
мые показатели конформационной лабильности
гибам тетрапептидов между верхней и нижней ча-
пептидов могут быть использованы в качестве до-
стью общего списка из 122100 тетрапептидов,
полнительной независимой информации в вы-
упорядоченного по убыванию значений bi, под-
числительных схемах для распознавания β-изги-
твердил описанные выше результаты. Так, для из-
бов этих типов по аминокислотным последова-
гибов типа I частота встречаемости в верхней и в
тельностям белков. Полученные данные
нижней половинах списка была практически
свидетельствуют о принципиальном различии в
одинаковой (32955 пептидов в верхней части,
структурообразовании типа I и остальных типов
30785 - в нижней, т.е. частоты равны 0.548 и 0.512
β-изгибов. В отличие от трех остальных типов
соответственно). В случае трех других типов β-из-
β-изгибы I-го типа, по-видимому, не являются
гибов были отмечены статистически достоверные
конформационно зависимыми.
различия в частотах встречаемости с преоблада-
нием конформационно лабильных пептидов: для
ЗАКЛЮЧЕНИЕ
типа I' - 74 и 256 тетрапептидов, т.е. частоты от-
личались более чем в три раза (0.0012 и 0.0043);
Основной результат работы заключается в
для типа II - 3 и 37, частоты отличались на поря-
установлении уникальных свойств β-изгибов ти-
док (5∙10-5 и 6∙10-4); для типа II' - 65 и 555, часто-
пов I', II и II' в аспекте аминокислотного «текста»
ты отличались почти на порядок (0.0011 и 0.0092).
этих локальных структур белков. В отличие от них
Эти различия для β-изгибов типов I', II и II' были
β-изгиб типа I не проявляет выраженных особен-
Рис. 2. Эмпирические функции распределения значений интегральной оценки конформационной стабильности bi.
БИОФИЗИКА том 68
№ 1
2023
10
ТОPШИН и др.
ностей аминокислотного состава, в том числе в
СПИСОК ЛИТЕРАТУРЫ
смысле обогащенности конформационно-ла-
1. W. Kabsch and C. Sander, Biopolymers, 22 (12), 2577
бильными последовательностями. Повышенная
(1983).
конформационная лабильность тетрапептидов,
2. X. de la Cruz, E. G. Hutchinson, A. Shepherd, and
формирующих β-изгибы типов I', II и II', способ-
J. M. Thornton, Proc. Natl. Acad. Sci. USA, 99 (17),
ствует смягчению стереохимических затрудне-
11157 (2002).
ний, характерных для наблюдаемых в экспери-
менте конформаций этих локальных структур.
3. M. Kumar, M. Bhasin, N. K. Natt, and G. P. S. Ragha-
va, Nucl. Acids Res., 33, W154 (2005).
4. M. K. Elbashir, J. Wang, F. X. Wu, et al., Proteome
ФИНАНСИРОВАНИЕ РАБОТЫ
Sci., 11 (Suppl. 1), S5 (2013).
Работа выполнена при финансовой поддержке
5. C. Fang, Y. Shang, and D. Xu, Proteins, 88 (1), 143
Российского фонда фундаментальных исследова-
(2020).
ний (проект № 20-04-01085).
6. A. G. de Brevern, Sci. Reports, 6, 33191 (2016).
7. Л. А. Уpошлев, И. Ю. Тоpшин, А. В. Батяновcкий
КОНФЛИКТ ИНТЕРЕСОВ
и др., Биофизика, 60 (1), 5 (2015).
Авторы заявляют об отсутствии интересов.
8. Л. А. Уpошлев, И. Ю. Тоpшин, А. В. Батяновcкий
и др., Биофизика, 64 (2), 272 (2019).
СОБЛЮДЕНИЕ ЭТИЧЕСКИХ СТАНДАРТОВ
9. И. Ю. Тоpшин, А. В. Батяновcкий, Л. А. Уpошлев
и др., Биофизика, 64 (2), 256 (2019).
Настоящая работа не содержит каких-либо ис-
следований с участием людей или животных в ка-
10. Ю. И. Журавлёв, К. В. Рудаков и И. Ю. Торшин,
честве объектов исследований.
Труды МФТИ, 3 (4), 45 (2011).
Conformational Aspects in the Formation of Structures of the Backbone of Polypeptide
Chains in Proteins. Relationship between Conformational Stability/Lability and β-Turns
I.Yu. Torshin*, I.V. Filatov**, A.V. Batyanovskii***, K.V. Smirnov****, A.A. Anashkina****,
N.G. Esipova****, and V.G. Tumanyan****
*Dorodnicyn Computing Centre, Russian Academy of Sciences, ul. Vavilova 40, Moscow, 119333 Russia
**Moscow Institute of Physics and Technology, Institutskiy per. 9, Dolgoprudny, Moscow Region, 141700 Russia
***Institute of Biophysics and Cell Engineering, National Academy of Sciences of Belarus,
Akademicheskaya ul. 27, Minsk, 220072 Belarus
****Engelhardt Institute of Molecular Biology, Russian Academy of Sciences, ul. Vavilova 32, Moscow,119991 Russia
To assess the nature of the relationship between the integral conformational stability of tetrapeptides and the
main types of β-turns (which are also tetrapeptides), calculations were performed using spectrum diagrams
and asymmetry in the distribution of conformationally stable and unstable tetrapeptides. It was shown that
type I', II, and II' β-turns are comprised of predominantly conformationally labile peptides, that is consistent
with the predetermined nature of their structure as described earlier. As previously shown in our study, in this
case the conformation is imposed by external conditions (namely the cycle closuring) and the prevalence of
conformationally labile peptides facilitates the formation of the structure by virtue of external factors. Type I
β-turn is an exception: peptides with different conformational lability are fairly evenly distributed. Most like-
ly, this indicates that the formation of the type I β-turn is not predetermined.
Keywords: conformational stable/labile segments of protein, local protein structure, conformational analysis,
β-turns, statistical analysis, molecular dynamics
БИОФИЗИКА том 68
№ 1
2023