Кристаллография, 2023, T. 68, № 6, стр. 959-970

Поиск новых потенциальных Т- и В-клеточных эпитопов в спайковом белке SARS-CoV-2

И. А. Колесников 1, В. И. Тимофеев 12, М. В. Николенко 1, А. В. Ермаков 1, А. С. Ивановский 2*, Ю. А. Дьякова 1, Ю. В. Писаревский 21, М. В. Ковальчук 12

1 Национальный исследовательский центр “Курчатовский институт”
Москва, Россия

2 Институт кристаллографии им. А.В. Шубникова ФНИЦ “Кристаллография и фотоника РАН”
Москва, Россия

* E-mail: a.1wanowskiy@gmail.com

Поступила в редакцию 19.04.2023
После доработки 15.06.2023
Принята к публикации 09.08.2023

Полный текст (PDF)

Аннотация

Современная эпидемиологическая обстановка, в том числе новый вирус SARS-CoV-2 и его высокая мутагенность, требуют принципиально новых сроков создания вакцин, что может быть достигнуто только за счет применения современных вычислительных технологий и моделирования. С использованием методов иммуноинформатики найдены эпитопы в спайковом белке вируса SARS-CoV-2, для найденных эпитопов предсказаны их аллергенность и иммуногенность, показано, что на основе данных эпитопов возможно сконструировать вакцину против SARS-CoV-2.

ВВЕДЕНИЕ

Известно, что SARS-CoV-2 [1] – это вирус, вызывающий чрезвычайно опасное заболевание COVID-19 [2], которое может протекать как в легкой форме [3], так и бессимптомно, а также в крайне тяжелой форме, приводящей к смерти [4]. Существуют подходы к лечению этого заболевания, в том числе ряд вакцин различного типа действия. Однако высокая мутагенность вируса приводит к тому, что старые вакцины становятся менее эффективными или вообще перестают действовать. Таким образом, существует необходимость быстро реагировать на появление новых штаммов SARS-CoV-2.

Накопление большого объема генетической информации в единой базе и развитие биоинформатических инструментов позволяют рассчитывать целевую модель вакцины с учетом прогноза иммунного ответа хозяина и генетической информации патогена. Создание вакцины на основе технологии рекомбинантной ДНК позволяет сократить срок создания вакцины.

НИЦ “Курчатовский институт” создает национальную базу генетической информации, которая включает в себя средства депонирования, поиска по метаданным и гомологического поиска генетической информации, а также средства для управления биоинформатическими платформами Galaxy и NextFlow. Это позволяет работать с существующими и создавать собственные биоинформатические инструменты. В [5, 6] предложен иммуноинформатический подход, который позволяет конструировать основанные на эпитопах белковые вакцины.

В настоящей работе применили модификацию этого подхода для SARS-CoV-2. Одним из последних вариантов коронавируса, вызывающего COVID-19, является так называемый “Омикрон” [7, 8]. Выявлены пять его подвариантов [9]. Известно, что некоторые подварианты “Омикрона” могут заражать ранее вакцинированных людей [10]. Таким образом, создание эффективной вакцины против данного варианта коронавируса является актуальной задачей.

Выбранный для исследования так называемый спайк-протеин варианта “Омикрон” (PDB ID: 7WK3) служит мишенью для поиска вакцин [11]. Трехмерная структура белка приведена на рис. 1, его топология относительно мембраны представлена на рис. 2. На основе смоделированной трехмерной структуры и первичной последовательности исследуемого белка был проведен поиск В- и Т-клеточных эпитопов. Первичная последовательность взята из Национальной базы генетической информации (https://nbgi.ru/).

Рис. 1.

Трехмерная структура белка мишени.

Рис. 2.

Топологии белка относительно мембраны. Синим цветом выделен участок снаружи мембраны, красным – трансмембранный участок, розовым – участок внутри мембраны.

МАТЕРИАЛЫ И МЕТОДЫ

Т-клеточные эпитопы найдены с помощью программы NetCTL [12]. Сервер позволяет предсказывать эпитопы CTL, ограниченные 12 супертипами главного комплекса гистосовместимости (MHC) класса I. Связывание пептидов с MHC класса I и протеасомное расщепление были предсказаны с помощью искусственных нейронных сетей [1214].

С использованием NetCTL получен прогноз Т-клеточных эпитопов (выделены оранжевым цветом на рис. 3). Настройки, с которыми проводился прогноз, следующие:

Рис. 3.

Т-клеточные эпитопы (показаны оранжевым цветом).

– weight of tap – 0.05;

– weight of MHC – 1;

– weight of Cleavage – 0.15;

– порог идентификации эпитопов – 0.75.

B-клеточные эпитопы предсказаны с помощью инструмента прогнозирования ElliPro (http://tools.iedb.org/ellipro/) сервера IEDB [15, 16]. При работе с этим методом используются доступность растворителя и гибкость для прогнозирования эпитопов. Инструмент прогнозирования ElliPro выбирает антигенные остатки из известной трехмерной структуры белка. Нижняя оценка и максимальное расстояние были откалиброваны с использованием значений по умолчанию с minimum score – 0.5 Å и maximum distance – 6 Å соответственно. 3D-модель белка S1 использовали для предсказания как конформационных (прерывистых), так и линейных В-клеточных эпитопов.

Для анализа аллергенности найденных эпитопов использовали программу AllerTOP [17], для анализа токсичности – ToxinPred [18]. Для оценки перспективности данного белка как антигена была применена программа VaxiJen [19].

Рис. 4.

Линейные В-эпитопы (показаны оранжевым цветом).

Рис. 5.

Прерывистые В-эпитопы (показаны оранжевым цветом).

РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ

Спайковый белок вируса SARS-CoV-2 (СБ CoV) является главной антигенной детерминантой вируса и поэтому был выбран в качестве объекта исследования [11]. Данный белок подвержен мутациям в новых вариантах вируса SARS-CoV-2, что приводит к тому, что разработанные ранее вакцины оказываются неэффективными [20]. Для поиска антигенных детерминант спайкового белка варианта Омикрон вируса SARS-CoV-2 использовали подход, основанный на алгоритмах глубокого машинного обучения [12, 1618]. Учитывая, что СБ CoV является трансмембранным белком, была определена его топология относительно цитоплазматической мембраны.

Для этого использовали основанный на алгоритмах глубокого машинного обучения веб-сервис DeepTMHMM [21] proteins using deep neural networks. Показано, что аминокислотные остатки 1214–1273 относятся к трансмембранному и внутриклеточному фрагменту белка, что затрудняет их использование для конструирования пептидной вакцины.

Далее провели поиск эпитопов. Выявлены как Т-, так и В-клеточные эпитопы СБ CoV (табл. 1–3). Всего выявлено 37 Т-клеточных эпитопов высокоаффинных лигандов главного комплекса гистосовместимости первого типа (MHC-1). Из них 35 находятся в надмембранной части. Каждый из найденных пептидов состоит из девяти аминокислот, что характерно для лигандов MHC-1. В табл. 1 Т-клеточные эпитопы перечислены в порядке убывания их аффинности к MHC-1. Наиболее аффинные и, следовательно, более многообещающие с точки зрения иммуногенности отличаются от менее аффинных в 4–7 раз. Отметим, что согласно [12] использованный метод позволяет предсказать, является ли пептид высокоаффинным лигандом MHC-1 с вероятностью 95%. В-клеточные эпитопы можно разделить на два типа в зависимости от пространственной структуры эпитопов: непрерывные (линейные) и прерывистые (конформационные) эпитопы [15]. Список линейных В-клеточных эпитопов приведен в табл. 2. Всего найдено 20 линейных В-клеточных эпитопов, все они относятся к надмембранной части СБ CoV. Наиболее иммуногенные из них представляют собой достаточно длинные пептиды (до 97 аминокислотных остатков). Конформационных эпитопов найдено 22 (табл. 3), из них 20 находятся в надмембранном фрагменте белка.

Таблица 1.  

Предсказанные Т-клеточные эпитопы

ID Первичная последовательность Афинность Оценочная функция
865 LTDEMIAQY 0.7953 3.6616
258 WTAGAAAYY 0.6735 3.1128
604 TSNQVAVLY 0.6559 3.0758
361 CVADYSVLY 0.5348 2.5759
746 STECSNLLL 0.5136 2.3492
733 KTSVDCTMY 0.4908 2.3795
652 GAEHVNNSY 0.4042 1.996
160 YSSANNCTF 0.3975 1.9531
196 NIDGYFKIY 0.3921 1.9606
152 WMESEFRVY 0.3902 1.9232
162 SANNCTFEY 0.3737 1.8739
687 VASQSIIAY 0.3529 1.7978
30 NSFTRGVYY 0.3389 1.6915
392 FTNVYADSF 0.2704 1.3208
136 CNDPFLGVY 0.2613 1.3355
285 ITDAVDCAL 0.235 1.168
1237 MTSCCSCLK 0.226 1.0963
261 GAAAYYVGY 0.2253 1.2194
357 RISNCVADY 0.2106 1.2032
465 ERDISTEIY 0.2097 1.1687
1039 RVDFCGKGY 0.2036 1.1403
1096 VSNGTHWFV 0.2012 0.9574
50 STQDLFLPF 0.1974 1.0468
343 NATRFASVY 0.1955 1.1138
370 NSASFSTFK 0.1671 0.8165
880 GTITSGWTF 0.1656 0.9433
612 YQDVNCTEV 0.1531 0.7502
296 LSETKCTLK 0.1515 0.7879
815 RSFIEDLLF 0.1421 0.8441
748 ECSNLLLQY 0.1413 0.8171
192 FVFKNIDGY 0.1358 0.7837
1264 VLKGVKLHY 0.1262 0.8253
1095 FVSNGTHWF 0.1232 0.7622
628 QLTPTWRVY 0.1189 0.7887
372 ASFSTFKCY 0.118 0.8085
445 VGGNYNYLY 0.1164 0.7698
83 VLPFNDGVY 0.113 0.7675
Таблица 2.  

Предсказанные линейные В-клеточные эпитопы

Эпитоп Chain Начало Конец Первичная последовательность Количе-ство а.о. Score
1 A 1204 1273 GKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCL KGCCSCGSCCKFDEDDSEPVLKGVKLHYT 70 0.9
2 A 435 511 AWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQ AGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVV 77 0.827
3 A 946 1017 GKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLD KVEAEVQIDRLITGRLQSLQTYVTQQLIRAAE 72 0.821
4 A 730 775 SMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRAL TGIAVEQD 46 0.8
5 A 1 23 MFVFLVLLPLVSSQCVNLTTRTQ 23 0.731
6 A 1123 1184 SGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTS PDVDLGDISGINASVVNIQKEID 62 0.73
7 A 243 262 ALHRSYLTPGDSSSGWTAGA 20 0.725
8 A 809 905 PSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARD LICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWT FGAGAALQIPFAMQMAYR 97 0.706
9 A 67 80 AIHVSGTNGTKRFD 14 0.646
10 A 699 711 LGAENSVAYSNNS 13 0.644
11 A 134 166 QFCNDPFLGVYYHKNNKSWMESEFRVYSSANNC 33 0.636
12 A 336 356 CPFGEVFNATRFASVYAWNRK 21 0.632
13 A 397 425 ADSFVIRGDEVRQIAPGQTGKIADYNYKL 29 0.623
14 A 676 686 TQTNSPRRARS 11 0.618
15 A 1097 1102 SNGTHW 6 0.606
16 A 168 188 FEYVSQPFLMDLEGKQGNFKN 21 0.602
17 A 1073 1087 KNFTTAPAICHDGKA 15 0.58
18 A 121 127 NNATNVV 7 0.551
19 A 209 215 PINLVRD 7 0.538
20 A 97 102 KSNIIR 6 0.53

Примечание. а. о. – аминокислотные остатки.

Таблица 3.  

Предсказанные конформационные В-клеточные эпитопы

Эпитоп Аминокислотный остаток Количе-ство а.о. Score
1 A:S1239, A:C1240, A:C1241, A:S1242, A:C1243, A:L1244, A:K1245 7 0.993
2 A:T1231, A:M1233, A:L1234, A:C1235, A:C1236, A:M1237, A:T1238 7 0.988
3 A:L1218, A:G1219, A:F1220, A:I1221, A:A1222, A:G1223, A:L1224, A:I1225, A:A1226, A:I1227, A:V1228, A:M1229, A:V1230, A:I1232 14 0.955
4 A:I818, A:G1246, A:C1247, A:C1248, A:S1249, A:C1250, A:G1251, A:S1252, A:C1253, A:C1254, A:F1256, A:D1257, A:E1258, A:D1259, A:D1260, A:S1261, A:E1262, A:P1263, A:V1264, A:L1265, A:K1266, A:G1267, A:V1268 23 0.906
5 A:S1161, A:P1162, A:D1163 3 0.904
6 A:W1212, A:P1213, A:W1214, A:Y1215, A:I1216 5 0.896
7 A:K1269, A:L1270, A:H1271, A:Y1272 4 0.892
8 A:S884, A:G885, A:W886, A:T887 4 0.885
9 A:R457, A:K458, A:S459, A:N460, A:L461, A:K462, A:P463, A:F464, A:E465, A:R466, A:D467, A:I468, A:S469, A:T470, A:E471 15 0.819
10 A:S730, A:M731, A:K733, A:S735, A:V736, A:D737, A:C738, A:T739, A:M740, A:Y741, A:I742, A:C743, A:G744, A:D745, A:S746, A:T747, A:E748, A:C749, A:S750, A:N751, A:L752, A:L753, A:L754, A:Q755, A:Y756, A:G757, A:S758, A:F759, A:C760, A:T761, A:Q762, A:L763, A:N764, A:R765, A:A766, A:L767, A:T768, A:G769, A:I770, A:A771, A:V772, A:E773, A:Q774, A:D775, A:S943, A:G946, A:K947, A:L948, A:Q949, A:D950, A:V951, A:V952, A:N953, A:Q954, A:N955, A:A956, A:Q957, A:A958, A:L959, A:N960, A:T961, A:L962, A:V963, A:K964, A:Q965, A:L966, A:S967, A:S968, A:N969, A:F970, A:G971, A:A972, A:I973, A:S974, A:S975, A:V976, A:L977, A:N978, A:D979, A:I980, A:L981, A:S982, A:R983, A:L984, A:D985, A:K986, A:E988, A:A989, A:E990, A:Q992, A:I993, A:D994, A:R995, A:L996, A:I997, A:T998, A:G999, A:R1000, A:L1001, A:Q1002, A:S1003, A:L1004, A:Q1005, A:Y1007, A:V1008, A:Q1011, A:L1012, A:R1014, A:A1015, A:A1016, A:E1017, A:D1165, A:L1166, A:G1167, A:D1168, A:I1169, A:S1170, A:G1171, A:I1172, A:N1173, A:A1174, A:S1175, A:V1176, A:V1177, A:N1178, A:I1179, A:K1181, A:E1182 128 0.804
11 A:L7, A:L8, A:P9, A:L10 4 0.793
12 A:L1145, A:D1146, A:S1147, A:F1148, A:K1149, A:E1150, A:E1151, A:L1152, A:D1153, A:F1156 10 0.787
13 A:I1130, A:G1131, A:I1132, A:V1133 4 0.746
14 A:C336, A:P337, A:G339, A:E340, A:V341, A:F342, A:N343, A:A344, A:T345, A:R346, A:F347, A:A348, A:S349, A:V350, A:Y351, A:A352, A:W353, A:N354, A:R355, A:K356, A:S371, A:A372, A:S373, A:F374, A:S375, A:A397, A:D398, A:S399, A:F400, A:V401, A:I402, A:R403, A:G404, A:D405, A:E406, A:V407, A:R408, A:Q409, A:I410, A:G416, A:K417, A:I418, A:A419, A:D420, A:Y421, A:Y423, A:A435, A:W436, A:N437, A:S438, A:N439, A:N440, A:L441, A:D442, A:S443, A:K444, A:V445, A:G446, A:G447, A:N448, A:Y449, A:N450, A:Y451, A:L452, A:Y453, A:R454, A:L455, A:F456, A:I472, A:Y473, A:Q474, A:A475, A:G476, A:S477, A:T478, A:P479, A:C480, A:N481, A:G482, A:V483, A:E484, A:G485, A:F486, A:N487, A:C488, A:Y489, A:F490, A:P491, A:L492, A:Q493, A:S494, A:Y495, A:G496, A:F497, A:Q498, A:P499, A:T500, A:N501, A:G502, A:V503, A:G504, A:Y505, A:Q506, A:P507, A:Y508, A:R509, A:V510, A:V511 108 0.744
15 A:L821, A:L822, A:F823, A:K825, A:V826, A:T827, A:L828, A:A829, A:D830, A:A831, A:G832, A:F833, A:I834, A:K835, A:Q836, A:Y837, A:G838, A:D839, A:C840, A:L841, A:G842, A:D843, A:I844, A:A845, A:A846, A:R847, A:D848, A:L849, A:I850, A:C851, A:A852, A:Q853, A:K854, A:F855, A:N856, A:G857, A:L858, A:T859, A:V860, A:L861, A:P862, A:P863, A:L864, A:L865, A:T866, A:D867, A:E868, A:M869, A:I870, A:A871, A:Q872, A:Y873, A:T874, A:S875, A:A876, A:L877, A:L878, A:A879, A:G880, A:T881, A:I882, A:T883, A:G889, A:A890, A:G891, A:A892, A:A893, A:L894, A:I896, A:P897, A:F898, A:A899, A:M900, A:Q901, A:A903, A:Y904, A:R905, A:V911, A:Y1206, A:E1207, A:Q1208, A:Y1209 82 0.704
16 A:N1134, A:N1135, A:T1136 3 0.674
17 A:S12, A:S13, A:Q14, A:C15, A:N17, A:L18, A:T19, A:R21, A:T22, A:A67, A:I68, A:H69, A:V70, A:S71, A:G72, A:T73, A:N74, A:G75, A:T76, A:K77, A:R78, A:F79, A:D80, A:N81, A:K97, A:S98, A:N99, A:I100, A:R102, A:N121, A:N122, A:A123, A:T124, A:N125, A:V127, A:Q134, A:F135, A:C136, A:N137, A:D138, A:P139, A:F140, A:L141, A:G142, A:V143, A:Y144, A:Y145, A:H146, A:K147, A:N148, A:N149, A:S151, A:W152, A:M153, A:E154, A:S155, A:E156, A:F157, A:R158, A:V159, A:Y160, A:S161, A:S162, A:A163, A:N164, A:N165, A:C166, A:T167, A:V171, A:S172, A:Q173, A:P174, A:F175, A:L176, A:M177, A:D178, A:L179, A:E180, A:G181, A:K182, A:Q183, A:G184, A:N185, A:F186, A:K187, A:N188, A:N211, A:L212, A:V213, A:R214, A:D215, A:A243, A:L244, A:H245, A:R246, A:S247, A:Y248, A:L249, A:T250, A:P251, A:G252, A:D253, A:S254, A:S255, A:S256, A:G257, A:W258, A:T259, A:A260, A:G261, A:A262 111 0.635
18 A:S698, A:L699, A:G700, A:A701, A:E702, A:N703, A:S704, A:V705, A:A706, A:Y707, A:S708, A:N709, A:N710, A:S711, A:T716, A:K1073, A:N1074, A:F1075, A:T1076, A:T1077, A:A1078, A:P1079, A:A1080, A:I1081, A:C1082, A:H1083, A:D1084, A:G1085, A:K1086, A:A1087, A:S1097, A:N1098, A:G1099, A:T1100, A:H1101, A:W1102, A:S1123, A:G1124, A:N1125, A:C1126, A:D1127, A:V1128 42 0.61
19 A:N679, A:S680, A:P681, A:A684, A:S686, A:V687 6 0.56
20 A:Q1180, A:I1183, A:D1184 3 0.552
21 A:Q1142, A:P1143, A:E1144 3 0.551
22 A:D808, A:P809, A:S810, A:K811, A:P812, A:S813, A:K814 7 0.524

Оценка аллергенности найденных пептидов с использованием AllerTOP [17] показала, что ни один из них не является аллергеном.

Токсичность найденных пептидов оценивали с использованием ToxinPred [18]. Выявлено, что два Т-эпитопа и два конформационных В-эпитопа, вероятно, являются токсинами (табл. 4–6).

Таблица 4.  

Предсказание токсичности Т-клеточных эпитопов

ID Белок SV Score
865 LTDEMIAQY –0.52
258 WTAGAAAYY –1.07
604 TSNQVAVLY –1.17
361 CVADYSVLY –0.52
746 STECSNLLL –0.52
733 KTSVDCTMY 0.12
652 GAEHVNNSY –0.58
160 YSSANNCTF –0.48
196 NIDGYFKIY –1.13
152 WMESEFRVY –1.68
162 SANNCTFEY –0.49
687 VASQSIIAY –1.09
30 NSFTRGVYY –0.73
392 FTNVYADSF –1.1
136 CNDPFLGVY –0.82
285 ITDAVDCAL –0.67
1237 MTSCCSCLK 0.13
261 GAAAYYVGY –1.17
357 RISNCVADY –0.78
465 ERDISTEIY –1.79
1039 RVDFCGKGY –0.34
1096 VSNGTHWFV –0.92
50 STQDLFLPF –1.49
343 NATRFASVY –0.64
370 NSASFSTFK –1.04
880 GTITSGWTF –1.1
612 YQDVNCTEV –0.82
296 LSETKCTLK –1.22
815 RSFIEDLLF –0.82
748 ECSNLLLQY –0.39
192 FVFKNIDGY –0.75
1264 VLKGVKLHY –1.26
1095 FVSNGTHWF –0.92
628 QLTPTWRVY –1.5
372 ASFSTFKCY –0.66
445 VGGNYNYLY –0.82
83 VLPFNDGVY –1.29

Примечание. Токсичными являются только KTSVDCTMY, MTSCCSCLK.

Таблица 5.  

Предсказание токсичности линейных В-эпитопов

Эпитоп Белок SVM score
1 GKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKF DEDDSEPVLKGVKLHYT –0.33
2 AWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGF NCYFPLQSYGFQPTNGVGYQPYRVV –0.98
3 GKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLIT GRLQSLQTYVTQQLIRAAE –0.23
4 SMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQD –0.63
5 MFVFLVLLPLVSSQCVNLTTRTQ –1.07
6 SGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINA SVVNIQKEID  
7 ALHRSYLTPGDSSSGWTAGA –0.58
8 PSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVL PPLLTDEM IAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYR  
9 AIHVSGTNGTKRFD –1.25
10 LGAENSVAYSNNS –0.61
11 QFCNDPFLGVYYHKNNKSWMESEFRVYSSANNC –0.93
12 CPFGEVFNATRFASVYAWNRK –0.95
13 ADSFVIRGDEVRQIAPGQTGKIADYNYKL –0.48
14 TQTNSPRRARS –1.26
15 SNGTHW –0.71
16 FEYVSQPFLMDLEGKQGNFKN –1.55
17 KNFTTAPAICHDGKA –0.99
18 NNATNVV –0.68
19 PINLVRD –0.90
20 KSNIIR –0.83

Примечание. Токсичными являются эпитопы 6 и 8.

Таблица 6.  

Предсказание токсичности конформационных В-эпитопов

Эпитоп Аминокислотный остаток SVM-Score
1 A:S1239, A:C1240, A:C1241, A:S1242, A:C1243, A:L1244, A:K1245 –0.14
2 A:T1231, A:M1233, A:L1234, A:C1235, A:C1236, A:M1237, A:T1238 0.56
3 A:L1218, A:G1219, A:F1220, A:I1221, A:A1222, A:G1223, A:L1224, A:I1225, A:A1226, A:I1227, A:V1228, A:M1229, A:V1230, A:I1232 –0.85
4 A:I818, A:G1246, A:C1247, A:C1248, A:S1249, A:C1250, A:G1251, A:S1252, A:C1253, A:C1254, A:F1256, A:D1257, A:E1258, A:D1259, A:D1260, A:S1261, A:E1262, A:P1263, A:V1264, A:L1265, A:K1266, A:G1267, A:V1268 1.21
5 A:S1161, A:P1162, A:D1163 –0.80
6 A:W1212, A:P1213, A:W1214, A:Y1215, A:I1216 –0.53
7 A:K1269, A:L1270, A:H1271, A:Y1272 –0.79
8 A:S884, A:G885, A:W886, A:T887 –0.84
9 A:R457, A:K458, A:S459, A:N460, A:L461, A:K462, A:P463, A:F464, A:E465, A:R466, A:D467, A:I468, A:S469, A:T470, A:E471 –1.63
10 A:S730, A:M731, A:K733, A:S735, A:V736, A:D737, A:C738, A:T739, A:M740, A:Y741, A:I742, A:C743, A:G744, A:D745, A:S746, A:T747, A:E748, A:C749, A:S750, A:N751, A:L752, A:L753, A:L754, A:Q755, A:Y756, A:G757, A:S758, A:F759, A:C760, A:T761, A:Q762, A:L763, A:N764, A:R765, A:A766, A:L767, A:T768, A:G769, A:I770, A:A771, A:V772, A:E773, A:Q774, A:D775, A:S943, A:G946, A:K947, A:L948, A:Q949, A:D950, A:V951, A:V952, A:N953, A:Q954, A:N955, A:A956, A:Q957, A:A958, A:L959, A:N960, A:T961, A:L962, A:V963, A:K964, A:Q965, A:L966, A:S967, A:S968, A:N969, A:F970, A:G971, A:A972, A:I973, A:S974, A:S975, A:V976, A:L977, A:N978, A:D979, A:I980, A:L981, A:S982, A:R983, A:L984, A:D985, A:K986, A:E988, A:A989, A:E990, A:Q992, A:I993, A:D994, A:R995, A:L996, A:I997, A:T998, A:G999, A:R1000, A:L1001, A:Q1002, A:S1003, A:L1004, A:Q1005, A:Y1007, A:V1008, A:Q1011, A:L1012, A:R1014, A:A1015, A:A1016, A:E1017, A:D1165, A:L1166, A:G1167, A:D1168, A:I1169, A:S1170, A:G1171, A:I1172, A:N1173, A:A1174, A:S1175, A:V1176, A:V1177, A:N1178, A:I1179, A:K1181, A:E1182  
11 A:L7, A:L8, A:P9, A:L10 –1.00
12 A:L1145, A:D1146, A:S1147, A:F1148, A:K1149, A:E1150, A:E1151, A:L1152, A:D1153, A:F1156 –1.34
13 A:I1130, A:G1131, A:I1132, A:V1133 –0.76
14 A:C336, A:P337, A:G339, A:E340, A:V341, A:F342, A:N343, A:A344, A:T345, A:R346, A:F347, A:A348, A:S349, A:V350, A:Y351, A:A352, A:W353, A:N354, A:R355, A:K356, A:S371, A:A372, A:S373, A:F374, A:S375, A:A397, A:D398, A:S399, A:F400, A:V401, A:I402, A:R403, A:G404, A:D405, A:E406, A:V407, A:R408, A:Q409, A:I410, A:G416, A:K417, A:I418, A:A419, A:D420, A:Y421, A:Y423, A:A435, A:W436, A:N437, A:S438, A:N439, A:N440, A:L441, A:D442, A:S443, A:K444, A:V445, A:G446, A:G447, A:N448, A:Y449, A:N450, A:Y451, A:L452, A:Y453, A:R454, A:L455, A:F456, A:I472, A:Y473, A:Q474, A:A475, A:G476, A:S477, A:T478, A:P479, A:C480, A:N481, A:G482, A:V483, A:E484, A:G485, A:F486, A:N487, A:C488, A:Y489, A:F490, A:P491, A:L492, A:Q493, A:S494, A:Y495, A:G496, A:F497, A:Q498, A:P499, A:T500, A:N501, A:G502, A:V503, A:G504, A:Y505, A:Q506, A:P507, A:Y508, A:R509, A:V510, A:V511  
15 A:L821, A:L822, A:F823, A:K825, A:V826, A:T827, A:L828, A:A829, A:D830, A:A831, A:G832, A:F833, A:I834, A:K835, A:Q836, A:Y837, A:G838, A:D839, A:C840, A:L841, A:G842, A:D843, A:I844, A:A845, A:A846, A:R847, A:D848, A:L849, A:I850, A:C851, A:A852, A:Q853, A:K854, A:F855, A:N856, A:G857, A:L858, A:T859, A:V860, A:L861, A:P862, A:P863, A:L864, A:L865, A:T866, A:D867, A:E868, A:M869, A:I870, A:A871, A:Q872, A:Y873, A:T874, A:S875, A:A876, A:L877, A:L878, A:A879, A:G880, A:T881, A:I882, A:T883, A:G889, A:A890, A:G891, A:A892, A:A893, A:L894, A:I896, A:P897, A:F898, A:A899, A:M900, A:Q901, A:A903, A:Y904, A:R905, A:V911, A:Y1206, A:E1207, A:Q1208, A:Y1209  
16 A:N1134, A:N1135, A:T1136 –0.80
17 A:S12, A:S13, A:Q14, A:C15, A:N17, A:L18, A:T19, A:R21, A:T22, A:A67, A:I68, A:H69, A:V70, A:S71, A:G72, A:T73, A:N74, A:G75, A:T76, A:K77, A:R78, A:F79, A:D80, A:N81, A:K97, A:S98, A:N99, A:I100, A:R102, A:N121, A:N122, A:A123, A:T124, A:N125, A:V127, A:Q134, A:F135, A:C136, A:N137, A:D138, A:P139, A:F140, A:L141, A:G142, A:V143, A:Y144, A:Y145, A:H146, A:K147, A:N148, A:N149, A:S151, A:W152, A:M153, A:E154, A:S155, A:E156, A:F157, A:R158, A:V159, A:Y160, A:S161, A:S162, A:A163, A:N164, A:N165, A:C166, A:T167, A:V171, A:S172, A:Q173, A:P174, A:F175, A:L176, A:M177, A:D178, A:L179, A:E180, A:G181, A:K182, A:Q183, A:G184, A:N185, A:F186, A:K187, A:N188, A:N211, A:L212, A:V213, A:R214, A:D215, A:A243, A:L244, A:H245, A:R246, A:S247, A:Y248, A:L249, A:T250, A:P251, A:G252, A:D253, A:S254, A:S255, A:S256, A:G257, A:W258, A:T259, A:A260, A:G261, A:A262  
18 A:S698, A:L699, A:G700, A:A701, A:E702, A:N703, A:S704, A:V705, A:A706, A:Y707, A:S708, A:N709, A:N710, A:S711, A:T716, A:K1073, A:N1074, A:F1075, A:T1076, A:T1077, A:A1078, A:P1079, A:A1080, A:I1081, A:C1082, A:H1083, A:D1084, A:G1085, A:K1086, A:A1087, A:S1097, A:N1098, A:G1099, A:T1100, A:H1101, A:W1102, A:S1123, A:G1124, A:N1125, A:C1126, A:D1127, A:V1128 –0.72
19 A:N679, A:S680, A:P681, A:A684, A:S686, A:V687 –0.43
20 A:Q1180, A:I1183, A:D1184 –0.80
21 A:Q1142, A:P1143, A:E1144 –0.84
22 A:D808, A:P809, A:S810, A:K811, A:P812, A:S813, A:K814 –0.78

Примечание. Токсичными являются эпитопы 2, 4, 10, 14, 15, 17.

Отметим, что оба конформационных В-эпитопа и один из Т-эпитопов относятся к трансмембранному и внутриклеточному фрагментам белка. Алгоритмы, использованные для предсказания токсичности и аллергенности, разработаны с применением глубокого машинного обучения. Для алгоритма предсказания токсичности использовали три выборки: 8233 токсичных и 8233 нетоксичных пептида, 1924 токсичных и 1924 нетоксичных пептида, 1924 токсичных и 19240 нетоксичных пептидов. Выборки разделяли на тестовую и обучающую в соотношении 80:20 [22 ] . Такая модель позволила достичь высокой степени достоверности результата [22 ] . Модель для предсказания аллергенности имела обучающую выборку из 2427 аллергенных и столько же неаллергенных пептидов, что позволило получить достоверность предсказания выше 90% [17].

Полученные результаты позволят как сконструировать вакцину к данному варианту SARS-CoV-2, так и использовать предложенный подход в случае необходимости разработки вакцин к новым вариантам SARS-CoV-2.

ЗАКЛЮЧЕНИЕ

Предсказаны B- и Т-клеточные эпитопы спайкового белка SARS-CoV-2. Проведена оценка их иммуногенности, аллергенности и токсичности. Показано, что они не являются аллергенами, большинство из них не являются токсинами. Таким образом, большинство найденных эпитопов могут быть использованы при конструировании прототипа пептидной вакцины против SARS-CoV-2.

Работа выполнена при финансовой поддержке Министерства науки и высшего образования РФ в рамках Федеральной научно-технической программы развития синхротронных и нейтронных исследований и исследовательской инфраструктуры на 2019–2027 гг. (Соглашение № 075-15-2021-1355 (12 октября 2021 г.)

Список литературы

  1. Coronaviridae Study Group of the International Committee on Taxonomy of Viruses // Nat Microbiol. 2020. V. 5 (4). P. 536. https://doi.org/10.1038/s41564-020-0695-z

  2. Beeching N.J., Fletcher T.E., Flower R. // BMJ Best Practice Coronavirus Disease (COVID-19).

  3. Heymann D.L., Shido N. // Lancet. 2020. V. 395 (10224). P. 542. https://doi.org/10.1016/S0140-6736(20)30374-3

  4. Clinical management of severe acute respiratory infection when novel coronavirus (2019-nCoV) infection is suspected: interim guidance, WHO, 2020, 28 January.

  5. Araf Y., Moin A.T., Timofeev V.I. et al. // Front. Immunol. 2022. V. 13. 863234. https://doi.org/10.3389/fimmu.2022.863234

  6. Abass O.A., Timofeev V.I., Sarkar B. et al. // J. Biomolecular Structure and Dynamics. 2021. V. 40 (16). P. 7283. https://doi.org/10.1080/07391102.2021.1896387

  7. Quarleri J., Galvan V., Delpino M.V. // GeroScience. 2022. V. 44 (1). P. 53. https://doi.org/10.1007/s11357-021-00500-4

  8. Gowrisankar A., Priyanka T.M., Banerjee S. // Eur. Phys. J. Plus. 2022. V. 137. P. 100. https://doi.org/10.1140/epjp/s13360-021-02321-y

  9. Yao L., Zhu K. L., Jiang X. L. et al. // Lancet. Infectious Diseases. 2022. V. 22. № 8. P. 1116. https://doi.org/10.1016/S1473-3099(22)00410-8

  10. Cao Y., Yisimayi A., Jian F. et al. // Nature. 2022. V. 608 (7923). P. 593. https://doi.org/10.1038/s41586-022-04980-y

  11. Gallagher T.M., Buchmeier M.J. // Virology. 2001. V. 279. № 2. P. 371.

  12. Larsen M.V., Lundegaard C., Lamberth K. et al. // BMC Bioinformatics. 2007. V. 8. 424. https://doi.org/10.1186/1471-2105-8-424

  13. Buus S., Lauemoller S.L., Worning P. et al. // Tissue Antigens. 2003. V. 62. № 5. P. 378.

  14. Potocnakova L., Bhide M., Pulzova L.B. // J. Immunol. Res. 2016. 6760830. https://doi.org/10.1155/2016/6760830

  15. Ponomarenko J., Bui H.H., Li W. et al. // BMC Bioinformatics. 2008. V. 9. 514. https://doi.org/10.1186/1471-2105-9-514

  16. Dimitrov I., Bangov I., Flower D.R., Doytchinova I. // J. Mol. Model. 2014. V. 20. 2278. https://doi.org/10.1007/s00894-014-2278-5

  17. Gupta S., Kapoor P., Chaudhary K. et al. // PLoS ONE. 2013 V. 8 (9). № 73957. https://doi.org/10.1371/journal.pone.0073957

  18. Doytchinova I.A., Flower D.R. // BMC Bioinformatics. 2007. V. 8 (4). https://doi.org/10.1186/1471-2105-8-4

  19. Kudriavtsev A.V., Vakhrusheva A.V., Novoseletsky V.N. et al. // Viruses. 2022. V. 14 (8). 1603. https://doi.org/10.3390/v14081603

  20. Hallgren J., Konstantinos D.T., Pedersen M.D. et al. // bioRxiv. 2022. https://doi.org/10.1101/2022.04.08.487609

  21. Sharma N., Naorem L.D., Jain S., Raghava G.P.S. // Briefings in bioinformatics. 2022. V. 23. № 5. 174. https://doi.org/10.1093/bib/bbac174

Дополнительные материалы отсутствуют.