Генетика, 2021, T. 57, № 11, стр. 1333-1338

Идентификация патогенных CNV с помощью экзомного секвенирования при необъясненных задержках развития: исследование семейного трио

О. Ю. Наумова 12*, П. В. Добрынин 13, Е. А. Гибитова 3, М. А. Жукова 24, С. Ю. Рычков 1, О. В. Жукова 1, Е. Л. Григоренко 24

1 Институт общей генетики им. Н.И. Вавилова Российской академии наук
119991 Москва, Россия

2 Хьюстонский Университет
77204 Техас, Хьюстон, США

3 Университет информационных технологий, механики и оптики
197101 Санкт-Петербург, Россия

4 Санкт-Петербургский государственный университет
119034 Санкт-Петербург, Россия

* E-mail: oksana.yu.naumova@gmail.com

Поступила в редакцию 20.01.2021
После доработки 25.03.2021
Принята к публикации 26.03.2021

Полный текст (PDF)

Аннотация

На примере исследования отдельного семейного случая, показано успешное применение экзомного секвенирования семейных трио (ребенок-пробанд и родители) в качестве первого метода геномной диагностики множественных необъясненных нарушений и задержек развития, с целью скриннинга на наличие патогенных однуклеотидных замен и структурных геномных вариантов (Copy Number Variation – CNV). В конкретном исследованном случае установлены клинически значимые структурные вариации de novo в геноме ребенка, связанные с синдромом дупликации 17p11.2, или синдромом Потоки–Люпски. Установленные геномные перестройки 17p11.2 были подтверждены методами FISH и MLPA в сертифицированных клинических лабораториях.

Ключевые слова: множественные нарушения развития, секвенирование экзома, семейный геномный анализ, структурные геномные вариации.

Публикации последних лет в области медицинской генетики предоставляют многочисленные свидетельства успешности и продуктивности применения полногеномного и экзомного секвенирования в клинической практике для персонализированной медицины [1]. Убедительно показана особенная ценность геномного секвенирования в трио пробанд–родители, как эффективного диагностического инструмента первого выбора в случаях сложных и труднодиагностируемых заболеваний, таких как детские неврологические заболевания [2] и задержки развития [3]. Так, недавний метаанализ релевантной литературы показал бесспорные преимущества секвенирования над методами геномного скрининга с помощью ДНК-чипов [4]. С активным развитием технологий геномного секвенирования стоимость такого анализа ежедневно сокращается, что делает метод все более доступным для клинической практики. Это в свою очередь побуждает ряд стран к разработке основ и правил внедрения этого типа анализа в государственные медицинские программы. Одним из таких примеров является прошлогодняя публикация результатов исследования одной из канадских организаций (Health Quality Ontario), разрабатывающих стандарты качества и рекомендации для здравоохранения, в которой представлена подробная оценка технологий здравоохранения относительно использования полногеномного секвенирования для пациентов с необъяснимыми нарушениями развития или множественными врожденными аномалиями [5].

В настоящем исследовании мы приводим одно из доказательств успешности применения геномного (в данном конкретном случае экзомного) секвенирования семейного трио – родителей и пробанда, в качестве первого метода геномного скриннинга случаев множественных необъясненных нарушений и задержек развития ребенка. Кроме того, мы показываем, что экзомное секвенирование позволяет успешно идентифицировать как потенциально патогенные однонуклеотидные варианты, так и клинически значимые структурные перестройки в геноме.

Участники исследования – семья славянского происхождения: родители и ребенок – девочка в возрасте 12 лет с нарушениями физического и психического развития неизвестной этиологии. На момент рождения ребенка возраст матери и отца был 34 и 30 лет соответственно. Беременность проходила без осложнений. Однако роды, наступившие на 42-ой неделе беременности, проходили с некоторыми осложнениями: применялась искусственная стимуляция родовой деятельности, у плода было обнаружено замедленное сердцебиение и жидкость в легких. Оценка новорожденного по шкале Апгар составляла 7–8 балов, вес при рождении – 2920 г, врожденных патологий отмечено не было. Мать с новорожденной были выписаны из родильного отделения на пятый день после родов.

С первых лет жизни у ребенка отмечались множественные нарушения и задержки физического и психического развития: замедленный рост, недостаток веса, задержка развития моторных функций, нарушение сна и кормления. В анамнезе ребенка присутствуют нарушения работы желудочно-кишечного тракта и дефекации, фебрильные судороги и афективно-респираторные приступы с потерей сознания, проблемы со зрением и слухом. Со стороны психоречевого развития у ребенка наблюдаются: сенсорно-моторная алалия, дислексия, синдром дефицита внимания и нарушения обучения. По результатам психологического тестирования уровень адаптивного поведения ребенка отстает от такового у сверстников, с наиболее выраженными проблемами в навыках самообслуживания. Значительное отставание было также отмечено в речевом и познавательном развитии, оцененными по шкалам PLS-5 [7] и MSEL [8] соответственно. В этих доменах общие показатели развития соответствовали пятилетнему уровню, т.е. на семь лет меньше биологического возраста ребенка.

Общая клиническая картина расстройств и задержек развития предполагала высокую долю генетической компоненты в этиологии нарушений. В семейной истории случаев патологий и нарушений развития не отмечено. Проведенный ранее анализ кариотипа ребенка патологий не выявил, был установлен нормальный женский кариотип 46,XX. Других типов молекулярной диагностики ребенку не назначалось; диагноз поставлен не был. Все это позволяло предположить наличие de novo микроизменений в геноме ребенка, не улавливаемых классическими цитогенетическими методами, что, в свою очередь, обусловливало необходимость полногеномного скриннинга ребенка и родителей. Будучи заинтересованы в таком анализе, родители проявили инициативу стать участниками нашего исследовательского проекта, нацеленного на геномные исследования нарушений развития c помощью методов секвенирования. Семья предоставила свое информированное согласие на использование геномных данных и последующую публикацию результатов.

Источником ДНК являлись образцы слюны от родителей и ребенка. Геномный скринниг семейного трио проводился методом полноэкзомного секвенирования. Для приготовления библиотек использовалась панель и набор реагентов для экзомного обогащения Illumina TruSeq Exome. Секвенирование проводилось на базе РЦ СПбГУ на платформе Illumina HiSeq4000. Для анализа данных секвенирования использовались хорошо апробированные и широко применяемые методы и инструменты. Контроль качества данных секвенирования выполнялся с помощью FastQC [9] и оценки распределения к-меров [10]. Выравнивание фрагментов и аннотирование к GRCh37/hg19 проводилось с использованием BWA [11] (версия 0.7.17-r1188) с последующей сортировкой, дедупликацией и повторной калибровкой в соответствии со стандартами и рекомендациями GATK Best Practices [12]. Обнаружение однонуклеотидных вариантов (Single Nucleotide Variant, SNV) проводилось с помощью HaplotypeCaller с последующей рекалибровкой вариантов с помощью VariantRecalibrator, а определение de novo SNV – с помощью VariantAnnotator (GATK 4.1.6). Кроме того, на основе данных экзомного секвенирования и с помощью алгоритмов сегментации cn.MOPS [13] были идентифицированы структурные геномные вариации или вариации числа копий (Copy Number Variation, CNV).

По результатам анализа данных секвенирования и аннотирования к референсному геному в семейном трио было обнаружено свыше 30 тыс. SNV. С помощью инструментов ANNOVAR [14] была проведена фильтрация SNV на основе основных моделей наследования (аутосомно-доминантного, рецессивного и X-сцепленного), с последующей функциональной аннотацией и приоритезацией вариантов в контексте ассоциации с фенотипом задержки развития. Потенциальных вариантов-кандидатов обнаружено не было. Сходный результат был получен для анализа de novo SNV в геноме ребенка. Таковых было обнаружено 23 SNV в состоянии гетерозиготы, 10 из которых являлись миссенс-мутациями, но только две из них: rs77696629 и rs1255143876 – замены в 10-ом экзоне гена карбоксилэфирной липазы CEL и 26-ом экзоне муцина MUC5B соответственно, могут быть отнесены ко вредным мутациям (табл. 1). Оба варианта являются достаточно редкими (Minor allele frequency – MAF < 0.05) и затрагивают гены, мутации в которых известно ассоциированы с развитием таких заболеваний как MODY-диабет (CEL), заболеваний дыхательной системы – астма и идиопатический легочный фиброз (MUC5B). Однако следует отметить, что ни один из выявленных de novo SNV не являлся клинически значимым согласно результатам аннотации к релевантной базе данных ClinVar [15].

Таблица 1.

Миссенс-замены de novo, выявленные у ребенка на основе данных экзомного секвенирования семейной триады

Позиция (GRCh37) Ген Аллель Код dbSNP Замена Значимость* Частота**
ExAC gnomAD
chr4:145041720 GYPA A > G rs7682260 ex2:c.T59C:p.L20S N 0.0502 0.1846
chr6:170627739 FAM120B G > C rs17860761 ex2:c.G1297C:p.A433P N 0.025 0.0105
chr9:135946015 CEL T > C rs77696629 ex10:c.T1463C:p.I488T D 0.0163 0.0263
chr11:1093412 MUC2 C > T rs113330607 ex31:c.C5231T:p.T1744M N 0.2426 0.0746
chr11:1260248 MUC5B G > A rs1255143876 ex26:c.G3445A:p.D1149N D   0.0037
chr17:78063996 CCDC40 A > G rs7210679 ex18:c.A2891G:p.H964R N 0.2679 0.2652
chr19:9025654 MUC16 T > G rs201931630 ex15:c.A36800C:p.K12267T N 0.0019 0.0011
chr19:56274503 RFPL4A T > G rs140087406 ex3:c.T826G:p.S276A N 0.0001 0.0005
chr19:56274506 RFPL4A G > A rs147984855 ex3:c.G829A:p.A277T N 0.0011 0.0167
chr19:56274507 RFPL4A C > G rs149792632 ex3:c.C830G:p.A277G N 0.0001 0.0514

Примечание. * – функциональная значимость SNV: нейтральный вариант – N, вредная мутация – D; определялась по результатам оценок шестью алгоритмами: SIFT [16], PolyPhen-2, PROVEAN [17], MutationTaster [18], M-CAP [19] и CADD [20]; статус D присуждался при условии, что три из шести алгоритмов предсказывают достоверно высокий уровень вредоносности мутации. ** – приведена частота варианта в европейской популяции по данным агрегаторов консорциумов gnomAD [25] и ExAC [26].

При фактическом отсутствии патогенных SNV анализ структурных вариаций позволил установить несколько потенциально клинически значимых перестроек в геноме ребенка. Всего в семейном трио было выявлено 54 CNV, из них 22 – в геноме ребенка, включая 11 микроделеций и дупликаций de novo, отмеченных в восьми хромосомных сегментах (табл. 2). Большинство структурных вариаций может быть отнесено к распространенным полиморфным вариантам: например CNV в регионе сегментальной дупликации генов на хромосоме 1 (1q21.2) и в высокополиморфном локусе на хромосоме 6 (6p21.3), несущем гены главного комплекса гистосовместимости HLA. Однако микроделеции 15q11.2 и дупликации 17p11.2 могут являться маркерами клинически значимых структурных вариаций генома. Также следует отметить, что в данных хромосомных сегментах было обнаружено по два блока делеций и дупликаций соответственно (табл. 2), что при условии дискретности экзомных данных в контексте покрытия генома может являться маркером гораздо более крупных перестроек в данных сегментах.

Таблица 2.

Структурные геномные вариации de novo, выявленные у ребенка на основе данных экзомного секвенирования семейной триады

Хромомсома, сегмент Структурный вариант Длина
(п.о.)
Структурная перестройка Гены
1q21.2 NC_000001.10:g.144617148_144677049del 59 902 Делеция NBPF8, NBPF9, NBPF20, PDE4DIP
6p21.33 NC_000006.11:g.31083750_31106558del 22 809 То же PSORS1C1, PSORS1C2, CDSN
NC_000006.11:g.31129221_31165659del 36 439 » TCF19, POU5F1, PSORS1C3, HCG27
8p23.1 NC_000008.10:g 12274164_12286409del 12 246 » FAM66A, FAM86B2
8p11.22 NC_000008.10:g.39311490_39349532del 38 043 » ADAM3A
14q32.33 NC_000014.8:g.106452668_106494604del 41 937 » Вариабельная область Ig
15q11.1 NC_000015.9:g 20636293_20663214del 26 922 » HERC2P3
15q11.2* NC_000015.9:g.20776030_20778064del 2035 » GOLGA8CP
NC_000015.9:g.23444002_23600066del 156 065 » GOLGA8EP, HERC2P2
17p11.2** NC_000017.10:g.18325571_18389514dup 63 944 Дупликация KRT16P1, LGALS9C
NC_000017.10:g.18395987_18491218dup 95 232 То же LGALS9C, USP32P2

Примечание. Звездочками отмечены хромосомные локусы, структурые перестройки в которых ассоциированы с клиническими фенотипами; приведено по данным интегрированной БД заболеваний и их аннотаций MalaCards [21]. * – синдром микроделеции 15q11.2: делеция 300–500 тпн в консервативном неимпринтном участке BP1–BP2 критического региона Прадера–Вилли/Ангельмана (NC_000015.9:g.22765628-23317514del), гены-кандидаты – CYFIP1, NIPA1, NIPA2 и TUBGCP5 [15]. ** – синдром микродупликации 17p11.2, или синдром Потоки–Люпски: размер дупликации варьирует от 1.3 до 15.2 Мб, наиболее распространенный вариант дупликации ~3.5 Мб NC_000017.10:g.16757111_20219651 dup включает 49 генов, основные гены-кандидаты – FLCN и RAI1 [15].

Будучи выявлены как микроперестройки, не затрагивающие основные синдромальные гены-кандидаты, делеции 15q11.2 и дупликации 17p11.2 тем не менее пересекаются с регионами и типами структурных изменений, связаными с одноименными синдромами (табл. 2), проявляющимися прежде всего как множественные нарушения и задержки развития. Так, делеция NC_000015.9:g.23444002_23600066del была отмечена в районе дупликации гена HERC2, фланкирующего консервативный участок BP1–BP2 (Break Point) критического региона Прадера–Вилли/ Ангельмана 15q11-13. Делеция 300–500 тпн в этом участке, несущем неимпринтные гены CYFIP1, NIPA1, NIPA2 и TUBGCP5, связана с синдромом микроделеции 15q11.2. Выявленные инсерции 17p11.2 длиной 64 и 95 тпн пересекаются с CNV NC_000017.10:g.16757111-20219651)dup, обусловливающем классический синдром дупликации 17p11.2, или синдром Потоки–Люпски (табл. 2). Следует отметить, что комплекс нарушений, как при синдроме микроделеции 15q11.2 – неврологические дисфункции, задержка речевого и моторного развития и аутистическое расстройство, так и при синдроме Потоки–Люпски – задержки психо-физического развития, гипотонус мышц, проблемы с кормлением и расстройства поведения, в высокой степени соответствуют клиническому фенотипу исследованного ребенка.

Как следствие, CNV в 15q11.2 и 17p11.2 были рассмотрены в качестве ключевых для определения этиологии/диагностики данного случая нарушений развития. Полученные в результате нашего исследования данные позволили семье инициировать направленные клинические тесты. Было проведено молекулярно-цитогенетическое исследование хромосом 15 и 17 методом in situ FISH-гибридизации в одной из сертифицированных клинических лабораторий г. Москвы. Выявленные нами микроделеции в локусе 15q11.2 FISH-методом подтверждены не были, тогда как наличие у ребенка дупликации района 17p11.2 было подтверждено как присутствие двух копий локуса LIS и трех копий локуса RAI1 в каждом ядре [nuc ish(LISх2,RAI1х3); ДНК-зонд MD Miller-Dieker LIS (17p13)/MD Smith-Magenis RAI (17p11), KREATECH]. Помимо этого дупликация 17p11.2 была дополнительно валидирована другой диагностической лабораторией методом мультиплексной амплификации лигированных зондов (MRC-Holland SALSA MLPA probemix P369-А2). Таким образом, она установлена как дупликация g.(?_16852223)_(20130903_?)dup (GRCh37/hg19), включающая гены TNFRSF13B, COPS3, MIR33B, TOM1L2, DRC3, LLGL1, PRPSAP2, MFAP4, ALDH3A1, AKAP10, SPECC1 и основные гены-кандидаты клинического фенотипа – FLCN и RAI1.

В результате, обследованному ребенку, на 13 году его жизни, был поставлен диагноз – вновь приобретенный синдром Потоки–Люпски, что для семьи означает определенность в прогнозах для здоровья и развития дочери и помощь в принятии решения о рождении второго ребенка. Потоки–Люпски (OMIM:610883) – это редкое (1:25 тыс. новорожденных) генетическое заболевание, впервые открытое в 1996 г. [22] и описанное в 2007 г. [23]. Прежде всего, оно связано с нарушением развития ЦНС и пороками сердца. Как многие другие генетические заболевания данная патология характеризуется вариативными клиническими фенотипами [24], что значительно усложняет диагностику в отсутствие генетического анализа.

Таким образом, нами еще раз показана успешность применения экзомного секвенирования для первичной диагностики множественных нарушений развития. Мы уверены, что в условиях постоянно снижающейся стоимости молекулярного и биоинформатического анализов, связанных с геномным секвенированием, подобное тестирование семейных трио в скором будущем найдет свое применение в широкой клинической практике. Также полагаем, что изложенные в данном сообщении результаты анализа СNV и значимости их валидации могут быть полезны для других коллективов, использующих в своих исследованиях методы таргетного экзомного секвенирования для выявления геномных вариаций.

Работа выполнена при поддержке гранта РФФИ-17-29-02384, руководитель проекта Е.Л. Григоренко.

Все процедуры, выполненные в исследовании с участием людей, соответствуют этическим стандартам институционального и/или национального комитета по исследовательской этике и Хельсинкской декларации 1964 г. и ее последующим изменениям или сопоставимым нормам этики.

От каждого из включенных в исследование участников было получено информированное добровольное согласие.

Авторы заявляют, что у них нет конфликта интересов.

Список литературы

  1. Tărlungeanu D.C., Novarino G. Genomics in neurodevelopmental disorders: an avenue to personalized medicine // Ex. Mol. Med. 2018. V. 50. № 8. P. 1–7. https://doi.org/10.1038/s12276-018-0129-7

  2. Bowling K.M., Thompson M.L., Amaral M.D. et al. Genomic diagnosis for children with intellectual disability and/or developmental delay // Genome Med. 2017. V. 9. № 1. P. 43. https://doi.org/10.1186/s13073-017-0433-1

  3. Han J.Y., Lee I.G. Genetic tests by next-generation sequencing in children with developmental delay and/or intellectual disability // Clin. Exp. Pediatr. 2020. V. 63. № 6. P. 195–202. https://doi.org/10.3345/kjp.2019.00808

  4. Srivastava S., Love-Nichols J.A., Dies K.A. et al. Meta-analysis and multidisciplinary consensus statement: Exome sequencing is a first-tier clinical diagnostic test for individuals with neurodevelopmental disorders // Genet. Med. 2019. V. 21. № 11. P. 2413–2421. https://doi.org/10.1038/s41436-019-0554-6

  5. Ontario Health Q. Genome-wide sequencing for unexplained developmental disabilities or multiple congenital anomalies: A health technology assessment // Ont. Health Technol. Assess. Ser. 2020. V. 20. № 11. P. 1–178.

  6. Sparrow S.S., Cicchetti D., Balla D.V. Vineland Adaptive Behavior Scales. San Antonio, TX: Pearson Assessment, 2005.

  7. Zimmerman I.L., Steiner V.G., Pond R.A. The Preschool Language Scale-5. San Antonio, TX, Pearson, 2011.

  8. Mullen E.M. Mullen Scales of Early Learning. Circle Pines, MN: American Guidance Service Inc., 1995.

  9. Andrews S. FastQC: A quality control tool for High Throughput Sequence Data [Online]. 2010. http:// www.bioinformatics.babraham.ac.uk/projects/fastqc/

  10. Marçais G., Kingsford C. A fast, lock-free approach for efficient parallel counting of occurrences of k-mers // Bioinformatics. 2011. V. 27. № 6. P. 764–770. https://doi.org/10.1093/bioinformatics/btr011

  11. Li H., Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform // Bioinformatics. 2009. V. 25. № 14. P. 1754–1760. https://doi.org/10.1093/bioinformatics/btp324

  12. Van der Auwera G.A., Carneiro M.O., Hartl C. et al. From FastQ data to high confidence variant calls: The Genome Analysis Toolkit best practices pipeline // Curr. Protoc. Bioinformatics. 2013. V. 43. № 1110. P. 11.10.1–11.10.33. https://doi.org/10.1002/0471250953.bi1110s43

  13. Klambauer G., Schwarzbauer K., Mayr A. et al. cn.MOPS: Mixture of Poissons for discovering copy number variations in next-generation sequencing data with a low false discovery rate // Nucl. Ac. Res. 2012. V. 40. № 9. P. e69. https://doi.org/10.1093/nar/gks003

  14. Wang K., Li M., Hakonarson H. ANNOVAR: Functional annotation of genetic variants from high-throughput sequencing data // Nucl. Ac. Res. 2010. V. 38. № 16. P. e164. https://doi.org/10.1093/nar/gkq603

  15. Landrum M.J., Lee J.M., Benson M. et al. ClinVar: Improving access to variant interpretations and supporting evidence // Nucl. Ac. Res. 2018. V. 46. № D1. P. D1062–D1067. https://doi.org/10.1093/nar/gkx1153

  16. Kumar P., Henikoff S., Ng P.C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm // Nat. Protoc. 2009. V. 4. № 7. P. 1073–1081. https://doi.org/10.1038/nprot.2009.86

  17. Choi Y., Sims G.E., Murphy S. et al. Predicting the functional effect of amino acid substitutions and indels // PLoS One. 2012. V. 7. № 10. P. e46688. https://doi.org/10.1371/journal.pone.0046688

  18. Schwarz J.M., Cooper D.N., Schuelke M., Seelow D. MutationTaster2: Mutation prediction for the deep-sequencing age // Nat. Methods. 2014. V. 11. № 4. P. 361–362. https://doi.org/10.1038/nmeth.2890

  19. Jagadeesh K.A., Wenger A.M., Berger M.J. et al. M-CAP eliminates a majority of variants of uncertain significance in clinical exomes at high sensitivity // Nat. Genet. 2016. V. 48. № 12. P. 1581–1586. https://doi.org/10.1038/ng.3703

  20. Rentzsch P., Witten D., Cooper G.M. et al. CADD: Predicting the deleteriousness of variants throughout the human genome // Nucl. Ac. Res. 2018. V. 47. № D1. P. D886–D894. https://doi.org/10.1093/nar/gky1016

  21. Rappaport N., Twik M., Plaschkes I. et al. MalaCards: An amalgamated human disease compendium with diverse clinical and genetic annotation and structured search // Nucl. Ac. Res. 2017. V. 45. № D1. P. D877–D887. https://doi.org/10.1093/nar/gkw1012

  22. Brown A., Phelan M.C., Patil S. et al. Two patients with duplication of 17p11.2: The reciprocal of the Smith-Magenis syndrome deletion // Am. J. Med. Genet. 1996. V. 63. № 2. P. 373–377. https://doi.org/10.1002/(SICI)1096-8628(19960517)63: 2<373::AID-AJMG9>3.0.CO;2-U

  23. Potocki L., Bi W., Treadwell-Deering D. et al. Characterization of Potocki–Lupski syndrome (dup(17)(p11.2p11.2)) and delineation of a dosage-sensitive critical interval that can convey an autism phenotype // Am. J. Hum. Genet. 2007. V. 80. № 4. P. 633–649. https://doi.org/10.1086/512864

  24. Potocki L., Neira-Fresneda J., Yuan B. Potocki-Lupski Syndrome // Gene Reviews® [Internet]. Seattle (WA): University of Washington, Seattle, 2017. https://www.ncbi.nlm.nih.gov/books/NBK447920/

  25. Karczewski K.J., Francioli L.C., Tiao G. et al. The mutational constraint spectrum quantified from variation in 141,456 humans // Nature. 2020. V. 581. P. 434–443. https://doi.org/10.1038/s41586-020-2308-7

  26. Lek M., Karczewski K.J., Minikel E.V. et al. Analysis of protein-coding genetic variation in 60,706 humans // Nature. 2016. V. 536. P. 285–291. https://doi.org/10.1093/nar/gkw971

Дополнительные материалы отсутствуют.