Генетика, 2021, T. 57, № 11, стр. 1333-1338
Идентификация патогенных CNV с помощью экзомного секвенирования при необъясненных задержках развития: исследование семейного трио
О. Ю. Наумова 1, 2, *, П. В. Добрынин 1, 3, Е. А. Гибитова 3, М. А. Жукова 2, 4, С. Ю. Рычков 1, О. В. Жукова 1, Е. Л. Григоренко 2, 4
1 Институт общей генетики им. Н.И. Вавилова Российской академии наук
119991 Москва, Россия
2 Хьюстонский Университет
77204 Техас, Хьюстон, США
3 Университет информационных технологий, механики и оптики
197101 Санкт-Петербург, Россия
4 Санкт-Петербургский государственный университет
119034 Санкт-Петербург, Россия
* E-mail: oksana.yu.naumova@gmail.com
Поступила в редакцию 20.01.2021
После доработки 25.03.2021
Принята к публикации 26.03.2021
Аннотация
На примере исследования отдельного семейного случая, показано успешное применение экзомного секвенирования семейных трио (ребенок-пробанд и родители) в качестве первого метода геномной диагностики множественных необъясненных нарушений и задержек развития, с целью скриннинга на наличие патогенных однуклеотидных замен и структурных геномных вариантов (Copy Number Variation – CNV). В конкретном исследованном случае установлены клинически значимые структурные вариации de novo в геноме ребенка, связанные с синдромом дупликации 17p11.2, или синдромом Потоки–Люпски. Установленные геномные перестройки 17p11.2 были подтверждены методами FISH и MLPA в сертифицированных клинических лабораториях.
Публикации последних лет в области медицинской генетики предоставляют многочисленные свидетельства успешности и продуктивности применения полногеномного и экзомного секвенирования в клинической практике для персонализированной медицины [1]. Убедительно показана особенная ценность геномного секвенирования в трио пробанд–родители, как эффективного диагностического инструмента первого выбора в случаях сложных и труднодиагностируемых заболеваний, таких как детские неврологические заболевания [2] и задержки развития [3]. Так, недавний метаанализ релевантной литературы показал бесспорные преимущества секвенирования над методами геномного скрининга с помощью ДНК-чипов [4]. С активным развитием технологий геномного секвенирования стоимость такого анализа ежедневно сокращается, что делает метод все более доступным для клинической практики. Это в свою очередь побуждает ряд стран к разработке основ и правил внедрения этого типа анализа в государственные медицинские программы. Одним из таких примеров является прошлогодняя публикация результатов исследования одной из канадских организаций (Health Quality Ontario), разрабатывающих стандарты качества и рекомендации для здравоохранения, в которой представлена подробная оценка технологий здравоохранения относительно использования полногеномного секвенирования для пациентов с необъяснимыми нарушениями развития или множественными врожденными аномалиями [5].
В настоящем исследовании мы приводим одно из доказательств успешности применения геномного (в данном конкретном случае экзомного) секвенирования семейного трио – родителей и пробанда, в качестве первого метода геномного скриннинга случаев множественных необъясненных нарушений и задержек развития ребенка. Кроме того, мы показываем, что экзомное секвенирование позволяет успешно идентифицировать как потенциально патогенные однонуклеотидные варианты, так и клинически значимые структурные перестройки в геноме.
Участники исследования – семья славянского происхождения: родители и ребенок – девочка в возрасте 12 лет с нарушениями физического и психического развития неизвестной этиологии. На момент рождения ребенка возраст матери и отца был 34 и 30 лет соответственно. Беременность проходила без осложнений. Однако роды, наступившие на 42-ой неделе беременности, проходили с некоторыми осложнениями: применялась искусственная стимуляция родовой деятельности, у плода было обнаружено замедленное сердцебиение и жидкость в легких. Оценка новорожденного по шкале Апгар составляла 7–8 балов, вес при рождении – 2920 г, врожденных патологий отмечено не было. Мать с новорожденной были выписаны из родильного отделения на пятый день после родов.
С первых лет жизни у ребенка отмечались множественные нарушения и задержки физического и психического развития: замедленный рост, недостаток веса, задержка развития моторных функций, нарушение сна и кормления. В анамнезе ребенка присутствуют нарушения работы желудочно-кишечного тракта и дефекации, фебрильные судороги и афективно-респираторные приступы с потерей сознания, проблемы со зрением и слухом. Со стороны психоречевого развития у ребенка наблюдаются: сенсорно-моторная алалия, дислексия, синдром дефицита внимания и нарушения обучения. По результатам психологического тестирования уровень адаптивного поведения ребенка отстает от такового у сверстников, с наиболее выраженными проблемами в навыках самообслуживания. Значительное отставание было также отмечено в речевом и познавательном развитии, оцененными по шкалам PLS-5 [7] и MSEL [8] соответственно. В этих доменах общие показатели развития соответствовали пятилетнему уровню, т.е. на семь лет меньше биологического возраста ребенка.
Общая клиническая картина расстройств и задержек развития предполагала высокую долю генетической компоненты в этиологии нарушений. В семейной истории случаев патологий и нарушений развития не отмечено. Проведенный ранее анализ кариотипа ребенка патологий не выявил, был установлен нормальный женский кариотип 46,XX. Других типов молекулярной диагностики ребенку не назначалось; диагноз поставлен не был. Все это позволяло предположить наличие de novo микроизменений в геноме ребенка, не улавливаемых классическими цитогенетическими методами, что, в свою очередь, обусловливало необходимость полногеномного скриннинга ребенка и родителей. Будучи заинтересованы в таком анализе, родители проявили инициативу стать участниками нашего исследовательского проекта, нацеленного на геномные исследования нарушений развития c помощью методов секвенирования. Семья предоставила свое информированное согласие на использование геномных данных и последующую публикацию результатов.
Источником ДНК являлись образцы слюны от родителей и ребенка. Геномный скринниг семейного трио проводился методом полноэкзомного секвенирования. Для приготовления библиотек использовалась панель и набор реагентов для экзомного обогащения Illumina TruSeq Exome. Секвенирование проводилось на базе РЦ СПбГУ на платформе Illumina HiSeq4000. Для анализа данных секвенирования использовались хорошо апробированные и широко применяемые методы и инструменты. Контроль качества данных секвенирования выполнялся с помощью FastQC [9] и оценки распределения к-меров [10]. Выравнивание фрагментов и аннотирование к GRCh37/hg19 проводилось с использованием BWA [11] (версия 0.7.17-r1188) с последующей сортировкой, дедупликацией и повторной калибровкой в соответствии со стандартами и рекомендациями GATK Best Practices [12]. Обнаружение однонуклеотидных вариантов (Single Nucleotide Variant, SNV) проводилось с помощью HaplotypeCaller с последующей рекалибровкой вариантов с помощью VariantRecalibrator, а определение de novo SNV – с помощью VariantAnnotator (GATK 4.1.6). Кроме того, на основе данных экзомного секвенирования и с помощью алгоритмов сегментации cn.MOPS [13] были идентифицированы структурные геномные вариации или вариации числа копий (Copy Number Variation, CNV).
По результатам анализа данных секвенирования и аннотирования к референсному геному в семейном трио было обнаружено свыше 30 тыс. SNV. С помощью инструментов ANNOVAR [14] была проведена фильтрация SNV на основе основных моделей наследования (аутосомно-доминантного, рецессивного и X-сцепленного), с последующей функциональной аннотацией и приоритезацией вариантов в контексте ассоциации с фенотипом задержки развития. Потенциальных вариантов-кандидатов обнаружено не было. Сходный результат был получен для анализа de novo SNV в геноме ребенка. Таковых было обнаружено 23 SNV в состоянии гетерозиготы, 10 из которых являлись миссенс-мутациями, но только две из них: rs77696629 и rs1255143876 – замены в 10-ом экзоне гена карбоксилэфирной липазы CEL и 26-ом экзоне муцина MUC5B соответственно, могут быть отнесены ко вредным мутациям (табл. 1). Оба варианта являются достаточно редкими (Minor allele frequency – MAF < 0.05) и затрагивают гены, мутации в которых известно ассоциированы с развитием таких заболеваний как MODY-диабет (CEL), заболеваний дыхательной системы – астма и идиопатический легочный фиброз (MUC5B). Однако следует отметить, что ни один из выявленных de novo SNV не являлся клинически значимым согласно результатам аннотации к релевантной базе данных ClinVar [15].
Таблица 1.
Позиция (GRCh37) | Ген | Аллель | Код dbSNP | Замена | Значимость* | Частота** | |
---|---|---|---|---|---|---|---|
ExAC | gnomAD | ||||||
chr4:145041720 | GYPA | A > G | rs7682260 | ex2:c.T59C:p.L20S | N | 0.0502 | 0.1846 |
chr6:170627739 | FAM120B | G > C | rs17860761 | ex2:c.G1297C:p.A433P | N | 0.025 | 0.0105 |
chr9:135946015 | CEL | T > C | rs77696629 | ex10:c.T1463C:p.I488T | D | 0.0163 | 0.0263 |
chr11:1093412 | MUC2 | C > T | rs113330607 | ex31:c.C5231T:p.T1744M | N | 0.2426 | 0.0746 |
chr11:1260248 | MUC5B | G > A | rs1255143876 | ex26:c.G3445A:p.D1149N | D | 0.0037 | |
chr17:78063996 | CCDC40 | A > G | rs7210679 | ex18:c.A2891G:p.H964R | N | 0.2679 | 0.2652 |
chr19:9025654 | MUC16 | T > G | rs201931630 | ex15:c.A36800C:p.K12267T | N | 0.0019 | 0.0011 |
chr19:56274503 | RFPL4A | T > G | rs140087406 | ex3:c.T826G:p.S276A | N | 0.0001 | 0.0005 |
chr19:56274506 | RFPL4A | G > A | rs147984855 | ex3:c.G829A:p.A277T | N | 0.0011 | 0.0167 |
chr19:56274507 | RFPL4A | C > G | rs149792632 | ex3:c.C830G:p.A277G | N | 0.0001 | 0.0514 |
Примечание. * – функциональная значимость SNV: нейтральный вариант – N, вредная мутация – D; определялась по результатам оценок шестью алгоритмами: SIFT [16], PolyPhen-2, PROVEAN [17], MutationTaster [18], M-CAP [19] и CADD [20]; статус D присуждался при условии, что три из шести алгоритмов предсказывают достоверно высокий уровень вредоносности мутации. ** – приведена частота варианта в европейской популяции по данным агрегаторов консорциумов gnomAD [25] и ExAC [26].
При фактическом отсутствии патогенных SNV анализ структурных вариаций позволил установить несколько потенциально клинически значимых перестроек в геноме ребенка. Всего в семейном трио было выявлено 54 CNV, из них 22 – в геноме ребенка, включая 11 микроделеций и дупликаций de novo, отмеченных в восьми хромосомных сегментах (табл. 2). Большинство структурных вариаций может быть отнесено к распространенным полиморфным вариантам: например CNV в регионе сегментальной дупликации генов на хромосоме 1 (1q21.2) и в высокополиморфном локусе на хромосоме 6 (6p21.3), несущем гены главного комплекса гистосовместимости HLA. Однако микроделеции 15q11.2 и дупликации 17p11.2 могут являться маркерами клинически значимых структурных вариаций генома. Также следует отметить, что в данных хромосомных сегментах было обнаружено по два блока делеций и дупликаций соответственно (табл. 2), что при условии дискретности экзомных данных в контексте покрытия генома может являться маркером гораздо более крупных перестроек в данных сегментах.
Таблица 2.
Хромомсома, сегмент | Структурный вариант | Длина (п.о.) |
Структурная перестройка | Гены |
---|---|---|---|---|
1q21.2 | NC_000001.10:g.144617148_144677049del | 59 902 | Делеция | NBPF8, NBPF9, NBPF20, PDE4DIP |
6p21.33 | NC_000006.11:g.31083750_31106558del | 22 809 | То же | PSORS1C1, PSORS1C2, CDSN |
NC_000006.11:g.31129221_31165659del | 36 439 | » | TCF19, POU5F1, PSORS1C3, HCG27 | |
8p23.1 | NC_000008.10:g 12274164_12286409del | 12 246 | » | FAM66A, FAM86B2 |
8p11.22 | NC_000008.10:g.39311490_39349532del | 38 043 | » | ADAM3A |
14q32.33 | NC_000014.8:g.106452668_106494604del | 41 937 | » | Вариабельная область Ig |
15q11.1 | NC_000015.9:g 20636293_20663214del | 26 922 | » | HERC2P3 |
15q11.2* | NC_000015.9:g.20776030_20778064del | 2035 | » | GOLGA8CP |
NC_000015.9:g.23444002_23600066del | 156 065 | » | GOLGA8EP, HERC2P2 | |
17p11.2** | NC_000017.10:g.18325571_18389514dup | 63 944 | Дупликация | KRT16P1, LGALS9C |
NC_000017.10:g.18395987_18491218dup | 95 232 | То же | LGALS9C, USP32P2 |
Примечание. Звездочками отмечены хромосомные локусы, структурые перестройки в которых ассоциированы с клиническими фенотипами; приведено по данным интегрированной БД заболеваний и их аннотаций MalaCards [21]. * – синдром микроделеции 15q11.2: делеция 300–500 тпн в консервативном неимпринтном участке BP1–BP2 критического региона Прадера–Вилли/Ангельмана (NC_000015.9:g.22765628-23317514del), гены-кандидаты – CYFIP1, NIPA1, NIPA2 и TUBGCP5 [15]. ** – синдром микродупликации 17p11.2, или синдром Потоки–Люпски: размер дупликации варьирует от 1.3 до 15.2 Мб, наиболее распространенный вариант дупликации ~3.5 Мб NC_000017.10:g.16757111_20219651 dup включает 49 генов, основные гены-кандидаты – FLCN и RAI1 [15].
Будучи выявлены как микроперестройки, не затрагивающие основные синдромальные гены-кандидаты, делеции 15q11.2 и дупликации 17p11.2 тем не менее пересекаются с регионами и типами структурных изменений, связаными с одноименными синдромами (табл. 2), проявляющимися прежде всего как множественные нарушения и задержки развития. Так, делеция NC_000015.9:g.23444002_23600066del была отмечена в районе дупликации гена HERC2, фланкирующего консервативный участок BP1–BP2 (Break Point) критического региона Прадера–Вилли/ Ангельмана 15q11-13. Делеция 300–500 тпн в этом участке, несущем неимпринтные гены CYFIP1, NIPA1, NIPA2 и TUBGCP5, связана с синдромом микроделеции 15q11.2. Выявленные инсерции 17p11.2 длиной 64 и 95 тпн пересекаются с CNV NC_000017.10:g.16757111-20219651)dup, обусловливающем классический синдром дупликации 17p11.2, или синдром Потоки–Люпски (табл. 2). Следует отметить, что комплекс нарушений, как при синдроме микроделеции 15q11.2 – неврологические дисфункции, задержка речевого и моторного развития и аутистическое расстройство, так и при синдроме Потоки–Люпски – задержки психо-физического развития, гипотонус мышц, проблемы с кормлением и расстройства поведения, в высокой степени соответствуют клиническому фенотипу исследованного ребенка.
Как следствие, CNV в 15q11.2 и 17p11.2 были рассмотрены в качестве ключевых для определения этиологии/диагностики данного случая нарушений развития. Полученные в результате нашего исследования данные позволили семье инициировать направленные клинические тесты. Было проведено молекулярно-цитогенетическое исследование хромосом 15 и 17 методом in situ FISH-гибридизации в одной из сертифицированных клинических лабораторий г. Москвы. Выявленные нами микроделеции в локусе 15q11.2 FISH-методом подтверждены не были, тогда как наличие у ребенка дупликации района 17p11.2 было подтверждено как присутствие двух копий локуса LIS и трех копий локуса RAI1 в каждом ядре [nuc ish(LISх2,RAI1х3); ДНК-зонд MD Miller-Dieker LIS (17p13)/MD Smith-Magenis RAI (17p11), KREATECH]. Помимо этого дупликация 17p11.2 была дополнительно валидирована другой диагностической лабораторией методом мультиплексной амплификации лигированных зондов (MRC-Holland SALSA MLPA probemix P369-А2). Таким образом, она установлена как дупликация g.(?_16852223)_(20130903_?)dup (GRCh37/hg19), включающая гены TNFRSF13B, COPS3, MIR33B, TOM1L2, DRC3, LLGL1, PRPSAP2, MFAP4, ALDH3A1, AKAP10, SPECC1 и основные гены-кандидаты клинического фенотипа – FLCN и RAI1.
В результате, обследованному ребенку, на 13 году его жизни, был поставлен диагноз – вновь приобретенный синдром Потоки–Люпски, что для семьи означает определенность в прогнозах для здоровья и развития дочери и помощь в принятии решения о рождении второго ребенка. Потоки–Люпски (OMIM:610883) – это редкое (1:25 тыс. новорожденных) генетическое заболевание, впервые открытое в 1996 г. [22] и описанное в 2007 г. [23]. Прежде всего, оно связано с нарушением развития ЦНС и пороками сердца. Как многие другие генетические заболевания данная патология характеризуется вариативными клиническими фенотипами [24], что значительно усложняет диагностику в отсутствие генетического анализа.
Таким образом, нами еще раз показана успешность применения экзомного секвенирования для первичной диагностики множественных нарушений развития. Мы уверены, что в условиях постоянно снижающейся стоимости молекулярного и биоинформатического анализов, связанных с геномным секвенированием, подобное тестирование семейных трио в скором будущем найдет свое применение в широкой клинической практике. Также полагаем, что изложенные в данном сообщении результаты анализа СNV и значимости их валидации могут быть полезны для других коллективов, использующих в своих исследованиях методы таргетного экзомного секвенирования для выявления геномных вариаций.
Работа выполнена при поддержке гранта РФФИ-17-29-02384, руководитель проекта Е.Л. Григоренко.
Все процедуры, выполненные в исследовании с участием людей, соответствуют этическим стандартам институционального и/или национального комитета по исследовательской этике и Хельсинкской декларации 1964 г. и ее последующим изменениям или сопоставимым нормам этики.
От каждого из включенных в исследование участников было получено информированное добровольное согласие.
Авторы заявляют, что у них нет конфликта интересов.
Список литературы
Tărlungeanu D.C., Novarino G. Genomics in neurodevelopmental disorders: an avenue to personalized medicine // Ex. Mol. Med. 2018. V. 50. № 8. P. 1–7. https://doi.org/10.1038/s12276-018-0129-7
Bowling K.M., Thompson M.L., Amaral M.D. et al. Genomic diagnosis for children with intellectual disability and/or developmental delay // Genome Med. 2017. V. 9. № 1. P. 43. https://doi.org/10.1186/s13073-017-0433-1
Han J.Y., Lee I.G. Genetic tests by next-generation sequencing in children with developmental delay and/or intellectual disability // Clin. Exp. Pediatr. 2020. V. 63. № 6. P. 195–202. https://doi.org/10.3345/kjp.2019.00808
Srivastava S., Love-Nichols J.A., Dies K.A. et al. Meta-analysis and multidisciplinary consensus statement: Exome sequencing is a first-tier clinical diagnostic test for individuals with neurodevelopmental disorders // Genet. Med. 2019. V. 21. № 11. P. 2413–2421. https://doi.org/10.1038/s41436-019-0554-6
Ontario Health Q. Genome-wide sequencing for unexplained developmental disabilities or multiple congenital anomalies: A health technology assessment // Ont. Health Technol. Assess. Ser. 2020. V. 20. № 11. P. 1–178.
Sparrow S.S., Cicchetti D., Balla D.V. Vineland Adaptive Behavior Scales. San Antonio, TX: Pearson Assessment, 2005.
Zimmerman I.L., Steiner V.G., Pond R.A. The Preschool Language Scale-5. San Antonio, TX, Pearson, 2011.
Mullen E.M. Mullen Scales of Early Learning. Circle Pines, MN: American Guidance Service Inc., 1995.
Andrews S. FastQC: A quality control tool for High Throughput Sequence Data [Online]. 2010. http:// www.bioinformatics.babraham.ac.uk/projects/fastqc/
Marçais G., Kingsford C. A fast, lock-free approach for efficient parallel counting of occurrences of k-mers // Bioinformatics. 2011. V. 27. № 6. P. 764–770. https://doi.org/10.1093/bioinformatics/btr011
Li H., Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform // Bioinformatics. 2009. V. 25. № 14. P. 1754–1760. https://doi.org/10.1093/bioinformatics/btp324
Van der Auwera G.A., Carneiro M.O., Hartl C. et al. From FastQ data to high confidence variant calls: The Genome Analysis Toolkit best practices pipeline // Curr. Protoc. Bioinformatics. 2013. V. 43. № 1110. P. 11.10.1–11.10.33. https://doi.org/10.1002/0471250953.bi1110s43
Klambauer G., Schwarzbauer K., Mayr A. et al. cn.MOPS: Mixture of Poissons for discovering copy number variations in next-generation sequencing data with a low false discovery rate // Nucl. Ac. Res. 2012. V. 40. № 9. P. e69. https://doi.org/10.1093/nar/gks003
Wang K., Li M., Hakonarson H. ANNOVAR: Functional annotation of genetic variants from high-throughput sequencing data // Nucl. Ac. Res. 2010. V. 38. № 16. P. e164. https://doi.org/10.1093/nar/gkq603
Landrum M.J., Lee J.M., Benson M. et al. ClinVar: Improving access to variant interpretations and supporting evidence // Nucl. Ac. Res. 2018. V. 46. № D1. P. D1062–D1067. https://doi.org/10.1093/nar/gkx1153
Kumar P., Henikoff S., Ng P.C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm // Nat. Protoc. 2009. V. 4. № 7. P. 1073–1081. https://doi.org/10.1038/nprot.2009.86
Choi Y., Sims G.E., Murphy S. et al. Predicting the functional effect of amino acid substitutions and indels // PLoS One. 2012. V. 7. № 10. P. e46688. https://doi.org/10.1371/journal.pone.0046688
Schwarz J.M., Cooper D.N., Schuelke M., Seelow D. MutationTaster2: Mutation prediction for the deep-sequencing age // Nat. Methods. 2014. V. 11. № 4. P. 361–362. https://doi.org/10.1038/nmeth.2890
Jagadeesh K.A., Wenger A.M., Berger M.J. et al. M-CAP eliminates a majority of variants of uncertain significance in clinical exomes at high sensitivity // Nat. Genet. 2016. V. 48. № 12. P. 1581–1586. https://doi.org/10.1038/ng.3703
Rentzsch P., Witten D., Cooper G.M. et al. CADD: Predicting the deleteriousness of variants throughout the human genome // Nucl. Ac. Res. 2018. V. 47. № D1. P. D886–D894. https://doi.org/10.1093/nar/gky1016
Rappaport N., Twik M., Plaschkes I. et al. MalaCards: An amalgamated human disease compendium with diverse clinical and genetic annotation and structured search // Nucl. Ac. Res. 2017. V. 45. № D1. P. D877–D887. https://doi.org/10.1093/nar/gkw1012
Brown A., Phelan M.C., Patil S. et al. Two patients with duplication of 17p11.2: The reciprocal of the Smith-Magenis syndrome deletion // Am. J. Med. Genet. 1996. V. 63. № 2. P. 373–377. https://doi.org/10.1002/(SICI)1096-8628(19960517)63: 2<373::AID-AJMG9>3.0.CO;2-U
Potocki L., Bi W., Treadwell-Deering D. et al. Characterization of Potocki–Lupski syndrome (dup(17)(p11.2p11.2)) and delineation of a dosage-sensitive critical interval that can convey an autism phenotype // Am. J. Hum. Genet. 2007. V. 80. № 4. P. 633–649. https://doi.org/10.1086/512864
Potocki L., Neira-Fresneda J., Yuan B. Potocki-Lupski Syndrome // Gene Reviews® [Internet]. Seattle (WA): University of Washington, Seattle, 2017. https://www.ncbi.nlm.nih.gov/books/NBK447920/
Karczewski K.J., Francioli L.C., Tiao G. et al. The mutational constraint spectrum quantified from variation in 141,456 humans // Nature. 2020. V. 581. P. 434–443. https://doi.org/10.1038/s41586-020-2308-7
Lek M., Karczewski K.J., Minikel E.V. et al. Analysis of protein-coding genetic variation in 60,706 humans // Nature. 2016. V. 536. P. 285–291. https://doi.org/10.1093/nar/gkw971
Дополнительные материалы отсутствуют.