Генетика, 2023, T. 59, № 7, стр. 828-838

Экспериментальная оценка возможности выявления кросс-контаминированных образцов ДНК на основе генетических данных

Н. В. Фелиз 1*, К. С. Грамматикати 1, С. И. Митрофанов 1, П. А. Гребнев 1, К. Д. Конуреева 1, Е. Д. Маралова 1, М. В. Ерохина 1, Т. А. Шпакова 1, П. Г. Казакова 1, Ю. Н. Ахмерова 1, А. А. Мкртчян 1, Е. А. Снигирь 1, В. С. Юдин 1, А. А. Кескинов 1, С. М. Юдин 1, В. И. Скворцова 2

1 Федеральное государственное бюджетное учреждение «Центр стратегического планирования и управления медико-биологическими рисками здоровью» Федерального медико-биологического агентства
119121 Москва, Россия

2 Федеральное медико-биологическое агентство
123182 Москва, Россия

* E-mail: feliz08nv@gmail.com

Поступила в редакцию 15.12.2022
После доработки 30.01.2023
Принята к публикации 01.02.2023

Аннотация

Проблемы кросс-контаминации и неправильной маркировки образцов биоматериала являются крайне актуальными при проведении массовых генетических исследований. В настоящем исследовании проведена экспериментальная оценка возможности выявления кросс-контаминированных образцов ДНК с использованием нескольких подходов: расчета отношения ридов, приходящихся на референсный или альтернативный аллель (allele ratio, AR); отношения количества гетерозиготных вариантов к гомозиготным; значения показателя CallRate для данных, полученных с помощью ДНК-микрочипов; программы Picard CrosscheckFingerprints (CrossCheck). Для проведения исследований были созданы контаминированные образцы (смеси) путем смешивания обычных “чистых” образцов ДНК в разных соотношениях. Показатели качества образцов проанализированы по данным полногеномного секвенирования и генотипирования с помощью ДНК-микрочипа Illumina microarray BeadArray technology CoreExome (СЕ). Экспериментально установлено, что все указанные подходы могут быть использованы для выявления ошибок генотипирования, связанных с контаминированием образцов.

Ключевые слова: полногеномное секвенирование, контаминация, ДНК-микрочипы, контроль качества.

Список литературы

  1. Dallavilla T., Marceddu G., Casadei A. et al. A fast, reliable and easy method to detect within-species DNA contamination // Acta Bio-Medica Atenei Parm. 2020. V. 91. № 13-S. https://doi.org/10.23750/abm.v91i13-S.10531

  2. Wang J., Raskin L., Samuels D.C. et al. Genome measures used for quality control are dependent on gene function and ancestry // Bioinformatics. 2015. V. 31. № 3. P. 318–323. https://doi.org/10.1093/bioinformatics/btu668

  3. Javed N., Farjoun Y., Fennell T.J. et al. Detecting sample swaps in diverse NGS data types using linkage disequilibrium // Nat. Commun.2020. V. 11. № 1. P. 3697. https://doi.org/10.1038/s41467-020-17453-5

  4. Miller N.A., Farrow E.G., Gibson M. et al. A 26-hour system of highly sensitive whole genome sequencing for emergency management of genetic diseases // Genome Med. 2015. V. 7. № 1. P. 100. https://doi.org/10.1186/s13073-015-0221-8

  5. Kim S., Scheffler K., Halpern A.L. et al. Strelka2: Fast and accurate calling of germline and somatic variants // Nat. Methods. 2018. V. 15. № 8. P. 591–594. https://doi.org/10.1038/s41592-018-0051-x

  6. Danecek P., Bonfield J.K., Liddle J. et al. Twelve years of SAMtools and BCFtools // GigaScience. 2021. V. 10. № 2. https://doi.org/10.1093/gigascience/giab008

  7. Zhao H., Sun Z., Wang J. et al. CrossMap: A versatile tool for coordinate conversion between genome assemblies // Bioinforma. Oxf. Engl. 2014. V. 30. № 7. P. 1006–1007. https://doi.org/10.1093/bioinformatics/btt730

Дополнительные материалы

скачать ESM.zip
Приложение 1.