Генетика, 2023, T. 59, № 7, стр. 828-838
Экспериментальная оценка возможности выявления кросс-контаминированных образцов ДНК на основе генетических данных
Н. В. Фелиз 1, *, К. С. Грамматикати 1, С. И. Митрофанов 1, П. А. Гребнев 1, К. Д. Конуреева 1, Е. Д. Маралова 1, М. В. Ерохина 1, Т. А. Шпакова 1, П. Г. Казакова 1, Ю. Н. Ахмерова 1, А. А. Мкртчян 1, Е. А. Снигирь 1, В. С. Юдин 1, А. А. Кескинов 1, С. М. Юдин 1, В. И. Скворцова 2
1 Федеральное государственное бюджетное учреждение «Центр стратегического планирования и управления медико-биологическими рисками здоровью» Федерального медико-биологического агентства
119121 Москва, Россия
2 Федеральное медико-биологическое агентство
123182 Москва, Россия
* E-mail: feliz08nv@gmail.com
Поступила в редакцию 15.12.2022
После доработки 30.01.2023
Принята к публикации 01.02.2023
- EDN: SSDAUO
- DOI: 10.31857/S0016675823060061
Полные тексты статей выпуска доступны в ознакомительном режиме только авторизованным пользователям.
Аннотация
Проблемы кросс-контаминации и неправильной маркировки образцов биоматериала являются крайне актуальными при проведении массовых генетических исследований. В настоящем исследовании проведена экспериментальная оценка возможности выявления кросс-контаминированных образцов ДНК с использованием нескольких подходов: расчета отношения ридов, приходящихся на референсный или альтернативный аллель (allele ratio, AR); отношения количества гетерозиготных вариантов к гомозиготным; значения показателя CallRate для данных, полученных с помощью ДНК-микрочипов; программы Picard CrosscheckFingerprints (CrossCheck). Для проведения исследований были созданы контаминированные образцы (смеси) путем смешивания обычных “чистых” образцов ДНК в разных соотношениях. Показатели качества образцов проанализированы по данным полногеномного секвенирования и генотипирования с помощью ДНК-микрочипа Illumina microarray BeadArray technology CoreExome (СЕ). Экспериментально установлено, что все указанные подходы могут быть использованы для выявления ошибок генотипирования, связанных с контаминированием образцов.
Полные тексты статей выпуска доступны в ознакомительном режиме только авторизованным пользователям.
Список литературы
Dallavilla T., Marceddu G., Casadei A. et al. A fast, reliable and easy method to detect within-species DNA contamination // Acta Bio-Medica Atenei Parm. 2020. V. 91. № 13-S. https://doi.org/10.23750/abm.v91i13-S.10531
Wang J., Raskin L., Samuels D.C. et al. Genome measures used for quality control are dependent on gene function and ancestry // Bioinformatics. 2015. V. 31. № 3. P. 318–323. https://doi.org/10.1093/bioinformatics/btu668
Javed N., Farjoun Y., Fennell T.J. et al. Detecting sample swaps in diverse NGS data types using linkage disequilibrium // Nat. Commun.2020. V. 11. № 1. P. 3697. https://doi.org/10.1038/s41467-020-17453-5
Miller N.A., Farrow E.G., Gibson M. et al. A 26-hour system of highly sensitive whole genome sequencing for emergency management of genetic diseases // Genome Med. 2015. V. 7. № 1. P. 100. https://doi.org/10.1186/s13073-015-0221-8
Kim S., Scheffler K., Halpern A.L. et al. Strelka2: Fast and accurate calling of germline and somatic variants // Nat. Methods. 2018. V. 15. № 8. P. 591–594. https://doi.org/10.1038/s41592-018-0051-x
Danecek P., Bonfield J.K., Liddle J. et al. Twelve years of SAMtools and BCFtools // GigaScience. 2021. V. 10. № 2. https://doi.org/10.1093/gigascience/giab008
Zhao H., Sun Z., Wang J. et al. CrossMap: A versatile tool for coordinate conversion between genome assemblies // Bioinforma. Oxf. Engl. 2014. V. 30. № 7. P. 1006–1007. https://doi.org/10.1093/bioinformatics/btt730
Дополнительные материалы
- скачать ESM.zip
- Приложение 1.