Разработаны подходы для поиска и анализа патогенных вариантов нуклеотидной последовательности в некодирующих областях генов
Совместная статья сотрудников лаборатории функциональной геномики Медико-генетического научного центра имени академика Н.П. Бочкова, посвященная разработке алгоритма, позволяющего выявлять патогенные варианты нуклеотидной последовательности в 5`- нетранслируемых областях генов, вышла в журнале Nucleic Acids Research (Q1, IF 19.16) .
На сегодняшний день при проведении ДНК-диагностики пациентов с наследственными заболеваниями основное внимание исследователи обращают на ту часть гена, с которой непосредственно происходит трансляция основного белка, кодируемого данным геном. Однако помимо описанной белок-кодирующей части, гены человека включают в себя последовательности, не участвующие в кодировании белка. Одной из таких последовательностей является 5`-нетранслируемая область, находящаяся перед белок-кодирующей частью гена. Эти области играют важную роль в регуляции экспрессии генов за счёт различных механизмов, в том числе за счет наличия особых последовательностей, называемых малыми открытыми рамками считывания – upstream ORFs (uORFs).
По литературным оценкам более половины генов человека могут иметь такие рамки считывания, но патогенные варианты в них описаны лишь в единичных случаях. Это связано, с одной стороны, с отсутствием качественной аннотации uORFs в генах человека, а с другой, с отсутствием доступных инструментов для поиска и интерпретации вариантов в этих генах.
Работу, посвященную решению этих проблем, провели сотрудники лаборатории функциональной геномики МГНЦ совместно с коллегами из Дальневосточного Федерального Университета (ДВФУ), Научно-исследовательского института искусственного интеллекта (AIRI), Института биоинформатики и Политехнической школы в Париже. Научные сотрудники детально проанализировали около 3600 генов, связанных с наследственными заболеваниями, которые упоминаются в базе данных OMIM. В результате было описано порядка 4,7 тыс. сайтов инициации трансляции малых открытых рамок считывания в 1782 генах, ассоциированных с развитием наследственных заболеваний.
«Одним из важнейших результатов работы стало подтверждение того, что у половины генов, связанных с наследственными заболеваниями, существуют малые открытые рамки считывания. До настоящего момента не было создано достаточно качественного списка с координатами uORF в генах человека, что затрудняло поиск патогенных вариантов в данных генах. Наше исследование важно для повышения качества ДНК-диагностики пациентов с наследственными заболеваниями», – рассказала научный сотрудник лаборатории функциональной геномики МГНЦ, к.б.н. Александра Филатова.
Работа выполнена в рамках госзадания Министерства науки и высшего образования РФ при поддержке Научно-исследовательского института искусственного интеллекта (AIRI) и имеет большое практическое значение. Созданная программа поиска патогенных вариантов нуклеотидной последовательности в малых открытых рамках считывания позволит повысить эффективность диагностики. В случаях, когда стандартные методы ДНК-диагностики не принесут результата, врачи смогу воспользоваться биоинформатическим инструментом для поиска патогенных вариантов в 5`- нетранслируемых областях генов. Программа будет применяться в научно-исследовательской практике МГНЦ, а также будет открыта специалистам других научных и медицинских организаций.
С материалами статьи можно ознакомиться по ссылке:
Alexandra Filatova, Ivan Reveguk, Maria Piatkova, Daria Bessonova, Olga Kuziakova, Victoria Demakova, Alexander Romanishin, Veniamin Fishman, Yerzhan Imanmalik, Nikolay Chekanov, Rostislav Skitchenko, Yury Barbitoff, Olga Kardymon, Mikhail Skoblov. Annotation of uORFs in the OMIM genes allows to reveal pathogenic variants in 5′UTRs. Nucleic Acids Research, gkac1247 https://doi.org/10.1093/nar/gkac1247
Источник: ФГБНУ «Медико-генетический научный центр имени академика Н.П. Бочкова»