Ученый Университета «Сириус» дополнил отечественное хранилище геномной информации данными более 5 тысяч экспериментов
Теперь отечественная база GTRD (Gene Transcription Regulatory Database) является крупнейшим в мире хранилищем данных о регуляции транскрипции генов. Благодаря усилиям младшего научного сотрудника направления «Вычислительная биология» Научно-технологического университета «Сириус» Семена Колмыкова и его коллег база данных пополнилась информацией еще более 5 тысяч экспериментов. О работе исследователей рассказала пресс-служба Университета «Сириус».
Транскрипция – это процесс, с помощью которого клетка «считывает» информацию из ДНК и использует ее для создания молекул РНК, которые затем могут стать «инструкцией» для синтеза белков.
Создание отечественной базы данных GTRD стартовало еще в 2009 году. Собрать все данные в одном месте – непростая задача. В открытых источниках можно найти много информации, но эти данные разрознены, плохо описаны и по-разному обработаны. Ученые Университета «Сириус» вместе с экспертами ведущих научных центров страны описали и обработали уже несколько десятков тысяч экспериментов и постоянно пополняют и дорабатывают базу. Крупнейшее в мире хранилище информации о регуляции транскрипции GTRD включает данные для десяти модельных организмов, в частности человека и мыши. Суммарный объем данных, хранящихся в GTRD, превышает 500 Тб. Уже сегодня база данных широко востребована в биомедицинских исследованиях по всему миру.
Над своей частью проекта младший научный сотрудник направления «Вычислительная биология» Научно-технологического университета «Сириус» Семен Колмыков работал больше шести лет. Его задачей было собрать и проанализировать имеющиеся в открытом доступе эксперименты, исследующие специальные белки-регуляторы транскрипции – факторы транскрипции. Когда такой белок связывается с определенными участками ДНК, он «включает» или «выключает» определенные гены. Это влияет на то, как клетка работает и реагирует на внешние условия.
«Транскрипция генов в наших клетках активируется или подавляется в ответ на изменения внутренних и внешних условий. Но важно понимать, что регуляция транскрипции – это сложный процесс, который происходит на нескольких уровнях, – объясняет Семен Колмыков. – Факторы транскрипции – одни из ключевых компонентов этой регуляции. Важной особенностью является их способность узнавать определенные последовательности ДНК (мотивы) и связываться с ними. У каждого фактора последовательность будет своя. Можно представить, что факторы транскрипции – это ключи. Оказываясь в подходящей замочной скважине они способны запирать или освобождать экспрессию генов, «включая» или «выключая» их. Всего в организме человека около 1,5 тысячи таких белков-регуляторов. В нашей базе данных мы собрали информацию обо всех существующих в открытом доступе экспериментах, позволяющих массово находить на геноме координаты связывания факторов транскрипции с ДНК. Осталось всего несколько сотен белков-регуляторов, для которых подобных экспериментов никто в мире еще не проводил».
Ученые из Научно-технологического университета «Сириус» входят в состав международного консорциума, цель которого – поставить и проанализировать недостающие эксперименты для оставшихся неизученными факторов транскрипции, чтобы выявить их мотивы связывания на ДНК. Тем не менее база данных GTRD уже сегодня является уникальным источником информации. Семену Колмыкову удалось построить наиболее полную карту геномных районов связывания транскрипционных факторов человека. В геномах 10 видов организмов суммарно было найдено более 175 миллионов таких районов.
Этот громадный справочник будет полезен широкому кругу исследователей по всему миру для изучения процессов регуляции транскрипции интересующих их генов и поможет лучше понять механизмы протекания различных патологических процессов, что в дальнейшем поможет в диагностике и разработке лекарств.
На фото: Семен Колмыков. источник: пресс-служба Университета «Сириус»