Российские биологи разработали новый алгоритм анализа пространственной организации генома
Междисциплинарная команда, объединившая исследователей биологического факультета МГУ, Сколтеха и НИЦ «Курчатовский институт», создала новый способ анализа пространственной организации генома. Исследование выполнено при поддержке Минобрнауки России в рамках проекта «Наука и университеты».
ДНК – молекула, которая в длину может быть равна росту взрослого человека. Чтобы ее можно было поместить в клетку, существуют различные способы ее «упаковки». Сначала она наматывается на нуклеосомы – структуры, состоящие из 8 специальных белков – гистонов. После в некоторых местах специфические белки связываются с ДНК, в результате формируя петли. Далее ДНК компактизуется еще сильнее, образуя хроматиды и хромосомы. Все эти структуры формируют пространственную организацию генома.
Изучение пространственной организации генома человека помогает лучше понимать, как именно регулируется работа генов. Для таких исследований используется метод Hi-C. Он позволяет получить картину контактов всех фрагментов генома друг с другом на всех структурных уровнях: от самого низкого (петель между регуляторными участками) до самого высокого (хромосомных территорий и целого ядра).
Хотя Hi-C считается довольно точным методом изучения трехмерного генома, он не лишен недостатков. Сейчас для проведения Hi-C существуют уже готовые наборы со всеми необходимыми реагентами и прописью процедур. Но иногда материала бывает значительно меньше, чем требуется по стандарту, или – наоборот – требуется изучить слишком «объемный» объект, как, например, ткани мозга. В таких случаях исследователи дорабатывают протоколы, но при этом возникает сложность при сравнении результатов с данными, полученными по стандартным протоколам.
Команда российских исследователей разработала новый метод нормализации данных Hi-C, который заметно снижает погрешности и их влияние на результаты – биоинформатический алгоритм HiConfidence. Особенность этого подхода заключается в том, что он учитывает силу и устойчивость взаимодействия внутри каждой отдельно взятой пары фрагментов генома. В результате данные, плохо воспроизводящиеся в повторах эксперимента, практически не влияют на финальные результаты, что позволяет значительно повысить качество получаемых карт пространственной организации генома и облегчить их интерпретацию.
Применение инструмента HiConfidence позволило заметно снизить уровень «шума» в исходных данных. В результате удалось проанализировать влияние изменений ацетилирования (присоединения ацетиленовых групп) гистонов на плотность укладки геномной ДНК на масштабе отдельных геномных областей и хромосом в целом.
«Анализ больших данных в геномике и сравнение результатов, полученных в разных лабораториях, часто осложнены погрешностями, вносимыми при проведении экспериментов. Наличие биоинформатического инструмента, нивелирующего эти погрешности – вне зависимости от их конкретной природы – значительно облегчит выполнение проектов, в которых необходимо перекрестное сравнение большого числа данных, полученных разными людьми в разное время», — подытожил один из авторов исследования, ведущий научный сотрудник кафедры молекулярной биологии биологического факультета МГУ Сергей Ульянов.
Источник: МГУ им. М.В. Ломоносова
Фото: Freepik