• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Предсказание функциональности вторичных структур ДНК методами глубинного обучения

ФИО студента: Теплякова Наталья Дмитриевна

Руководитель: Попцова Мария Сергеевна

Кампус/факультет: Факультет компьютерных наук

Программа: Анализ данных в биологии и медицине (Магистратура)

Год защиты: 2019

Квадруплекс – это вторичная структура молекулы ДНК, которая может формироваться из последовательностей, богатых гуанином. В человеческом геноме обнаружено более 700 тысяч сайтов, которые потенциально могут образовывать квадруплекс. Квадруплексы были обнаружены в промоторных областях многих генов и принимают участие в регуляции транскрипции. Однако в настоящее время не существует метода, который позволил бы предсказать формирование квадруплексов в различных видах тканей. В рамках выполнения магистерской диссертации обучена глубокая сверточная нейронная сеть, способная предсказывать наличие гистонных модификаций в различных типах тканей (медианный ROC AUC 0.83) по последовательности ДНК. Анализ фильтров первого сверточного слоя идентифицировал мотивы, часть из которых принадлежит известным сайтам связывания транскрипционных факторов. Был предложен метод определения функциональной значимости квадруплексов, основанный на анализе отклонения предсказания нейронной сети на последовательностях, содержащих мутацию. Работоспособность метода продемонстрирована на известном случае мутации в промоторной области c-MYC. Метод применен к данным о наличии квадруплексов в клетках миелоидной лейкемии K562, и было показано, что значимые отклонения на карте мутаций обнаружены именно для областей, содержащих квадруплексы. Данная работа демонстрирует эффективность применения методов глубинного обучения для распознавания паттернов вторичных структур и эпигенетического кода.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ