• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Предсказание петель в хроматине Dictyostelium discoideum

ФИО студента: Плискин Александр Маркович

Руководитель: Гельфанд Михаил Сергеевич

Кампус/факультет: Факультет компьютерных наук

Программа: Анализ данных в биологии и медицине (Магистратура)

Оценка: 9

Год защиты: 2020

Хроматин представляет собой динамическую структуру, состоящую из ДНК, РНК и ДНК-связывающих белков, которые осуществляют сворачивание ДНК внутри ядра клетки, а также процессы регуляции. Трехмерная организация хроматина играет важную роль в клеточных процессах. Для ее исследования эффективно используется метод Hi-C - полногеномной фиксации конформации хромосом, который позволяет получать карты пространственных взаимодействий ДНК. В данной работе представлен алгоритм UNBLoC (U-Net-Based Loop Caller) для поиска свойств ярких точек (или “петель”) хроматина в Hi-C картах человека, социальной амебы Dictiyostelium discodeum и дрожжей Saccharomyces cerevisiae. Используя ручную разметку петель для дрожжей и амебы и автоматическую для человека, была обучена модель UNBLoC, основанная на сверточной нейронной сети архитектуры U-Net. Эта сеть предсказывает области петель как маски значений двумерной матрицы, далее координаты петель уточняются при помощи поиска позиции центра маски, предсказанной сетью. Получены три модели для данных амебы, дрожжей и человека. Также разработана модель с первичным обучением на картах человека и дообучении на данных дрожжей или амебы (transfer learning). Произведено сравнение моделей на основе классических нейросетевых метрик. Однако, ввиду особенностей поставленной задачи, были разработаны дополнительные метрики, а именно количество сопоставленных/не сопоставленных координат петель, профиль меры конвергентности в координатах петель. Для оценки качества результатов построены классические графики для оценки качества найденных петель по Hi-C картам, а именно: средние петли по всем размеченным исходным данным, а также для результатов всех моделей на всех организмах; графики зависимости вероятности контактов от расстояния (графики шкалирования). Примечательно, что с помощью UNBLoC с transfer learning обнаружено не наблюдавшееся ранее для амеб свойство вложенности петель.

Текст работы (работа добавлена 22 мая 2020 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ