• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Методы и модели глубокого машинного обучения в популяционной геномике

ФИО студента: Хомутов Евгений Васильевич

Руководитель: Щур Владимир Львович

Кампус/факультет: Московский институт электроники и математики им. А.Н. Тихонова

Программа: Суперкомпьютерное моделирование в науке и инженерии (Магистратура)

Год защиты: 2021

Геномика - сравнительно молодая область исследований, возникшая на стыке математики, компьютерных наук и биологии. Популяционная геномика - один из основных разделов геномики, в котором по геномам представителей определенного вида живых организмов, оценивают историю развития популяций: предсказывают изменения размера, время разделения между популяциями, миграцию. В свою очередь эти исследования важны при изучении эволюционных механизмов, ассоциации фенотипов с генетическими вариантами и других задачах. Один из основных математических подходов, используемых в методах геномного анализа, - скрытые марковские модели. В частности, на ней основаны наиболее популярные методы для оценки демографической истории. При всех своих достоинствах такие методы обладают рядом ограничений, поскольку предполагают начилие единственной однородной популяции. В большинстве реальных популяционных сценариев это предположение нарушено из-за миграции, и использование существующих методов может приводить к существенным смещениям оценок. В то же время нейросетевые подходы, получившие широкое распростронение в науке и индустрии, могут справиться с поставленными задачами, так как являются универсальными аппроксиматорами. Так, рекуррентные нейронные сети вытеснили скрытую марковскую модель из таких традиционных задач, как распознавание речи и предсказание пользовательского ввода. В этой работе мы представляем метод предсказания распределения времени до общего предка в популяции, которое в случае единственной популяции определяет её демографию, при помощи глубокого обучения. Для обучения мы используем синтетические данные, полученные при помощи компьютерного моделирования. Наша модель построена на сверточных нейронных сетях, и предсказывает распределенние времен до общего предка по вариации одного диплоидного генома.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ