• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Исследование закономерностей в эпигенетических данных

ФИО студента: Ибрагимова Диана Ренатовна

Руководитель: Попцова Мария Сергеевна

Кампус/факультет: Высшая школа бизнеса

Программа: Системы больших данных (Магистратура)

Год защиты: 2018

В настоящее время объемы данных резко возрастают, и людям приходится решать проблемы их обработки в разных сферах. Биоинформатика - одно из областей, где объемы информации огромны, и ученым необходимо внедрять новые методы обработки таких объемов данных. Один из международных консорциумов - проект Epigomomics Roadmap, в котором хранятся эксперименты секвенированных геномов из разных тканей. В настоящее время около 3000 экспериментов были доступны для исследовательского сообщества для трех основных классов тканей - взрослых, эмбриональных и стволовых клеток, которые потенциально могут стать клеткой любой ткани. Существует еще один слой геномной аннотации, требующий разъяснения. Это аннотация генома со вторичными структурами. Вместе с эпигенетическими слоями они составляют закономерности регуляции генома. Задачи настоящего исследования - найти закономерности в эпигенетических данных, связанных с вторичными структурами ДНК, чтобы выявить скрытые закономерности. Задача поиска шаблонов в неизвестных данных является общей задачей. В рамках представленной магистерской диссертации мы рассмотрим различные алгоритмы машинного обучения, как обучения с учителем и без, в приложениях для получения геномных больших данных. Данная работа представляет собой научную ценность, а также имеет практическое применение в области персонализированной медицины. Специфические для пациента мутации и образцы эпигеномных маркеров должны быть сопоставлены с существующими геномными аннотациями. Одной из важных задач является классификация новых геномных данных для существующих классов (задача контролируемого обучения) и определение группы пациентов по неизвестным данным (неконтролируемое обучение). Также в сфере персонализированной медицины разработанные программы исследования и анализа огромного количества геномных данных могут быть интегрированы как часть общей аналитической системы для классификации конкретного пациента по его характеристикам генома и составления индивидуальных предложений.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ