• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Распознавание 3'-концов SINE по всему дереву жизни

ФИО студента: Черницов Александр Валерьевич

Руководитель: Попцова Мария Сергеевна

Кампус/факультет: Факультет компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Оценка: 9

Год защиты: 2019

По последним данным ретротранспозоны (SINE, LINE) были обнаружены у всех эукариот и занимают значительную часть большинства геномов (42% генома человека, 37% – мыши и 78% – кукурузы). Отличительной особенностью SINE является отсутствие регионов, кодирующих белки, отвечающих за ретротранспозицию. Предполагается, что SINE сохраняет способность распространяться по геному благодаря сходству шпильки на 3’-конце с такой же шпилькой LINE. Основываясь на этом, мы предположили, что шпилька является значимой структурой, которая должна обладать схожими свойствами у разных классов SINE у разных организмов по всему дереву жизни. Целью данного исследования является построение моделей машинного обучения для распознавания шпилек на 3’-концах различных классов SINE (произошедших от tРНК, rРНК, snРНК, 7SL), а также выявление признаков, объединяющих классы SINE по происхождению. В качестве данных использовались 822 шаблонных последовательности транспозонов от различных организмов по всему дереву жизни, доступных в базе данных RepBase. В ходе работы были обучены модели для распознавания реальных и искусственно сгенерированных данных, а также построены модели для разделения реальных данных на классы по происхождению. В качестве признаков модели учитывались нуклеотидный состав и физико-химические свойства динуклеотидов, входящих в состав шпильки. В результате были обучены модели, отличающие классы с точностью ~74%. Анализ значимости признаков показал, что важнейшими из них являются минимальная свободная энергия вторичной структуры РНК, а также параметры shift и slide динуклеотида, граничащего с петлей. Полученные результаты свидетельствуют в пользу того, что шпилька действительно является значимой структурой ретротранспозонов SINE, обладающая общими свойствами для разных классов SINE и разных видов по всему дереву жизни.

Текст работы (работа добавлена 19 мая 2019 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ