• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Предсказание устойчивой конформации пептидов по аминокислотной последовательности

ФИО студента: Иванов Григорий Иванович

Руководитель: Зобнин Алексей Игоревич

Кампус/факультет: Факультет компьютерных наук

Программа: Науки о данных (Магистратура)

Оценка: 10

Год защиты: 2018

Проблема изучения пространственной структуры белков является важной как с точки зрения практических применений, так и со стороны фундаментальных исследований. Одной из подзадач является определение наличия устойчивых пространственных состояний пентепептида по его аминокислотной последовательности. Однако, физические эксперименты, обычно, дорогие, а используемое вместо них молекулярно-динамическое моделирование затратно по времени (моделирование одного из исследуемых в работе белков занимает около четырех часов). Тем не менее, была собрана база результатов моделирований, которая содержит в себе более 50.000 записей об белках с имеющимися устойчивыми состояниями (3.2% от общего числа), без них (40%) и остальных (56.8%). Чтобы сократить время на поиски и моделирование вышеописанных молекул, в работе было предложено несколько алгоритмов генерации кода пентапептида с заранее заданными свойствами, которые основаны на предсказаниях обученных на накопленных данных логистичиской и бета- регрессий, где в последней для моделирования параметров Бета-распределения использовалась многослойная нейронная сеть. Модели настраивались стандартным образом: исходная выборка была поделена на две части, где на первой, используя кросс-валидацию для подбора гиперпараметров, были обучены модели, а на второй протестированы. Алгоритм генерации брал предсказания, и выбирал только те, которые были получены с высокой степенью уверенности (для каждой модели эта величина определялась по-разному). Построенный алгоритм позволил сгенерировать пентапептиды, которых не было в имеющихся данных, причем результаты их моделирования показали, что при генерации молекул с устойчивыми конформациями действительно устойчивых оказывается около трети; а при генерации белков без устойчивых состояний таковых оказывается примерно 40%, что существенно превосходит метод случайной генерации (10 и 15 процентов соответственно).

Текст работы (работа добавлена 28 мая 2018 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ