• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

ПО для распознавания вторичных структур ДНК, связанных с эпигенетическими факторами, методами машинного обучения

ФИО студента: Маткаримов Отабек Ойбекович

Руководитель: Волкова Лилия Леонидовна

Кампус/факультет: Московский институт электроники и математики им. А.Н. Тихонова

Программа: Информатика и вычислительная техника (Бакалавриат)

Оценка: 10

Год защиты: 2018

Целью данной выпускной квалификационной работы является разработка исследовательского программного(ПО) обеспечения для распознавания паттернов, позволяющего выявить корреляцию между вторичными структурами ДНК и эпигенетическими факторами, методами машинного обучения для кластеризации “без учителя”. Разработанное ПО будет использоваться учеными биологами как инструмент в исследовании вторичных структур ДНК человек. В работе так же были проанализированы алгоритмы классификации и исследованы зависимости характеристик, обучающих данных с прогнозируемой способностью методов. Наилучший алгоритм классификации был выбран и встроен в ПО для решения задач классификации. В этой научно-исследовательской работе для анализа наборов данных и классификатора шаблонов использовались библиотеки Pandas, NumPy, LightGBM, Sklearn, Scikit-learn и Matplotlib. Возможности программы:  Нахождение областей корреляции между вторичными структурами ДНК и их эпигенетическими факторами.  Вывод результата в графической форме.  Возможность создания пользователем кластеризации.  Создание модели классификации.  Нахождение паттернов.  Создание файла отчета. На первом этапе работы была произведена подготовка данных для дальнейшего анализа. На втором этапе была написана кроссплатформенное приложение, с помощью которого были найдены закономерности, а также посчитана корреляция между ними. Высоко коррелирующие участки вошли в основу обучающей выборки, в которой посчитаны 84 параметра для каждого гена в участке. Алгоритмы классификации были построены на основе матрицы признаков из 84 посчитанный параметров. Также был написан пользовательский интерфейс для удобства работы с программой. Весь вычислительный код написан на Python, а пользовательский интерфейс был создан с помощью библиотеки Tkinter. Объём отчёта по выпускной квалификационной работе, не включая приложения, составляет – 59 страниц. Количество таблиц в работе – 13, иллюстраций – 43, использованных источников – 32.

Текст работы (работа добавлена 15 мая 2018 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ