• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Восстановление последовательности по ее подпоследовательностям с применением к задаче сборки геномов

ФИО студента: Лихоносова Алена Федоровна

Руководитель: Кабатянский Григорий Анатольевич

Кампус/факультет: Отделение прикладной математики и информатики

Программа: Бакалавриат

Год защиты: 2014

<p>ВКР посвящена решению различных вариантов задачи восстановления последовательности по ее подпоследовательностям.</p><p>Приведены некоторые существующие теоретические формулировки задачи восстановления и полученные ранее результаты.</p><p>Описаны некоторые известные эффективные алгоритмы для решения частных случаев задачи восстановления&nbsp; и известные приближенные алгоритмы, для некоторых задач, точное решение которых не найдено, но которые полезны для практических задач.</p><p>В работе реализован известный алгоритм Левенштейна для восстановления слов по подпоследовательностям, предполагающий некоторые ограничения на множество исходных фрагментов, и оценена его сложность. Делается вывод, что данный алгоритм вряд ли применим на практике, так как он корректно решает задачу однозначного восстановления только при соблюдении определенных ограничений, которые могут не выполнятся на практике. Отметим, что, однако, этот алгоритм является одним из самых эффективных алгоритмов решения этой задачи.</p><p>Рассмотрено одно из популярных практических применений данной задачи на примере сборки генома. Обсуждаются возникающие при этом сложности, так как исходные данные не удовлетворяют ограничениям, присущим наиболее известным алгоритмам решения задачи.</p><p>В ВКР предложен приближенный алгоритм решения задачи восстановления слова по всем его подсловам с возможными стираниями на месте которых ставится дополнительный символ. Оценена сложность алгоритма и предложена его программная реализация. Для анализа того, насколько эффективно он решает задачу восстановления, проведены многочисленные тесты программы на различных входных данных. Показано, что в среднем предложенный алгоритм правильно решает задачу (восстанавливает именно то слово, из которого были прочитаны фрагменты) для множества всех фрагментов длины больше чем n/2, где n &ndash; длина исходного слова. При этом количество стираний во фрагменте должно быть не больше двадцати процентов от числа символов в нем.</p>

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ