• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
ФИО студента
Название работы
Руководитель
Факультет
Программа
Оценка
Год защиты
Филатов Глеб Андреевич
Learning String Kernels Utilizing Adaptive Variable Length Compression
Науки о данных
(Магистратура)
7
2017
Currently there exists many approaches to classifying protein strings in bioinformatics and one of these approaches is based on string-specific distance/similarity measures.

In this thesis a new convolutional kernel over strings is presented – the LZW-kernel, which is based on Lempel-Ziv-Welch compression algorithm. The motivation for a novel method is that there exists a tradeoff between computational complexity of the algorithm, which determines distance/similarity between strings and its further quality, as a measure applied to various machine learning algorithms.

Our goal is to reduce this gap – utilizing an algorithm less computationally intensive, than current leader (which is Smith-Waterman alignment score).

LZW-kernel was tested with two classification algorithms – SVM and k-NN with various number of neighbors. We managed to get better classification quality than any of quadratic time string comparison methods, but not surpassing the classification quality of a leader, which is cubic in time.
Текст работы (работа добавлена 30 мая 2017г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Расширенный поиск ВКР