• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Распределенная классификация текстовых потоков: проблемы, ограничения и решения

ФИО студента: Шавкунов Михаил Валерьевич

Руководитель: Булычев Дмитрий Юрьевич

Кампус/факультет: Санкт-Петербургская школа физико-математических и компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Оценка: 8

Год защиты: 2019

Масштабируемая классификация текстового потока является актуальной задачей, однако сложной в реализации. Для ее решения можно воспользоваться системами пакетной обработки, которые являются масштабируемыми, и доказали свою эффективность в применении к машинному обучению, но в то же время, не обеспечивают низкой задержки, что является критичным в этой задаче. С другой стороны, передовые и наиболее популярные системы потоковой обработки способны обеспечить низкую задержку, однако у них нет поддержки того же уровня устойчивости к ошибкам и детерминированных вычислений. В этой работе будет показано, как распределенная модель обработки потока и механизмы отказоустойчивости и воспроизводимости могут повлиять на корректность классификации потока данных. Также предлагаю схему вычислений, которая способна быть устойчивой к подобного рода проблемам. Для оценивания производительности итогового решения представлены результаты серии экспериментов на потоке реальных новостей.

Текст работы (работа добавлена 27 мая 2019 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ