• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Активное обучение для определения тональности текста

ФИО студента: Чудакова Елена Владимировна

Руководитель: Артемова Екатерина Леонидовна

Кампус/факультет: Факультет компьютерных наук

Программа: Науки о данных (Магистратура)

Год защиты: 2018

Анализ тональности – часто встречающаяся в индустрии задача. Частным случаем является классификация документов одинаковых тональностей. Такие задачи постоянно встречаются в рекомендательных системах, в маркетинговых отделах и в отделах отслеживания качества продуктов. С помощью методов глубокого обучения можно получить хорошее качество классификации, но основной проблемой данного подхода является требование на большое количество обучающих объектов для получения хорошего качества модели. В связи с популярностью нейросетей актуальной проблемой является поиск алгоритма, позволяющего выбирать объекты не случайным образом, а используя определённые критерии, которые могут подсказать, какой объект окажется более или менее информативным для построения модели. Данная задача решается в рамках активного обучения, в котором для обучения используется сначала небольшое количество объектов, далее из неразмеченного пула данных мы выбираем не все подряд, а те, которые максимизируют некую функцию информативности. Далее, мы предоставляем их условному разметчику для проставления метки и добавляем в обучающую выборку. Процесс повторяется несколько раз. Это позволяет существенно сократить ресурсы, которые тратятся на ручную разметку. В данной работе используется несколько подходов для определения минимального количества объектов, обучение на которых позволит получить качество модели, сравнимое с бейзлайном. Методы применяются к задаче классификации отзывов пользователей банков. В качестве исходного классификатора рассматриваются свёрточные и рекуррентные нейронные сети. Применение методов активного обучения позволяют существенно сократить объём обучающей выборки.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ