• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Алгоритмы сэмплирования текстовых данных для ускорения обучения языковых моделей при помощи обучения по плану

ФИО студента: Мосин Владислав Дмитриевич

Руководитель: Кураленок Игорь Евгеньевич

Кампус/факультет: Санкт-Петербургская школа физико-математических и компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Год защиты: 2021

Современные методы обработки естественного языка основаны на глубоком обучении, а используемые нейронные сети имеют от нескольких миллионов до сотен миллиардов параметров, что приводит к тому, что время их тренировки и количество требуемых вычислительных ресурсов очень высоко. На данный момент существует несколько способов для решения данной проблемы, одним из которых явлется обучение по пла- ну. Обучение по плану состоит из двух основных частей: алгоритма сэмплирования данных и способа оценки их сложности. Целью данной работы является исследование сэмплирующих алгоритмов, а также их влияния на время, необходимое для обучения нейронных сетей. В процессе исследований было разработано несколько различных сэмплирующих алгоритмов с различными особенностями, а также проведено большое количество экспериментов на задачах классификации, машинного перевода и восста- новление маскированных частей. В результате экспериментов было установлено, что обучение по плану не даёт прироста скорости обучения, а на некоторых задачах да- же замедляет его. Также были проведены эксперименты с различной токенизацией текстов и было показано, что она не влияет на результаты. Ключевые слова: обработка естественного языка, обучение по плану, сэмплирова- ние.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ