• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Упрощение предложения: Компьютерный и Экспериментальный подход

ФИО студента: Наумов Александр Сергеевич

Руководитель: Ляшевская Ольга Николаевна

Кампус/факультет: Факультет гуманитарных наук

Программа: Фундаментальная и компьютерная лингвистика (Бакалавриат)

Год защиты: 2018

В последние годы автоматический перевод становится все более популярным. Большинство людей пользуются данным инструментом ежедневно. В связи с этим, разработчики постоянно развиваются в этом направлении, чтобы улучшить действующие алгоритмы и качество предоставляемого продукта. В общих чертах, сам процесс автоматического перевода заключается в том, что на входе у нас есть предложение на одном языке, а на выходе уже на другом. Но если предложение является большим и сложным, то возникают некоторые сложности и неоднозначности при переводе. Таким образом, упрощение предложения в данном случае поможет нам переводить быстрее и более корректно. Используя данный подход, основной алгоритм будет отсекать различные слова, такие как синонимы, повторяющиеся прилагательные и т.д. Такой метод будет работать только с “важной” частью предложения. Упрощение предложения это очень важный и нужный процесс для машинного перевода. Особенно это необходимо при предобработке самого предложения. В данной дипломной работе будет реализован метод автоматического упрощения предложений для русского языка. Что касается ручного упрощения предложений, будет подобран небольшой датасет из десяти разнотипных предложений для проведения эксперимента, в ходе которого респонденты будут упрощать эти предложения вручную. Полученные результаты будут сравнены между собой для того, чтобы оценить качество работы примененного алгоритма. Автоматическое упрощение предложений будет реализовано на языке Python, используя различные наборы регулярных и нерегулярных правил. В результате, был получен очень неплохой результат. Экспериментальные предложения были упрощено очень качественно.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ