• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Разработка системы генерации труднопроизносимых текстов на русском языке с использованием синтаксически размеченного корпуса

ФИО студента: Пономарева Юлия Вячеславовна

Руководитель: Клышинский Эдуард Станиславович

Кампус/факультет: Московский институт электроники и математики им. А.Н. Тихонова

Программа: Компьютерные системы и сети (Магистратура)

Оценка: 9

Год защиты: 2019

В выпускной квалификационной магистерской диссертации на тему «Разработка системы генерации труднопроизносимых текстов на русском языке с использованием синтаксически размеченного корпуса» рассматривается анализ проблем генерации труднопроизносимых текстов в существующем мобильном приложении для тренировки человеком своей дикции и его усовершенствование. Актуальность данной темы обусловлена тем, что, в русском языке, много правил и исключений, порядок слов абсолютно не фиксирован. Поэтому до сих пор методы генерации русскоязычных текстов не дают идеальных результатов, что, в свою очередь, дает поле для дальнейших экспериментов. С другой стороны, рассматривая тот факт, что разрабатываемое приложение будет помогать при совершенствовании дикции, данная тема актуальна тем, что натренированная речь способствует быстрому и легкому пониманию собеседника. А это, в свою очередь, является достаточно полезным навыком в современном мире. Можно, конечно, обойтись скороговорками, чтобы натренировать дикцию, однако их тексты приедаются и есть вероятность, что язык заточится только на слова скороговорок. Объектом исследования работы является стохастический метод генерации труднопроизносимых текстов на естественном языке с использованием размеченных корпусов. Предметом исследования являются тексты на естественном языке. Основной целью выпускной квалификационной магистерской диссертации является разработка системы генерации труднопроизносимых текстов на русском языке с использованием синтаксически размеченного корпуса. Выпускная работа состоит из введения, четырех глав, заключения и библиографического списка. Работа изложена на 31 странице. В первой главе «Обзор имеющихся данных» определены статистические данные, алгоритм и средства реализации, используемые в прошлогодней междисциплинарной курсовой работе, а также краткое обоснование их выбора. Во второй главе «Исследование в предыдущих исследованиях данных» проанализированы ошибки, допущенные ранее при генерации текстов и представлены способы их устранения. В третьей главе «Корректировка реализации генерации текстов» представлен процесс исправления предыдущих ошибок и доработка системы генерации труднопроизносимых текстов на русском языке с использованием синтаксически размеченных корпусов. В последней четвертой главе «Оценка полученных результатов» представлена оценка полученного приложения по трем заранее определенным категориям. В каждой категории были заранее определены свои критерии оценки. В заключении сделаны основные выводы по выпускной квалификационной работе.

Текст работы (работа добавлена 25 мая 2019 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ