• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Применение экстрактивных методов для суммаризации русскоязычных текстов судебных решений

ФИО студента: Полячек Нина Алексеевна

Руководитель: Храбров Александр Игоревич

Кампус/факультет: Санкт-Петербургская школа физико-математических и компьютерных наук

Программа: Анализ больших данных в бизнесе, экономике и обществе (Магистратура)

Год защиты: 2021

В настоящее время существует проблема замкнутости юридической сферы в России, недоступности для простых граждан, нечитаемости и усложнения юридических текстов. У профессионалов обработка множества документов занимает значительную часть времени и затягивает процессы. Поэтому есть необходимость в упрощении и сокращении юридических текстов, в чем помогает автоматическая суммаризация. В данной работе рассматривается экстрактивный подход к суммаризации юридических текстов на примере текстов судебных решений. Так как российские судебные решения хоть и имеют схожую структуру, но состоят из громоздких предложений, часто растягивающихся на несколько абзацев, с обилием терминов и сложных конструкций, к ним неприменимы классические экстрактивные методы, работающие с предложениями. В рамках исследования изучены предыдущие работы по технологиям в юриспруденции и экстрактивным методам суммаризации, собраны тексты судебных решений, к ним написаны саммари и размечены в формате, необходимом для применения выбранных методов. В работе разработан новый способ автоматического составления экстрактивных саммари с помощью фрагментов текстов, а не предложений, подходящий для текстов российских судебных решений, проведено обсуждение полученных результатов, недостатков метода и путей улучшения и расширения исследования. Из выбранных для работы архитектур моделей глубокого обучения лучшие результаты показала рекуррентная нейронная сеть со слоями Bidirectional LSTM, LSTM и TimeDistributed Dense слоем.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ