• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Определение авторства разработчиков на основании стиля написания кода

ФИО студента: Богомолов Егор Олегович

Руководитель: Булычев Дмитрий Юрьевич

Кампус/факультет: Санкт-Петербургская школа физико-математических и компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Оценка: 10

Год защиты: 2019

Определение авторства программного кода является актуальной задачей для решения вопросов интеллектуальной собственности, поиска плагиата, поиска авторов вредоносного программного обеспечения. Для разных языков программирования различные решения показывают лучшие результаты. Часть работ использует факторы, специфичные для конкретного языка, усложняя перенос результатов между ними. Также на данный момент не проводилось тестирование решений в условиях большого количества данных (тысячи примеров для каждого разработчика), которые могут возникать в практических задачах. Это вызвано отсутствием соответствующих наборов данных. В данной работе предлагается инструмент для сбора данных из проектов с произвольным числом авторов. Он работает с историей проекта, что позволяет получить большее количество данных по сравнению с имеющимися датасетами. С его помощью были собраны 7 датасетов из проекта IntelliJ IDEA, позволяющие тестировать модели для определения авторства в различных условиях. Также в работе представлены две модели для определения авторства, работающие в условиях разного количества доступных данных. Обе модели не используют свойств, специфичных для конкретного языка, что обеспечивает их переносимость на произвольный язык программирования. По сравнению с предыдущими работами в области, одна из предложенных моделей достигает лучших результатов для определения авторства по коду на Java и Python и повторяет результат для C++.

Текст работы (работа добавлена 26 мая 2019 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ