Нейронные сети для обработки исходного кода программNeural networks for source code processing
Соискатель:
Чиркова Надежда Александровна
Руководитель:
Члены комитета:
Николенко Сергей Игоревич (Санкт-Петербургское отделение Математического института им. В. А. Стеклова РАН, кандидат физико-математических наук, председатель комитета), Богданов Дмитрий Борисович (компания ServiceNow (Канада), PhD, член комитета), Брыксин Тимофей Александрович (компания JetBrains Research, кандидат технических наук, член комитета), Панченко Александр Иванович (Сколковский институт науки и технологий, PhD, член комитета), Устюжанин Андрей Евгеньевич (Национальный исследовательский университет «Высшая школа экономики», кандидат физико-математических наук, член комитета)
Диссертация принята к предварительному рассмотрению:
5/26/2022
Диссертация принята к защите:
7/8/2022 (Протокол №11)
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
10/6/2022
В последние годы нейронные сети достигли высокого качества в задачах обработки сложно структурированных данных: изображений, текстов, звука и видео. Успех нейронных сетей в этих задачах, в числе прочего, обосновывается возможностью выбора архитектуры нейросети, учитывающей особенности конкретного вида данных. В данной работе исследуются возможности адаптации рекуррентных нейронных сетей и архитектуры "Трансформер" для обработки исходного кода программ, обладающего такими свойствами, как четкая синтаксическая структура, наличие понятия переменных и большие словари идентификаторов. В частности, разработан механизм динамических векторных представлений для обработки переменных в рекуррентных нейронных сетях, проведено эмпирическое исследование методов учета синтаксической структуры кода в архитектуре "Трансформер" и предложена простая в реализации техника предобработки кода для обработки редких идентификаторов. Разработанные методы и проведенные эмпирические исследования позволяет повысить качество решения ряда прикладных задач обработки исходного кода: поиск и исправление неправильно использованной переменной в коде, именование функций и автодополнение кода.
Диссертация [*.pdf, 8.21 Мб] (дата размещения 5/27/2022)
Резюме [*.pdf, 7.21 Мб] (дата размещения 5/27/2022)
Summary [*.pdf, 7.05 Мб] (дата размещения 5/27/2022)
Публикации, в которых излагаются основные результаты диссертации
Отзывы
Отзыв научного руководителя
- Отзыв научного руководителя (дата размещения 5/26/2022)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата наук с отличием (протокол №3 от 06.10.2022). Решением диссертационного совета (протокол № 18 от 12.10.2022) присуждена ученая степень кандидата компьютерных наук с отличием.
Ключевые слова:
См. на ту же тему
Новые представления для изображений и 3D сценКандидатская диссертация
Соискатель: Хахулин Тарас Андреевич
Руководитель: Лемпицкий Виктор Сергеевич
Глубокие порождающие модели для поиска аномалийКандидатская диссертация
Соискатель: Рыжиков Артём Сергеевич
Руководитель: Деркач Денис Александрович
Исследование универсальности моделей статистической механики методами машинного обученияКандидатская диссертация
Соискатель: Чертенков Владислав Игоревич
Руководитель: Щур Лев Николаевич