• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Возможности применения метода нейронных сетей для заполнения пропусков в социологических данных

ФИО студента: Горелова Ольга Юрьевна

Руководитель: Зангиева Ирина Казбековна

Кампус/факультет: Факультет социальных наук

Программа: Прикладные методы социального анализа рынков (Магистратура)

Год защиты: 2015

Пропуски в данных представляют собой серьезную проблему. Существует три основных метода работы с пропущенными значениями: удаление неполных наблюдений, взвешивание полных данных и восстановление пропущенных значений. Существует достаточно большое число методов заполнения пропусков, но зачастую для этой задачи тестируются более нестандартные методы, например, нейронные сети. Этот метод демонстрирует достаточно высокую точность импутирования пропущенных значений в данных технических наблюдений. Мы же в данной работе апробируем возможности использования этого метода социологами, которые работают с данными иной природы и структуры, и которые зачастую не знакомы с различными математическими тонкостями работы такого сложного метода как нейронные сети. На основании статического эксперимента, мы делаем вывод о том, что нейронные сети на самом деле могут использоваться для заполнения пропусков в социологических данных, особенно если исследователь имеет дело с большими объемами пропусков (30-60%). Многослойный перцептрон с обратным распространением ошибки – нейронная сеть наиболее популярной архитектуры, очень эффективно восстанавливает пропуски в интервальной переменной и позволяет выполнять на этих данных различные методы анализа. Для порядковой переменной многослойный перцептрон демонстрирует тесную связь между эталонными и заполненными значениями, однако результаты регрессионного анализа на данных, заполненных этим способом оказываются менее точными, чем те, что получаются при использовании EM-оценивания. Для номинальной шкалы наибольшей точностью импутирования обладает также многослойный перцептрон, но нейронная сеть обобщенной регрессии лучше сохраняет структуру данных и больше подходит, если на заполненном массиве планируется оценивать описательные статистики. Таким образом, нейронные сети являются эффективным методом импутирования, а их главный недостаток – сложность реализации и неоднозначность подбора параметров.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ