• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Сравнительный анализ алгоритмов заполнения пропусков в социологических данных

Оппоненты:
Татарова Гульсина Галеевна; Чеботарев Павел Юрьевич
Специальность:
22.00.01 Теория, история и методология социологии
Дисс. совет:
Д 212.048.01 - Совет по социологическим наукам
Дата защиты:
5/18/2012
Работа, направлена на систематизацию методов заполнения пропусков в данных и выявление условий их эффективного использования в социологии.  Актуальность работы определяется тем, что на сегодняшний день разработано множество алгоритмов заполнения пропусков, но сведения о них не систематизированы и разбросаны по большому количеству работ. Крайне малочисленны и исследования, направленные на сравнительную оценку применимости отдельных алгоритмов заполнения пропусков в конкретных исследовательских ситуациях. 
В диссертации проанализирована связь между причинами возникновения  пропусков в социологических данных и типами пропусков по степени случайности. Даны рекомендации по выявлению ситуаций, в которых недопустимо искусственное заполнение пропусков. Дано систематическое описание большинства известных алгоритмов заполнения пропусков в социологических данных. Разработана и апробирована методика экспериментальной оценки эффективности заполнения пропусков с помощью  различных алгоритмов, в зависимости от доли пропусков в данных и метода последующего анализа данных (рассматривались методы анализа данных, чаще всего используемые в социологических исследованиях). Экспериментально установлено, что эффективность заполнения пропусков зависит в некоторых случаях (в частности, при построении регрессионных моделей с фиктивными переменными и расчете мер описательной статистики) не просто от метода анализа данных, но и от характера решаемой социологической задачи. Цель исследования — определить, в каких случаях допустимо искусственное заполнение пропусков в социологических данных, и экспериментально  сравнить эффективность отдельных  алгоритмов заполнения пропусков, в зависимости от   характеристик исследовательской ситуации: количества (доли) имеющихся пропусков и используемого метода анализа данных.  Объект исследования –  алгоритмы заполнения пропусков в данных. Предмет исследования – эффективность отдельных алгоритмов заполнения пропусков  при использовании различных  методов многомерного анализа  данных с учетом количества пропусков.
Автореферат [*.pdf, 333.69 Кб]