• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Борьба с явлением мультиколлинеарности в моделях бинарной логистической регрессии

ФИО студента: Яксин Олег Анатольевич

Руководитель: Горяинова Елена Рудольфовна

Кампус/факультет: Отделение прикладной математики и информатики

Программа: Бакалавриат

Год защиты: 2014

<p><span style="font-size: 9pt; font-family: Arial, sans-serif;">Модель бинарной логистической регрессии - это статистическая модель, используемая для предсказания вероятности возникновения некоторого события на основе имеющихся данных, другими словами, это модель, которая служит для классификации объектов.&nbsp;Она применяется во многих актуальных в наши дни сферах, например, в медицине, кредитном скоринге, социологических исследованиях.<u1:p></u1:p> Улучшение предсказательной способности модели логистической регрессии является очень важным вопросом в данных сферах.<o:p></o:p></span></p><p><span style="font-size: 9pt; font-family: Arial, sans-serif;">Мультиколлинеарность &ndash; это ситуация, в которой ковариаты регрессии имеют линейные или нелинейные связи между собой. Данный факт может привести к плохой обусловленности матрицы плана, что может повлечь неустойчивость оценок параметров регрессии, большие дисперсии этих оценок и знаки, противоречащие теории.<o:p></o:p></span></p><p><span style="font-size: 9pt; font-family: Arial, sans-serif;">В данной дипломной работе для борьбы с мультиколлинеарностью используется метод главных компонент. Его идея заключается в нахождении линейных комбинаций регрессоров, &nbsp;именуемых главными компонентами, которые не коррелируют между собой. Для вычисления главных компонент необходимо определить матрицу ковариаций (корреляций) регрессоров. &nbsp;В основе исследования лежит новый подход к формированию корреляционной матрицы регрессоров, основанный на использовании коэффициентов Крамера и ассоциации в качестве мер связи между регрессорами. Данный подход объясняется тем, что ковариаты могут быть распределены в номинальной шкале, для которых не определен коэффициент корреляции, или иметь сильные линейные или нелинейный зависимости между собой, которые плохо идентифицируются коэффициентом корреляции.<o:p></o:p></span></p><p><span style="font-size: 9pt; font-family: Arial, sans-serif;">На моделированных и реальных данных показывается эффективность использования предложенного подхода в модели бинарной логистической регрессии в условиях мультколлинеарности, а именно улучшение качества классификации объектов по сравнению с моделями, не использующими данный подход.<o:p></o:p></span></p>

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ