• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Использование текстуального анализа для предсказания цен на недвижимость

ФИО студента: Гончаров Глеб Игоревич

Руководитель: Натхов Тимур Владимирович

Кампус/факультет: Московский институт электроники и математики им. А.Н. Тихонова

Программа: Прикладная математика (Бакалавриат)

Год защиты: 2020

В данной работе исследуются способы включения текстуальных данных в гедонистическую модель ценообразования на рынке жилой вторичной недвижимости г. Москвы. Для исследования, с помощью программы-парсера, написанной на языке Python, с сайта cian.ru был собран массив данных – все активные объявления о продаже квартир в июле 2019 года. Исходный размер массива данных составляет около 60 тысяч записей. Записи содержат не только числовые характеристики, но и описание недвижимости, составленное продавцами. На основании этих данных в данной работе сравниваются 6 различных гедонистических моделей ценообразования, 3 из которых содержат текстовую информацию. Рассматриваются два способа включения текстовых данных в модель: основанные на bag of words и на word2vec. В работе показывается, что с помощью данных подходов можно значительно расширить признаковое множество моделей, что позволяет сократить среднеквадратичную ошибку на отложенной выборке. А также в работе сделана попытка визуализации и интерпретация полученных моделей на основе текстов.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ