• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Сравнение неспециализированных подходов к решению задачи прогнозирования временных рядов

ФИО студента: Кузнецов Сергей Юрьевич

Руководитель: Игнатов Дмитрий Игоревич

Кампус/факультет: Факультет компьютерных наук

Программа: Финансовые технологии и анализ данных (Магистратура)

Год защиты: 2019

В данной работе предлагается сравнение специализированных методов построения прогнозов временных рядов: ARIMA, PROPHET, LSTM с более универсальными методами машинного обучения: случайный лес, экстремальный градиентный бустинг, ANN, скрытая Марковская модель, а также предлагается альтернативный метод прогнозирования, основанный на выявлении схожих подпоследовательностей. Качество прогнозных моделей дополнительно контролируется сравнением с «наивным прогнозом» (в качестве прогноза берётся последняя известная точка). Сравнение проводится на основе открытых данных по количеству преступлений, различных типов, совершенных в Чикаго с две тысячи первого года по две тысячи семнадцатый год. Прогнозы строятся независимо друг от друга по восемнадцати типам преступления, с применением подбора гиперпараметров для каждого отдельного вида преступления на период в один, три, шесть, девять, двенадцать, четырнадцать дней и их качество оценивается на основе метрик MAE и SMAPE. Впоследствии, методы прогнозирования ранжируется для каждого вида преступления периода и метрики и агрегируются по видам преступления. В результате получается финальное ранжирование методов прогнозирования для каждой метрики на каждом временном отрезке. Наиболее эффективным себя показал себя метод ANN он оказался лучшим почти по всем метрикам, однако он потребовал подбора гиперпараметров, трудноинтерпретируем и долго обучается. На втором месте ARIMA с небольшим отставанием в точности, зато он лишен описанных выше недостатков. Предложенный подход, основанный на поиске наиболее похожей подпоследовательности обошел большинство методов, однако показался себя хуже, чем ANN, ARIMA и LSTM. Prophet, HMM и экстремальный градиентный бустинг оказались хуже «наивного» подхода, что может быть связано со спецификой данных. Наилучшим методом «из коробки» показал себя случайный лес

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ