• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Алгоритм классификации на основе эмерджентных частых последовательностей и узорных структур

ФИО студента: Гиздатуллин Данил Кутдусович

Руководитель: Игнатов Дмитрий Игоревич

Кампус/факультет: Факультет компьютерных наук

Программа: Науки о данных (Магистратура)

Год защиты: 2016

Анализ демографических последовательноcтей - популярное и многообещающее направление в изучении демографии. Жизнь людей можно рассматривать как последовательность событий, происходящих в их жизни. Исследователям в области демографии интересен переход от анализа отдельных событий и их взаимосвязей к анализу полных последовательностей событий. Демографическое поведение может сильно разниться среди людей из разных поколений, с разным полом, уровнем образования, религиозными взглядами и т.д. Однако, скрытые сходства могут быть найдены и обобщены с помощью специально изобретенных техник. Использование методов майнинга данных открывает для демографов новые возможности для анализа результатов исследований. В данной работе было исследовано несколько подходов к анализу последовательных данных. Основной задачей был поиск интересных и интерпретируемых паттернов, которые могут характеризовать отдельные классы, то есть таких паттернов, которые были бы характерны для одного класса, но не для всех остальных. Объект этого исследования – это данные о демографические данные о жизни людей. Субъект исследования может быть определен, как приложение методов майнинга данных, с целью выявления паттернов. Для решения этих задач был разработан алгоритм для поиска эмерджентных префиксных частых последовательностей. Он был реализован на языке Python. Было проведено множество экспериментов для подбора оптимальных параметров для выявления паттернов. А также была исследована задача классификации людей по полу, по последовательностям событий происходящих в их жизни. В результате работы мы получили и проинтерпретировали паттерны, которые характерны для одного пола людей, но не характерны для другого. Также был разработан и реализован алгоритм, для классификации последовательностей по эмерджентным префиксным паттернам.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ