• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Индексы интересности замкнутых описаний в задачах анализа данных и обнаружения знаний Interestingness measures of closed patterns for data mining and knowledge discovery Кандидатская диссертация Ученая степень НИУ ВШЭ

Соискатель:Махалова Татьяна Павловна
Руководитель:Кузнецов Сергей Олегович (др. работы под рук-вом)
Члены комитета:Калягин Валерий Александрович (Национальный исследовательский университет "Высшая школа экономики", доктор физико-математических наук, председатель комитета), Виноградов Дмитрий Вячеславович (Федеральный исследовательский центр «Информатика и управление» Российской Академии Наук , доктор физико-математических наук, член комитета), Дюнч Иво (Brock University (Канада), Habilitation (DSc), член комитета), Кучеров Григорий Аронович (University Paris-Est Marne-la-Vallée (Франция), кандидат физико-математических наук, член комитета), Пальчунов Дмитрий Евгеньевич (Новосибирский национальный исследовательский государственный университет, доктор физико-математических наук, член комитета)
Диссертация принята к предварительному рассмотрению:12.03.2020
Диссертация принята к защите:24.03.2020 (протокол №4)
Дисс. совет:Совет по компьютерным наукам
Дата защиты:29.05.2020


В условиях роста и накопления массивов данных особенно актуальной является задача обобщения, т.е. поиска паттернов — повторяющихся фрагментов, несущих полезную информацию.  В качестве паттернов в работе исследуются замкнутые описания (формальные и интервальные узорные понятия). В диссертации рассматриваются две группы подходов к поиску паттернов: статические и динамические. В статических подходах оценка интересности паттернов осуществляется посредством применения индексов интересности, в динамических — на основе оценки информативности паттернов относительно всего набора данных и других паттернов. В работе предложена классификация существующих индексов (метрик) интересности, эмпирически выявлены группы схожих индексов, а также индексов, устойчивых к шуму. Предложена схема адаптации индексов интересности произвольных паттернов к оценке замкнутых. Предложен метод интеграции статических (на основе индексов) и динамических (на основе принципа минимальной длины описания) подходов к майнингу паттернов.  Разработан динамический подход к майнингу числовых паттернов, основанный на принципах сжатия.

Диссертация [*.pdf, 4.94 Mb] (дата размещения 19.03.2020)
Резюме [*.pdf, 2.23 Mb] (дата размещения 19.03.2020)
Summary [*.pdf, 1.71 Mb] (дата размещения 19.03.2020)

Публикации, в которых излагаются основные результаты диссертации



Отзывы:
Отзыв научного руководителя
Отзыв члена Комитета
Сведения о результатах защиты:Комитет по диссертации рекомендовал присудить ученую степень кандидата наук НИУ ВШЭ (протокол № 2 от 29.05.2020).
Ключевые слова: группы индексов, классификация метрик, майнинг паттернов, оценка интересности, поиск паттернов