• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Диссертации, представленные на защиту и подготовленные в НИУ ВШЭ


Введите первые несколько букв фамилии

Введите первые несколько букв фамилии

Показаны работы: 1 — 8 из 8

Сортировка:   по дате защиты   по имени соискателя   по имени научного руководителя   

Рандомизированные алгоритмы на основе интервальных узорных структур для задач
классификации и регрессии в задачах кредитного риск-менеджмента
Кандидатская диссертация Ученая степень НИУ ВШЭ

Соискатель:Масютин Алексей Александрович
Руководитель:Кузнецов Сергей Олегович
Дата защиты:26.10.2018

В работе предложены алгоритмы прогноза вероятности дефолта и уровня потерь в случае дефолта, основанные на методах анализа формальных понятий. Предложенные алгоритмы, с одной стороны, превосходят по метрике качества используемые в банковской сфере стандартные модели, и, с другой стороны, сохраняют свойство интерпретируемости прогноза. Это достигается с помощью использования интервальных узорных структур. Разработан метод классификация «по запросу» (Query-Вased Classification), который представляет собой рандомизированную процедуру предсказания неизвестной метки класса для наборов данных с большим числом наблюдений на основе интервальных узорных структур. Также был разработан метод регрессии «по запросу» (Query-Based Regression), который адаптирует инструментарий интервальных узорных структур для задачи восстановления регрессии. Качество работы алгоритмов анализируется как на внутрибанковских данных, так и на открытых данных.

Дисс. совет:Совет по компьютерным наукам
Ключевые слова:анализ формальных понятий, вероятность дефолта, интервальные узорные структуры, кредитный скоринг, уровень потерь в случае дефолта
Диссертация [*.pdf, 3.66 Mb] (дата размещения 8.08.2018)
Резюме [*.pdf, 1017.92 Kb] (дата размещения 8.08.2018)
Summary [*.pdf, 870.98 Kb] (дата размещения 8.08.2018)

Методы замкнутых описаний в задаче классификации данных со сложной структурой Кандидатская диссертация Ученая степень в системе Минобрнауки России

Соискатель:Кашницкий Юрий Савельевич
Руководитель:Кузнецов Сергей Олегович
Оппоненты:Чувилин Кирилл Владимирович, Богатырев Михаил Юрьевич
Дата защиты:25.10.2018

Защита диссертации состоится в диссертационном совете Д 002.073.05 на базе Федерального исследовательского центра "Информатика и управление" Российской академии наук.  С материалам и диссертацией можно ознакомиться на сайте диссертационного совета.

Специальность:05.13.17 Теоретические основы информатики
Дисс. совет:
Ключевые слова:

Методы и алгоритмы обработки текстовых данных на основе графовых дискурсивных моделей Кандидатская диссертация

Соискатель:Ильвовский Дмитрий Алексеевич
Руководитель:Кузнецов Сергей Олегович
Оппоненты:Виноградов Дмитрий Вячеславович, Богатырев Михаил Юрьевич
Дата защиты:05.06.2017

Специальность:05.13.18 Математическое моделирование, численные методы и комплексы программ
Дисс. совет:
Ключевые слова:
Диссертация (дата размещения 5.04.2017)

Модели, алгоритмы и программные комплексы обработки текстовых данных на основе решеток замкнутых описаний Кандидатская диссертация

Соискатель:Ильвовский Дмитрий Алексеевич
Руководитель:Кузнецов Сергей Олегович
Оппоненты:Лукашевич Наталья Валентиновна, Аншаков Олег Михайлович
Дата защиты:26.10.2015

В диссертационной работе рассмотрены модели текстов на естественном языке, предназначенные для поиска, классификации и кластеризации текстовых данных. Разработана графовая модель текстов, использующая и обобщающая модель структурного синтактико-семантического представления текстового абзаца (чащу разбора). Модель использует синтаксические деревья разбора и дискурсивные связи для представления текстовых абзацев на английском языке. Предложенная модель реализована в задаче поиска ответов по сложным запросам. Разработан метод, позволяющий улучшить качество поиска и устранить недостатки существующих моделей. Также модель текстовых данных реализована в виде численного метода, использующего ядерные функции. Применение модели позволяет улучшить качество работы существующих моделей в задаче классификации текстов благодаря ранее не применявшемуся в задачах классификации абзацев использованию семантической информации. Разработано таксономическое представление коллекции текстовых данных в виде решетки замкнутых структурных синтактико-семантических описаний. Разработана на основе модели текстов и теории решеток замкнутых описаний оригинальная модель тождественных денотатов для формальных описаний. Предложенная модель применена в задаче построения связей типа «та же сущность» в моделях текстов и реализована в виде численного метода и алгоритма, использующих оригинальный индекс ранжирования замкнутых формальных описаний для нахождения денотатов. Создан единый программный комплекс для работы с текстовыми данными. Также в рамках работы модифицирован программный комплекс для обработки данных на основе решеток замкнутых описаний, представляющий собой универсальное средство поддержки полного цикла исследований и позволяющий повысить эффективность решения ряда задач в области анализа данных.

Объявление о защите (дата размещения 10.07.2015)
Защита состоится 26 октября 2015 г. в 14-00 по адресу: г. Москва, ул. Кирпичная, 33, ауд. 503 

Специальность:05.13.18 Математическое моделирование, численные методы и комплексы программ
Дисс. совет:Д 212.048.09 - Совет по техническим и физико-математическим наукам
Ключевые слова:решетки замкнутых описаний, структурное представление, текстовые данные
Диссертация [*.pdf, 2.29 Mb] (дата размещения 24.09.2014)
Автореферат [*.pdf, 543.34 Kb] (дата размещения 27.10.2014)

Моделирование процессов с состояниями сложной структуры на основе решёток замкнутых описаний Кандидатская диссертация

Соискатель:Бузмаков Алексей Владимирович
Руководитель:Кузнецов Сергей Олегович
Оппоненты:Виноградов Дмитрий Вячеславович, Вагин Вадим Николаевич
Дата защиты:26.10.2015

В диссертационной работе решается научная задача создания подходов к построению моделей процессов с состояниями сложной структуры. Вводится класс моделей таких процессов, основанный на прикладной теории решёток замкнутых описаний. Разрабатывается эффективный подход к построению таких моделей из предложенного класса, которые могут быть использованы при экспертном анализе рассматриваемого процесса с состояниями сложной структуры.В работе обобщается механизм проекций описаний, что позволяет существенно уменьшить время построения моделей и их размер без существенного уменьшения качества моделирования. Также в работе исследуются меры качества составных частей модели, а также вводятся эффективные способы оценки рассматриваемых мер качества. Использование мер качества позволяет далее уменьшить размер модели и сократить влияния шумов в данных, по которым строится модель.Предлагаемый подход был реализован в рамках программного комплекса и применялся для исследования процесса госпитализации пациентов. Подход позволил построить модель процесса госиптализации и объединить такую разнородную информацию, как расположения больниц, применяемые процедуры, количество повторений процедур и другое. Также на задаче госпитализации пациентов было показано, что альтернативные подходы к построению моделей такого рода требуют большего времени вычислений либо не могут быть использованы. Также необходимо отметить, что разработанные подходы являются универсальными и могут быть применены для моделирования других процессов с стояниями сложной структуры.

Специальность:05.13.18 Математическое моделирование, численные методы и комплексы программ
Дисс. совет:Д 212.048.09 - Совет по техническим и физико-математическим наукам
Ключевые слова:процессы, узорные структуры, устойчивость
Диссертация [*.pdf, 1.91 Mb] (дата размещения 29.09.2014)
Автореферат [*.pdf, 303.15 Kb] (дата размещения 17.10.2014)

Построение импликативных зависимостей для аналитического описания предметных областей и обнаружения ошибок в данных Кандидатская диссертация

Соискатель:Ревенко Артем Викторович
Руководитель:Кузнецов Сергей Олегович
Оппоненты:Чечкин Александр Витальевич, Аншаков Олег Михайлович
Дата защиты:30.10.2013

Научная новизна определяется следующими результатами: Разработанные автором диссертации методы автоматизации порождения импликативных теорий реализуют новые функциональные возможности. Решена задача нахождения алгебр на бесконечном носителе, заданных некоторым набором тождеств. Автором диссертации предложен новый метод нахождения ошибок в бинарных данных, основанный на АФП. Доказано, что этот метод обеспечивает решение задачи нахождения признаков (или классификации) за полиномиальное время.  Объект исследования: импликативные зависимости. Цель:разработка методов и средств автоматизации исследования импликативных зависимостей на основе методологии АФП.  

Специальность:05.13.17 Теоретические основы информатики
Дисс. совет:
Ключевые слова:анализ формальных понятий, импликативные зависимости
Автореферат [*.pdf, 602.05 Kb]

Модели, методы и комплексы программ построения зависимостей, основанные на решетках замкнутых множеств Кандидатская диссертация

Соискатель:Бабин Михаил Александрович
Руководитель:Кузнецов Сергей Олегович
Оппоненты:Виноградов Дмитрий Вячеславович, Аншаков Олег Михайлович
Дата защиты:29.10.2012

Научная новизна определяется следующими результатами: 1. Доказана трудноразрешимость задач, связанных с вычислением классического минимального базиса импликаций. 2. Предложена новая модель приближенного базиса импликаций формального контекста, алгоритм его вычисления и эффективная программнаяреализация. 3. Доказана трудноразрешимость вычисления минимальных гипотез встандартной постановке 4. Предложена и экспериментально проверена модель распределенногообучения гипотезам – импликативным зависимостям для задачи машинного обучения. 5. Предложен линейный по времени алгоритм поиска всех гипотез по распределенной обучающей выборке и его программная реализация. 6. Предложена и экспериментально проверена модель оценивания гипотези формальных понятий – вероятностный индекс устойчивости. 7. Теоретически и экспериментально исследована сложность вычисления вероятностного индекса устойчивости, предложен эффективный алгоритм и его программная реализация. 8. Решены давно сформулированные и остававшиеся открытыми задачи создания эффективных алгоритмов и оценки вычислительной сложности распознавания псевдосодержаний и существенных содержаний. 9. Показана полиномиальная эквивалентность задачи перечисления мини-мальных гипотез и задачи дуализации монотонной булевой функции нарешетке. 10. Разработан комплекс программ, реализующий предложенные алгоритмы, который был встроен в коллективно разрабатываемый в Отделении прикладной математики и информатики НИУ ВШЭ комплекс программ. Объект исследования: модели импликативных зависимостей в данных и их эффективная алгоритмическая реализация. Цель: разработка моделей импликативных зависимостей в данных, для которых существуют более быстрые алгоритмы, а также решение связанных с ними вычислительных задач и разработка комплекса программ, реализующего предложенные алгоритмы.

Специальность:05.13.18 Математическое моделирование, численные методы и комплексы программ
Дисс. совет:Д 212.048.09 - Совет по техническим и физико-математическим наукам
Ключевые слова:анализ формальных понятий, импликативные зависимости
Диссертация [*.pdf, 22.36 Mb]
Автореферат [*.pdf, 366.47 Kb]

Модели, алгоритмы и программные средства бикластеризации на основе замкнутых множеств Кандидатская диссертация

Соискатель:Игнатов Дмитрий Игоревич
Руководитель:Кузнецов Сергей Олегович
Оппоненты:Хорошевский Владимир Федорович, Аншаков Олег Михайлович
Дата защиты:25.11.2010

Научная новизна работы определяется полученными в ходе решения задач исследования новыми результатами.   1. Предложены оригинальная математическая модель и метод бикластеризации на основе объектных и признаковых замкнутых множеств, позволяющие сохранить объектно-признаковое описание бикластеров не “потеряв” (в смысле отношения вложения покомпонентного вложения) при этом формальные понятия, построенные по входным данным. Исследованы его полезные свойства, сформулированы и доказаны соответствующие утверждения. Приведена теоретическая оценка сложности алгоритма по времени выполнения и оценен размер выхода. 2. Впервые формально описана связь между бикластерами и ассоциативными правилами. Даны теоретические оценки мер плотности и разреженности бикластеров, получаемых на основе ассоциативных правил. Выявлена эквивалентность определений бикластера в некоторых методах бикластеризации из биоинформатики и АФП. 3. Предложена математическая модель сходства текстовых документов, сформулированная в терминах частых замкнутых множеств признаков и АФП. 4. Предложена математическая модель построения таксономий групп пользователей веб-сайтов на основе решеток формальных понятий. Указаны наилучшие способы отбора релевантных формальных понятий для построения таких таксономий. 5. Предложена математическая модель рекомендательной системы на основе использования морфологической структуры словосочетаний (признакового пространства). Предложена модель рекомендательной системы на основе бикластеризации и  метода ближайшего соседа, а также методика оценки качества результатов таких систем.   Объектом исследования являются модели бикластеризации на основе замкнутых множеств для решения различных задач анализа данных, в которых возможен переход к объектно-признаковому описанию данных.   Предметом исследования являются методы, эффективные алгоритмы и программные средства бикластеризации на основе замкнутых множеств для решения различных задач анализа объектно-признаковых данных.   Цели исследования. 1. Выявление взаимосвязи существующих моделей и методов бикластеризации, построение их классификации и таксономии. 2. Разработка оригинальных моделей, методов и алгоритмов бикластеризации на основе решеток замкнутых множеств. 3. Программная реализация эффективных алгоритмов поиска бикластеров для решения практических задач анализа данных.

Специальность:05.13.18 Математическое моделирование, численные методы и комплексы программ
Дисс. совет:Д 212.048.09 - Совет по техническим и физико-математическим наукам
Ключевые слова:бикластеризация, математическое моделирование, машинное обучение, разработка данных (Data Mining)
Автореферат [*.pdf, 349.37 Kb]