• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Диссертации, представленные на защиту и подготовленные в НИУ ВШЭ

Сортировка:по дате защитыпо имени научного руководителяпо имени соискателя

Показаны работы: 1 - 10 из 11

Онтологический доступ к данным с использованием дизъюнктивных аксиомКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Герасимова Ольга Александровна
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
10/24/2023
Nowadays, ontologies are widely used to improve the convenience of information organisation and access to it in fields such as artificial intelligence, software engineering, biomedical informatics, healthcare, enterprise bookmarking, industrial projects, etc. We focus on Ontology-Based Data Access (OBDA) with expressive ontologies, where an ontology is used as a helpful tool for supporting query answering for distributed and heterogeneous data sources. Answering various types of queries mediated by a description logic ontology has been known as an essential reasoning problem in knowledge representation since the early 1990s. We explore the practical potential of specific expressive ontology with a covering axiom in ontology-mediated query (OMQ) answering tasks and focus on challenges associated with chosen ontology type. This study allows us to provide theoretical boundaries of covering axiom usage for OBDA and constructive rewriting of OMQs answering into datalog programs. Additionally, we compare two different approaches to identify the profitability of logic reasoning via OMQ rewriting and graph neural network data labelling followed by querying obtained full-labelled graph.
Диссертация [*.pdf, 5.44 Мб] (дата размещения 8/24/2023)
Резюме [*.pdf, 2.51 Мб] (дата размещения 8/24/2023)
Summary [*.pdf, 2.37 Мб] (дата размещения 8/24/2023)

Выявление релевантных дискурсивных признаков для решения задач анализа текстовых данныхКандидатская диссертацияУченая степень НИУ ВШЭ

Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
9/26/2022
В настоящее время область обработки естественного языка напрямую связана с большими предобученными языковыми моделями, работающими на базе архитектуры Трансформер, которые превзошли все существующие до этого методы решения задач обработки естественного языка. Однако, подобные результаты связаны, в первую очередь, с хорошей обобщающей способностью этих моделей, обученных на больших корпусах текстов на естественном языке, а не с их пониманием лингвистической информации. Исследования показывают, что обеспечение моделей дополнительными знаниями о языке, которыми обладают лингвисты, может улучшить качество решения ряда сложных задач обработки естественного языка, например, позволит более точно находить ответы на вопросы в тексте, генерировать более разнообразный и логически-связанный текст. В данной работе исследуется возможность добавления информации о дискурсивной структуре текста в предобученную языковую модель BERT за счет обучения модели на новой модифицированной задаче маскированного языкового моделирования, а также за счет добавления в модель дискурсивно-обусловленного механизма внимания. Также в диссертации предлагается новый подход для интерпретации результатов работы языковых моделей посредством анализа дискурсивной структуры текста. Проведенные экспериментальные исследования показали, что дискурсивно-обогащенные модели превосходят стандартные модели при решении задач оценки аргументированности текстов, понимания прочитанного текста, а также извлечения текстовых обоснований для объяснения результатов работы моделей.
Диссертация [*.pdf, 3.21 Мб] (дата размещения 7/11/2022)
Резюме [*.pdf, 955.94 Кб] (дата размещения 7/11/2022)
Summary [*.pdf, 965.46 Кб] (дата размещения 7/11/2022)

Индексы интересности замкнутых описаний в задачах анализа данных и обнаружения знанийКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Махалова Татьяна Павловна
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
5/29/2020
В условиях роста и накопления массивов данных особенно актуальной является задача обобщения, т.е. поиска паттернов — повторяющихся фрагментов, несущих полезную информацию.  В качестве паттернов в работе исследуются замкнутые описания (формальные и интервальные узорные понятия). В диссертации рассматриваются две группы подходов к поиску паттернов: статические и динамические. В статических подходах оценка интересности паттернов осуществляется посредством применения индексов интересности, в динамических — на основе оценки информативности паттернов относительно всего набора данных и других паттернов. В работе предложена классификация существующих индексов (метрик) интересности, эмпирически выявлены группы схожих индексов, а также индексов, устойчивых к шуму. Предложена схема адаптации индексов интересности произвольных паттернов к оценке замкнутых. Предложен метод интеграции статических (на основе индексов) и динамических (на основе принципа минимальной длины описания) подходов к майнингу паттернов.  Разработан динамический подход к майнингу числовых паттернов, основанный на принципах сжатия.
Диссертация [*.pdf, 4.94 Мб] (дата размещения 3/19/2020)
Резюме [*.pdf, 2.23 Мб] (дата размещения 3/19/2020)
Summary [*.pdf, 1.71 Мб] (дата размещения 3/19/2020)

Рандомизированные алгоритмы на основе интервальных узорных структур для задачклассификации и регрессии в задачах кредитного риск-менеджментаКандидатская диссертацияУченая степень НИУ ВШЭ

Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
10/26/2018
В работе предложены алгоритмы прогноза вероятности дефолта и уровня потерь в случае дефолта, основанные на методах анализа формальных понятий. Предложенные алгоритмы, с одной стороны, превосходят по метрике качества используемые в банковской сфере стандартные модели, и, с другой стороны, сохраняют свойство интерпретируемости прогноза. Это достигается с помощью использования интервальных узорных структур. Разработан метод классификация «по запросу» (Query-Вased Classification), который представляет собой рандомизированную процедуру предсказания неизвестной метки класса для наборов данных с большим числом наблюдений на основе интервальных узорных структур. Также был разработан метод регрессии «по запросу» (Query-Based Regression), который адаптирует инструментарий интервальных узорных структур для задачи восстановления регрессии. Качество работы алгоритмов анализируется как на внутрибанковских данных, так и на открытых данных.
Диссертация [*.pdf, 3.66 Мб] (дата размещения 8/8/2018)
Резюме [*.pdf, 1017.92 Кб] (дата размещения 8/8/2018)
Summary [*.pdf, 870.98 Кб] (дата размещения 8/8/2018)

Методы замкнутых описаний в задаче классификации данных со сложной структуройКандидатская диссертацияУченая степень в системе Минобрнауки России

Соискатель:
Кашницкий Юрий Савельевич
Оппоненты:
Богатырев Михаил Юрьевич, Чувилин Кирилл Владимирович
Специальность:
05.13.17 Теоретические основы информатики
Дата защиты:
10/25/2018
Защита диссертации состоится в диссертационном совете Д 002.073.05 на базе Федерального исследовательского центра "Информатика и управление" Российской академии наук.  С материалам и диссертацией можно ознакомиться на сайте диссертационного совета.

Методы и алгоритмы обработки текстовых данных на основе графовых дискурсивных моделейКандидатская диссертация

Оппоненты:
Богатырев Михаил Юрьевич, Виноградов Дмитрий Вячеславович
Дата защиты:
6/5/2017
Диссертация (дата размещения 4/5/2017)

Модели, алгоритмы и программные комплексы обработки текстовых данных на основе решеток замкнутых описанийКандидатская диссертация

Оппоненты:
Лукашевич Наталья Валентиновна, Аншаков Олег Михайлович
Дисс. совет:
Д 212.048.09 - Совет по техническим и физико-математическим наукам
Дата защиты:
10/26/2015
В диссертационной работе рассмотрены модели текстов на естественном языке, предназначенные для поиска, классификации и кластеризации текстовых данных. Разработана графовая модель текстов, использующая и обобщающая модель структурного синтактико-семантического представления текстового абзаца (чащу разбора). Модель использует синтаксические деревья разбора и дискурсивные связи для представления текстовых абзацев на английском языке. Предложенная модель реализована в задаче поиска ответов по сложным запросам. Разработан метод, позволяющий улучшить качество поиска и устранить недостатки существующих моделей. Также модель текстовых данных реализована в виде численного метода, использующего ядерные функции. Применение модели позволяет улучшить качество работы существующих моделей в задаче классификации текстов благодаря ранее не применявшемуся в задачах классификации абзацев использованию семантической информации. Разработано таксономическое представление коллекции текстовых данных в виде решетки замкнутых структурных синтактико-семантических описаний. Разработана на основе модели текстов и теории решеток замкнутых описаний оригинальная модель тождественных денотатов для формальных описаний. Предложенная модель применена в задаче построения связей типа «та же сущность» в моделях текстов и реализована в виде численного метода и алгоритма, использующих оригинальный индекс ранжирования замкнутых формальных описаний для нахождения денотатов. Создан единый программный комплекс для работы с текстовыми данными. Также в рамках работы модифицирован программный комплекс для обработки данных на основе решеток замкнутых описаний, представляющий собой универсальное средство поддержки полного цикла исследований и позволяющий повысить эффективность решения ряда задач в области анализа данных.

Объявление о защите (дата размещения 10.07.2015)
Защита состоится 26 октября 2015 г. в 14-00 по адресу: г. Москва, ул. Кирпичная, 33, ауд. 503 

Диссертация [*.pdf, 2.29 Мб] (дата размещения 9/24/2014)
Автореферат [*.pdf, 543.34 Кб] (дата размещения 10/27/2014)

Моделирование процессов с состояниями сложной структуры на основе решёток замкнутых описанийКандидатская диссертация

Оппоненты:
Вагин Вадим Николаевич, Виноградов Дмитрий Вячеславович
Дисс. совет:
Д 212.048.09 - Совет по техническим и физико-математическим наукам
Дата защиты:
10/26/2015
В диссертационной работе решается научная задача создания подходов к построению моделей процессов с состояниями сложной структуры. Вводится класс моделей таких процессов, основанный на прикладной теории решёток замкнутых описаний. Разрабатывается эффективный подход к построению таких моделей из предложенного класса, которые могут быть использованы при экспертном анализе рассматриваемого процесса с состояниями сложной структуры.В работе обобщается механизм проекций описаний, что позволяет существенно уменьшить время построения моделей и их размер без существенного уменьшения качества моделирования. Также в работе исследуются меры качества составных частей модели, а также вводятся эффективные способы оценки рассматриваемых мер качества. Использование мер качества позволяет далее уменьшить размер модели и сократить влияния шумов в данных, по которым строится модель.Предлагаемый подход был реализован в рамках программного комплекса и применялся для исследования процесса госпитализации пациентов. Подход позволил построить модель процесса госиптализации и объединить такую разнородную информацию, как расположения больниц, применяемые процедуры, количество повторений процедур и другое. Также на задаче госпитализации пациентов было показано, что альтернативные подходы к построению моделей такого рода требуют большего времени вычислений либо не могут быть использованы. Также необходимо отметить, что разработанные подходы являются универсальными и могут быть применены для моделирования других процессов с стояниями сложной структуры.
Диссертация [*.pdf, 1.91 Мб] (дата размещения 9/29/2014)
Автореферат [*.pdf, 303.15 Кб] (дата размещения 10/17/2014)

Построение импликативных зависимостей для аналитического описания предметных областей и обнаружения ошибок в данныхКандидатская диссертация

Соискатель:
Ревенко Артем Викторович
Оппоненты:
Аншаков Олег Михайлович, Чечкин Александр Витальевич
Дата защиты:
10/30/2013
Научная новизна определяется следующими результатами: Разработанные автором диссертации методы автоматизации порождения импликативных теорий реализуют новые функциональные возможности. Решена задача нахождения алгебр на бесконечном носителе, заданных некоторым набором тождеств. Автором диссертации предложен новый метод нахождения ошибок в бинарных данных, основанный на АФП. Доказано, что этот метод обеспечивает решение задачи нахождения признаков (или классификации) за полиномиальное время.  Объект исследования: импликативные зависимости. Цель:разработка методов и средств автоматизации исследования импликативных зависимостей на основе методологии АФП.  
Автореферат [*.pdf, 602.05 Кб]

Модели, методы и комплексы программ построения зависимостей, основанные на решетках замкнутых множествКандидатская диссертация

Соискатель:
Бабин Михаил Александрович
Оппоненты:
Аншаков Олег Михайлович, Виноградов Дмитрий Вячеславович
Дисс. совет:
Д 212.048.09 - Совет по техническим и физико-математическим наукам
Дата защиты:
10/29/2012
Научная новизна определяется следующими результатами: 1. Доказана трудноразрешимость задач, связанных с вычислением классического минимального базиса импликаций. 2. Предложена новая модель приближенного базиса импликаций формального контекста, алгоритм его вычисления и эффективная программнаяреализация. 3. Доказана трудноразрешимость вычисления минимальных гипотез встандартной постановке 4. Предложена и экспериментально проверена модель распределенногообучения гипотезам – импликативным зависимостям для задачи машинного обучения. 5. Предложен линейный по времени алгоритм поиска всех гипотез по распределенной обучающей выборке и его программная реализация. 6. Предложена и экспериментально проверена модель оценивания гипотези формальных понятий – вероятностный индекс устойчивости. 7. Теоретически и экспериментально исследована сложность вычисления вероятностного индекса устойчивости, предложен эффективный алгоритм и его программная реализация. 8. Решены давно сформулированные и остававшиеся открытыми задачи создания эффективных алгоритмов и оценки вычислительной сложности распознавания псевдосодержаний и существенных содержаний. 9. Показана полиномиальная эквивалентность задачи перечисления мини-мальных гипотез и задачи дуализации монотонной булевой функции нарешетке. 10. Разработан комплекс программ, реализующий предложенные алгоритмы, который был встроен в коллективно разрабатываемый в Отделении прикладной математики и информатики НИУ ВШЭ комплекс программ. Объект исследования: модели импликативных зависимостей в данных и их эффективная алгоритмическая реализация. Цель: разработка моделей импликативных зависимостей в данных, для которых существуют более быстрые алгоритмы, а также решение связанных с ними вычислительных задач и разработка комплекса программ, реализующего предложенные алгоритмы.
Диссертация [*.pdf, 22.36 Мб]
Автореферат [*.pdf, 366.47 Кб]