• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Диссертации, представленные на защиту и подготовленные в НИУ ВШЭ

Сортировка:по дате защитыпо имени научного руководителяпо имени соискателя

Показаны работы: 1 - 4 из 4

Кластеризация в обогащенных признаками сетях с использованием подхода восстановления данныхКандидатская диссертацияУченая степень НИУ ВШЭ

Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
9/14/2021
В диссертации рассмотрена актуальная проблема выявления сообществ в графах, вершины которых охарактеризованы какими-то признаками, количественными или качественными. Автор формулирует проблему как задачу аппроксимации данных искомым разбиением с использованием критерия наименьших квадратов. Им сформулировано два подхода к (локальной) оптимизации критерия – последовательный и параллельный, а также введены две модификации: (а) конвертация признаковых данных в матрицу связей между объектами и (б) два способа использования связей, возникающие при глобальной их суммируемости, а также при отсутствии таковой. Эти модификации приводят к формированию нескольких методов выявления сообществ, для которых проведено широкое экспериментальное исследование, как на реальных, так и сгенерированных данных, показавшее и их валидность, и их эффективность в сравнении с методами, разработанными ведущими исследователями проблемы.
Диссертация [*.pdf, 3.76 Мб] (дата размещения 6/29/2021)
Резюме [*.pdf, 1.10 Мб] (дата размещения 6/29/2021)
Summary [*.pdf, 913.10 Кб] (дата размещения 6/29/2021)

Агрегированное представление текстов для задач поиска в коллекциях текстовых документовКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Фролов Дмитрий Сергеевич
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
10/15/2019
В связи с постоянно увеличивающимся потоком текстовой информации в Интернете, задачи повышения эффективности методов поиска информации становятся все более актуальными. Одно из направлений новейших разработок -- использование агрегированного представления текстов в задачах информационного поиска. В данной работе исследуется возможность применения представления текстов с помощью аннотированных суффиксных деревьев в направлении повышения производительности и разведочного поиска (интерпретируемости коллекций). В первом направлении разработан и экспериментально обоснован метод информационного поиска АСДП, комбинирующий преимущества представления текстов аннотированными суффиксными деревьями и обратного фрагментного индексирования. Во втором направлении предложены и успешно применены методики использования таксономии предметной области: разведочный поиск путем структурирования и интерпретации коллекции текстов и эффективное расширение аудитории интернет-рекламы. Обе методики основаны на новой разработке - методе оптимального обобщения в таксономиях (ПарГеНМ), причем во втором случае эффект обобщения допускает количественную оценку.
Диссертация [*.pdf, 1.46 Мб] (дата размещения 8/13/2019)
Резюме [*.pdf, 361.21 Кб] (дата размещения 8/13/2019)
Summary [*.pdf, 327.36 Кб] (дата размещения 8/13/2019)

Разработка модели и метода линейной многокритериальной стратификацииКандидатская диссертация

Соискатель:
Орлов Михаил Анатольевич
Оппоненты:
Дорофеюк Александр Александрович, Левин Марк Шмуилович
Дисс. совет:
Д 212.048.09 - Совет по техническим и физико-математическим наукам
Дата защиты:
12/25/2017
В диссертационной работе предложена математическая модель многокритериальной линейной стратификации как аппроксимации данных в виде совокупности «параллельных» гиперплоскостей – страт. При этом весовые коэффициенты критериев определяются не по внешней информации, а непосредственно структурой данных. Разработан численный метод для формирования линейной стратификации на основе идентификации параметров модели с использованием чередующейся и квадратичной оптимизации. Для проведения контролируемых вычислительных экспериментов предложена методика генерации синтетических данных линейной стратификации с параметрами, моделирующими особенности реальных данных. Разработан комплекс программ, реализующий численный метод формирования линейной многокритериальной стратификации и методику генерации синтетических данных. С использованием разработанного комплекса программ проведены вычислительные эксперименты по верификации нового численного метода, а также сравнению его с популярными методами многокритериального ранжирования на синтетических и реальных данных. В экспериментах показана сравнительная эффективность предложенного метода, выявлены границы его применимости. Практическая значимость разработанных математической модели, численного метода и комплекса программ подтверждена на примере решения задачи приоритизации базовых станций сети сотовой связи по коммерческим показателям для компании ПАО «МТС».

Объявление о защите: (дата размещения 25.10.2017):
защита диссертации состоится 25 декабря 2017 года в 13:00 по адресу: 105187, г. Москва, ул. Кирпичная, 33/5, ауд. 503.
Диссертация [*.pdf, 1.91 Мб] (дата размещения 9/22/2017)
Автореферат [*.pdf, 6.83 Мб] (дата размещения 10/25/2017)

Разработка вычислительных методов анализа текстов с использованием аннотированных суффиксных деревьевКандидатская диссертация

Соискатель:
Черняк Екатерина Леонидовна
Дата защиты:
10/31/2016
Диссертация [*.pdf, 1.94 Мб] (дата размещения 9/1/2016)
Автореферат [*.pdf, 723.46 Кб] (дата размещения 9/1/2016)