• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Агрегированное представление текстов для задач поиска в коллекциях текстовых документов Aggregate representation of texts for information retrieval Кандидатская диссертация Ученая степень НИУ ВШЭ

Соискатель:Фролов Дмитрий Сергеевич
Руководитель:Миркин Борис Григорьевич (др. работы под рук-вом)
Члены комитета:Игнатов Дмитрий Игоревич (Национальный исследовательский университет "Высшая школа экономики", кандидат технических наук, председатель комитета), Громов Василий Александрович (Национальный исследовательский университет «Высшая школа экономики», доктор физико-математических наук, член комитета), Макаренков Владимир Макарович (Университет Квебека в Монреале (Канада), PhD, член комитета), Моттль Вадим Вячеславович (Вычислительный центр РАН, доктор технических наук, член комитета), Сулимова Валентина Вячеславовна (Тульский государственный университет, кандидат технических наук, член комитета)
Диссертация принята к предварительному рассмотрению:05.07.2019
Диссертация принята к защите:23.08.2019 (протокол №8)
Дисс. совет:Совет по компьютерным наукам
Дата защиты:15.10.2019


В связи с постоянно увеличивающимся потоком текстовой информации в Интернете, задачи повышения эффективности методов поиска информации становятся все более актуальными. Одно из направлений новейших разработок -- использование агрегированного представления текстов в задачах информационного поиска. В данной работе исследуется возможность применения представления текстов с помощью аннотированных суффиксных деревьев в направлении повышения производительности и разведочного поиска (интерпретируемости коллекций). В первом направлении разработан и экспериментально обоснован метод информационного поиска АСДП, комбинирующий преимущества представления текстов аннотированными суффиксными деревьями и обратного фрагментного индексирования. Во втором направлении предложены и успешно применены методики использования таксономии предметной области: разведочный поиск путем структурирования и интерпретации коллекции текстов и эффективное расширение аудитории интернет-рекламы. Обе методики основаны на новой разработке - методе оптимального обобщения в таксономиях (ПарГеНМ), причем во втором случае эффект обобщения допускает количественную оценку.

Диссертация [*.pdf, 1.46 Mb] (дата размещения 13.08.2019)
Резюме [*.pdf, 361.21 Kb] (дата размещения 13.08.2019)
Summary [*.pdf, 327.36 Kb] (дата размещения 13.08.2019)

Публикации, в которых излагаются основные результаты диссертации



Отзывы:
Отзыв научного руководителя
Отзыв члена Комитета
Сведения о результатах защиты:Комитет по диссертации рекомендовал присудить ученую степень кандидата наук НИУ ВШЭ (протокол № 2 от 15.10.2019). Решением диссертационного совета (протокол № 12 от 21.10.2019) присуждена ученая степень кандидата компьютерных наук НИУ ВШЭ.
Ключевые слова: интернет-реклама, метод информационного поиска АСДП, ПарГеНМ, представление текста, таксономия
См. на ту же тему

Оптимизация показов рекламных объявлений в поисковых интернет-системах; разработка методологии подбора порогов в рекламный показКандидатская диссертация

Соискатель: Сорокина Анна Николаевна
Руководитель: Цитович Иван Иванович
Дата защиты: 28.09.2015