• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Агрегированное представление текстов для задач поиска в коллекциях текстовых документовAggregate representation of texts for information retrieval

Соискатель:
Фролов Дмитрий Сергеевич
Члены комитета:
Игнатов Дмитрий Игоревич (Национальный исследовательский университет "Высшая школа экономики", кандидат технических наук, председатель комитета), Громов Василий Александрович (Национальный исследовательский университет «Высшая школа экономики», доктор физико-математических наук, член комитета), Макаренков Владимир Макарович (Университет Квебека в Монреале (Канада), PhD, член комитета), Моттль Вадим Вячеславович (Вычислительный центр РАН, доктор технических наук, член комитета), Сулимова Валентина Вячеславовна (Тульский государственный университет, кандидат технических наук, член комитета)
Диссертация принята к предварительному рассмотрению:
7/5/2019
Диссертация принята к защите:
8/23/2019 (протокол №8)
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
10/15/2019
В связи с постоянно увеличивающимся потоком текстовой информации в Интернете, задачи повышения эффективности методов поиска информации становятся все более актуальными. Одно из направлений новейших разработок -- использование агрегированного представления текстов в задачах информационного поиска. В данной работе исследуется возможность применения представления текстов с помощью аннотированных суффиксных деревьев в направлении повышения производительности и разведочного поиска (интерпретируемости коллекций). В первом направлении разработан и экспериментально обоснован метод информационного поиска АСДП, комбинирующий преимущества представления текстов аннотированными суффиксными деревьями и обратного фрагментного индексирования. Во втором направлении предложены и успешно применены методики использования таксономии предметной области: разведочный поиск путем структурирования и интерпретации коллекции текстов и эффективное расширение аудитории интернет-рекламы. Обе методики основаны на новой разработке - методе оптимального обобщения в таксономиях (ПарГеНМ), причем во втором случае эффект обобщения допускает количественную оценку.
Диссертация [*.pdf, 1.46 Мб] (дата размещения 8/13/2019)
Резюме [*.pdf, 361.21 Кб] (дата размещения 8/13/2019)
Summary [*.pdf, 327.36 Кб] (дата размещения 8/13/2019)

Отзывы
Отзыв научного руководителя
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата наук НИУ ВШЭ (протокол № 2 от 15.10.2019). Решением диссертационного совета (протокол № 12 от 21.10.2019) присуждена ученая степень кандидата компьютерных наук НИУ ВШЭ.