• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2023/2024

Веб-поиск и ранжирование

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс по выбору (Машинное обучение и анализ данных)
Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 2-й курс, 3 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для всех кампусов НИУ ВШЭ
Прогр. обучения: Машинное обучение и анализ данных
Язык: русский
Кредиты: 3
Контактные часы: 32

Программа дисциплины

Аннотация

Дисциплина направлена на формирование у студентов теоретических знаний и практических навыков веб-поиска и ранжирования данных. Студенты получат знания об основных алгоритмах веб-поиска, создадут собственный веб-краулер и проведут оценку качества собранных результатов. Для освоения дисциплины студентам необходимы знания, полученные в результате изучения дисциплин «Машинное обучение», «Теория вероятностей и математическая статистика».
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у студентов теоретических знаний и практических навыков веб-поиска и ранжирования данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает технологии оценки качества поиска
  • Умеет собирать данные из веб-ресурсов
  • Имеет навыки использования прямых методов ранжирования и способов проведения ранжирования с использованием машинного обучения.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Раздел 1. Оценка качества информационного поиска
  • Раздел 2. Подготовка данных для поиска, обработка запроса
  • Раздел 3. Классические подходы к ранжированию, применение семантических методов и машинного обучения
  • Раздел 4. Федеративный поиск, кликовые модели
Элементы контроля

Элементы контроля

  • блокирующий Exam
    The oral exam is carried out in the form of answers to the questions of the exam ticket. The exam ticket contains two questions from the list of questions for the exam. 2.5 hours are given to prepare the answer.
  • блокирующий Course project №2
    As a course project, students will be required to implement a project that uses modern web search and ranking methods to solve applied task. Project completion time is 5 weeks.
  • блокирующий Course project №1
    As a course project, students will be required to implement a project that uses modern web search and ranking methods to solve applied task. Project completion time is 5 weeks.
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 3 модуль
    0.3 * Course project №1 + 0.3 * Course project №2 + 0.4 * Exam
Список литературы

Список литературы

Рекомендуемая основная литература

  • Gossen, T. (2015). Search Engines for Children : Search User Interfaces and Information-Seeking Behaviour. Wiesbaden: Springer Vieweg. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1159664
  • Sándor Dominich. The Modern Algebra of Information Retrieval (2008), Springer

Рекомендуемая дополнительная литература

  • Hwee Tou Ng, Mun-Kew Leong, Min-Yen Kan, Donghong Ji. Information Retrieval Technology/Third Asia Information Retrieval Symposium, AIRS 2006, Singapore, October 16-18, 2006. Proceedings, 2006, Springer
  • Levene, M. (2010). An Introduction to Search Engines and Web Navigation. Hoboken, N.J.: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=335281