Магистратура
2023/2024
Веб-поиск и ранжирование
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Машинное обучение и анализ данных)
Направление:
01.04.02. Прикладная математика и информатика
Кто читает:
Департамент информатики
Когда читается:
2-й курс, 3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Кураленок Игорь Евгеньевич
Прогр. обучения:
Машинное обучение и анализ данных
Язык:
русский
Кредиты:
3
Контактные часы:
32
Программа дисциплины
Аннотация
Дисциплина направлена на формирование у студентов теоретических знаний и практических навыков веб-поиска и ранжирования данных. Студенты получат знания об основных алгоритмах веб-поиска, создадут собственный веб-краулер и проведут оценку качества собранных результатов. Для освоения дисциплины студентам необходимы знания, полученные в результате изучения дисциплин «Машинное обучение», «Теория вероятностей и математическая статистика».
Цель освоения дисциплины
- Формирование у студентов теоретических знаний и практических навыков веб-поиска и ранжирования данных.
Планируемые результаты обучения
- Знает технологии оценки качества поиска
- Умеет собирать данные из веб-ресурсов
- Имеет навыки использования прямых методов ранжирования и способов проведения ранжирования с использованием машинного обучения.
Содержание учебной дисциплины
- Раздел 1. Оценка качества информационного поиска
- Раздел 2. Подготовка данных для поиска, обработка запроса
- Раздел 3. Классические подходы к ранжированию, применение семантических методов и машинного обучения
- Раздел 4. Федеративный поиск, кликовые модели
Элементы контроля
- ExamThe oral exam is carried out in the form of answers to the questions of the exam ticket. The exam ticket contains two questions from the list of questions for the exam. 2.5 hours are given to prepare the answer.
- Course project №2As a course project, students will be required to implement a project that uses modern web search and ranking methods to solve applied task. Project completion time is 5 weeks.
- Course project №1As a course project, students will be required to implement a project that uses modern web search and ranking methods to solve applied task. Project completion time is 5 weeks.
Промежуточная аттестация
- 2023/2024 учебный год 3 модуль0.3 * Course project №1 + 0.3 * Course project №2 + 0.4 * Exam
Список литературы
Рекомендуемая основная литература
- Gossen, T. (2015). Search Engines for Children : Search User Interfaces and Information-Seeking Behaviour. Wiesbaden: Springer Vieweg. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1159664
- Sándor Dominich. The Modern Algebra of Information Retrieval (2008), Springer
Рекомендуемая дополнительная литература
- Hwee Tou Ng, Mun-Kew Leong, Min-Yen Kan, Donghong Ji. Information Retrieval Technology/Third Asia Information Retrieval Symposium, AIRS 2006, Singapore, October 16-18, 2006. Proceedings, 2006, Springer
- Levene, M. (2010). An Introduction to Search Engines and Web Navigation. Hoboken, N.J.: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=335281