Магистратура
2019/2020
Web-поиск
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Программирование и анализ данных)
Направление:
01.04.02. Прикладная математика и информатика
Кто читает:
Департамент информатики
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Кураленок Игорь Евгеньевич
Прогр. обучения:
Программирование и анализ данных
Язык:
русский
Кредиты:
4
Контактные часы:
56
Программа дисциплины
Аннотация
Целями освоения дисциплины «Веб-поиск и ранжирование» являются формирование у студентов теоретических знаний и практических навыков веб-поиска и ранжирования данных. Студенты получат об основных алгоритмах веб поиска, создадут собственный веб- краулер и проведут оценку качества собранных результатов. В результате освоения дисциплины студент должен: − Знать технологии оценки качества поиска. − Уметь собирать данные из веб-ресурсов. − Иметь навыки (приобрести опыт) использования прямых методов ранжирования и способов проведения ранжирования с использованием машинного обучения.
Цель освоения дисциплины
- формирование у студентов теоретических знаний и практических навыков веб-поиска и ранжирования данных.
Планируемые результаты обучения
- Знает основные методы веб-поиска. Обрабатывает, анализирует и синтезирует информацию. Знает английскую номенклатуру и умеет обсуждать веб-поиск на английском языке. Владеет навыками веб-поиска на английском языке при решении практических задач.
- Знает английскую номенклатуру и умеет обсуждать веб-поиск на английском языке. Применяет принципы веб- поиска ранжирования к прикладным задачам. Владеет навыками веб-поиска на английском языке при решении практических задач.
- Знает основные алгоритмы машинного обучения, применяемых в области веб- поиска. Строит решающие деревья и нейронные сети для решения задач ранжирования. Проводит обучение и тестирует модели машинного обучения, применяемых в веб-поиске и ранжировании.
- Знает современные методы, используемые в задачах веб-поиска и ранжирования. Обрабатывает базы данных, веб- поиска и ранжирования. Работает с современными пакетами программ, применяемых в задачах веб-поиска и ранжирования.
Содержание учебной дисциплины
- Оценка качества информационного поиска
- Подготовка данных для поиска, обработка запроса
- Классические подходы к ранжированию, применение семантических методов и машинного обучения
- Федеративный поиск, кликовые модели
Элементы контроля
- Курсовой проект
- Устный экзаменЭкзамен проводится в устной форме с использованием синхронного прокторинга, и состоит из 3-х частей: презентация научной статьи по теме Information Retrieval (SIGIR, WSDM, CIKM), ответ по случайному вопросу из списка и решению задачи. Оценка 3 предполагает успешную презентацию статьи. Для получения оценки 4 кроме успешной презентации нужно ответить на вопрос. И, наконец, для получения «отлично» студенту придется справиться со всеми этапами. Экзамен проводится на платформе Moodle (https://et.hse.ru), прокторинг на платформе Экзамус (https://hse.student.examus.net). К экзамену необходимо подключиться за 15 минут. На платформе Экзамус доступно тестирование системы. Компьютер студента должен удовлетворять следующим требованиям: https://elearning.hse.ru/data/2020/05/07/1544135594/Технические%20требования%20к%20ПК%20студента.pdf) Для участия в экзамене студент обязан: заранее зайти на платформу прокторинга, провести тест системы, включить камеру и микрофон, подтвердить личность. Время на презентацию – 10 минут, на ответ – 20 минут и на решение задачи – полчаса. Время начала экзамена 11:00, завершение в 13:00. Во время экзамена студентам запрещено: общаться (в социальных сетях, с людьми в комнате). При этом для подготовки можно пользоваться любыми материалами: материалы лекций, информация из интернета, etc.. Долговременным нарушением связи во время экзамена считается прерывание связи 30 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи.
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.5 * Курсовой проект + 0.5 * Устный экзамен
Список литературы
Рекомендуемая основная литература
- Gossen, T. (2015). Search Engines for Children : Search User Interfaces and Information-Seeking Behaviour. Wiesbaden: Springer Vieweg. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1159664
Рекомендуемая дополнительная литература
- Advances in information retrieval: 36th European Conference on IR Research, ECIR 2014, Amsterdam, The Netherlands, April 13-16, 2014: proceedings. (2014). Springer. https://doi.org/10.1007/978-3-319-06028-6