Магистратура
2021/2022
Программная инженерия больших данных
Статус:
Курс обязательный (Программирование и анализ данных)
Направление:
01.04.02. Прикладная математика и информатика
Кто читает:
Департамент информатики
Когда читается:
2-й курс, 3 модуль
Формат изучения:
с онлайн-курсом
Охват аудитории:
для своего кампуса
Прогр. обучения:
Программирование и анализ данных
Язык:
русский
Кредиты:
8
Контактные часы:
60
Программа дисциплины
Аннотация
Дисциплина направлена на формирование у студентов теоретических знаний и практических навыков работы с большими данными. Курс посвящен программному решению проблемы надежного масштабируемого хранения и обработки данных и знакомит с особенностями работы с большими данными. Студенты познакомятся с различными моделями представления и обработки данных, а также освоят работу с контейнерами. Для освоения дисциплины студентам необходимо иметь знания, полученные в результате изучения дисциплин «Современные методы анализа данных», «Алгоритмы и структуры данных».
Цель освоения дисциплины
- Формирование у студентов теоретических знаний и практических навыков использования методом машинного обучения и естественной обработки текстов в области работы с кодом и разработки программного обеспечения.
Планируемые результаты обучения
- Умеет выбрать подходящий метод машинного обучения и естественной обработки текстов для создания модели или прототипа инструмента, помогающего в решении задач, возникающих при разработке программного обеспечения.
- Умеет реализовать сбор и предобработку данных на основе репозитория с исходным кодом.
- Имеет навыки использования существующих популярных библиотек, реализующих алгоритмы машинного обучения, для решения задач, актуальных в проектах по разработке программного обеспечения.
- Понимает основные виды деятельности, осуществляемые при разработке программного обеспечения, и то, как в них могли бы быть использованы методы машинного обучения.
Содержание учебной дисциплины
- Постановка задачи машинного обучения
- Использования машинного обучения для предсказания и оценки
- Использование машинного обучения для задач синтеза кода
- Использование машинного обучения для оптимизации архитектуры кода
- Использование машинного обучения для поиска дубликатов
- Использование техник обработки естественных языков
- Использование машинного обучения для анализа кода
Элементы контроля
- Домашнее задание 1
- Домашнее задание 2
- Домашнее задание 3
- ЭкзаменЭкзамен проводится в устной форме.
Промежуточная аттестация
- 2021/2022 учебный год 3 модуль0.24 * Домашнее задание 1 + 0.23 * Домашнее задание 3 + 0.23 * Домашнее задание 2 + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- Zimmermann, T., Menzies, T., & Bird, C. (2015). The Art and Science of Analyzing Software Data. Amsterdam: Morgan Kaufmann. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=593414
Рекомендуемая дополнительная литература
- Kelleher, J. D. (2019). Deep Learning. Cambridge: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2234376