• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2021/2022

Программная инженерия больших данных

Статус: Курс обязательный (Программирование и анализ данных)
Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 2-й курс, 3 модуль
Формат изучения: с онлайн-курсом
Охват аудитории: для своего кампуса
Преподаватели: Кузнецов Антон Михайлович, Новиков Борис Асенович
Прогр. обучения: Программирование и анализ данных
Язык: русский
Кредиты: 8
Контактные часы: 60

Программа дисциплины

Аннотация

Дисциплина направлена на формирование у студентов теоретических знаний и практических навыков работы с большими данными. Курс посвящен программному решению проблемы надежного масштабируемого хранения и обработки данных и знакомит с особенностями работы с большими данными. Студенты познакомятся с различными моделями представления и обработки данных, а также освоят работу с контейнерами. Для освоения дисциплины студентам необходимо иметь знания, полученные в результате изучения дисциплин «Современные методы анализа данных», «Алгоритмы и структуры данных».
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у студентов теоретических знаний и практических навыков использования методом машинного обучения и естественной обработки текстов в области работы с кодом и разработки программного обеспечения.
Планируемые результаты обучения

Планируемые результаты обучения

  • Умеет выбрать подходящий метод машинного обучения и естественной обработки текстов для создания модели или прототипа инструмента, помогающего в решении задач, возникающих при разработке программного обеспечения.
  • Умеет реализовать сбор и предобработку данных на основе репозитория с исходным кодом.
  • Имеет навыки использования существующих популярных библиотек, реализующих алгоритмы машинного обучения, для решения задач, актуальных в проектах по разработке программного обеспечения.
  • Понимает основные виды деятельности, осуществляемые при разработке программного обеспечения, и то, как в них могли бы быть использованы методы машинного обучения.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Постановка задачи машинного обучения
  • Использования машинного обучения для предсказания и оценки
  • Использование машинного обучения для задач синтеза кода
  • Использование машинного обучения для оптимизации архитектуры кода
  • Использование машинного обучения для поиска дубликатов
  • Использование техник обработки естественных языков
  • Использование машинного обучения для анализа кода
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
  • неблокирующий Домашнее задание 2
  • неблокирующий Домашнее задание 3
  • блокирующий Экзамен
    Экзамен проводится в устной форме.
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 3 модуль
    0.24 * Домашнее задание 1 + 0.23 * Домашнее задание 3 + 0.23 * Домашнее задание 2 + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Zimmermann, T., Menzies, T., & Bird, C. (2015). The Art and Science of Analyzing Software Data. Amsterdam: Morgan Kaufmann. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=593414

Рекомендуемая дополнительная литература

  • Kelleher, J. D. (2019). Deep Learning. Cambridge: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2234376