• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2023/2024

Анализ данных

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс обязательный
Направление: 09.03.04. Программная инженерия
Когда читается: 3-й курс, 4 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 3
Контактные часы: 44

Программа дисциплины

Аннотация

Изучение дисциплины «Введение в анализ данных» нацелено на освоение основных методов и алгоритмов анализа данных с применением языка программирования Python.Курс является вторым в майноре «Интеллектуальный анализ данных». Предполагается, что в результате освоения курса студенты будут способны самостоятельно проводить анализ различных наборов данных с использованием языка программирования Python.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знать основные методы анализа данных; о месте и ценности методов машинного обучения и разработки данных в современной науке и практической деятельности; основные каналы научной и прикладной информации по анализу данных
  • Уметь использовать освоенные методы анализа данных для обработки конкретных наборов данных, анализировать результаты, делать выводы; формализовать конкретную задачу анализа данных и разработать алгоритм решения
  • Владеть методами программирования, отлаживания и тестирования алгоритмов анализа данных
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает и умеет использовать программные реализации методов решения задачи классификации
  • Знает и умеет использовать программные реализации методов решения задачи регрессии
  • Знает и умеет использовать программные реализации основных алгоритмов кластерного анализа
  • Знает основные методы кластерного анализа данных, основные способы измерения расстояния между объектами
  • Знает основные методы решения задачи классификации, способы оценки точности классификации, способы борьбы с переобучением
  • Знает основные методы решения задачи регрессии, способы оценки ошибки предсказания
  • Знает основные типы данных, этапы предобработки данных, методы разведочного анализа данных
  • Понимает концепцию задачи классификации как задачи машинного обучения
  • Понимает концепцию задачи регрессии как задачи машинного обучения
  • Понимает концепцию кластерного анализа данных, концепцию близкости (похожести) объектов
  • Понимает концепцию структурированных и не структурированных данных, задачу анализа данных и машинного обучения
  • Умеет выполнять предобработку данных и разведочный анализ данных с помощью релевантного программного обеспечения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Первичный анализ данных
  • Методы кластеризации
  • Методы предсказания. Регрессия
  • Методы классификации
Элементы контроля

Элементы контроля

  • неблокирующий Практическая работа
  • неблокирующий Домашнее задание
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 4th module
    0.2 * Домашнее задание + 0.2 * Практическая работа + 0.6 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Aggarwal C. Data Mining: The Textbook. Springer International Publishing, 2015. DOI: 10.1007/978-3-319-14142-8

Рекомендуемая дополнительная литература

  • Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.
  • Mirkin, B. Core concepts in data analysis: summarization, correlation and visualization. – Springer Science & Business Media, 2011. – 388 pp.

Авторы

  • Асеева Наталья Владимировна