• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Introduction to Data Science

2022/2023
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Course type:
Compulsory course
When:
2 year, 4 module

Instructors


Dubeniuk, Anna


Пак Марина Александровна

Программа дисциплины

Аннотация

Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательных программ «Управление бизнесом», «Маркетинг и рыночная аналитика» и «Управление цепями поставок и бизнес-аналитика» и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Также будут рассмотрены темы, связанные с основами машинного обучения.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимать и корректно использовать основные статистические понятия
  • Фильтровать данные по нескольким условиям
  • Создавать сводные таблицы
  • Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
  • Вычислять релевантные описательные статистики и интерпретировать полученные результаты
  • Уметь реализовывать все шаги проверки статистических гипотез
  • Применять параметрические статистические критерии для проверки гипотез
  • Применять непараметрические статистические критерии для проверки гипотез
  • Создавать интерактивные визуализации
  • Сортировать данные
  • Переводить значения признака в z-оценки
  • Обрабатывать пропущенные значения и выбросы
  • Строить уравнение линейной регрессии с использованием метода наименьших квадратов
  • Оценивать качество модели линейной регрессии с помощью релевантных метрик
  • Оценивать качество модели классификации с помощью релевантных метрик
  • Корректно открывать табличные данные различных форматов
  • Использовать собственноручно написанные функции для обработки данных, создания новых переменных
  • Вычислять описательные статистики и интерпретировать полученные результаты
  • Использовать Python в применении к анализу данных
  • Визуализировать данные с помощью различных диаграмм: тепловой карты, ящика с усами и других
  • Реализовывать разведочный анализ данных
  • Решать задачу классификации с использованием логистической регрессии и KNN
Содержание учебной дисциплины

Содержание учебной дисциплины

  • 1. Введение в инструменты
  • 2. Введение в статистику. Базовые манипуляции с данными
  • 3. Типы данных. Создание новых переменных
  • 4. Генеральная совокупность и выборка. Частотные таблицы и распределения
  • 5. Описательные статистики: меры центральной тенденции и разброса
  • 6. Z-оценка. Выбросы
  • 7. Корреляция
  • 8. Введение в визуализацию данных
  • 9. Продвинутая визуализация данных
  • 10. Введение в тестирование гипотез. Непараметрические критерии
  • 11. Параметрические критерии для проверки гипотез
  • 12. Линейная регрессия
  • 13. Логистическая регрессия
  • 14. Введение в машинное обучение
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа 1
    *Если ваш курс проходит в онлайн формате, то все контрольные мероприятия осуществляются в формате "ОНЛАЙН С ПРОКТОРИНГОМ" Контрольная, основанная на Спецификации НЭ по Анализу данных 2022-23 года базового уровня. В контрольную входит задания, аналогичные части заданий варианта НЭ, на решение которых отводится 60 минут. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по анализу данных Подлежит обязательной пересдаче при ликвидации академической задолженности. Синхронный элемент контроля. Контрольные: жёсткий дедлайн.
  • неблокирующий Домашнее задание
    *В случае выявления элементов списывания домашней работы возможна устная защита. Всего будет 4 домашних задания, итоговая оценка вычисляется как среднее по всем домашним заданиям. Асинхронный элемент контроля. Домашние задания: дедлайн + поздний дедлайн со штрафом 1 балл каждый день
  • неблокирующий Тест
    *Если ваш курс проходит в онлайн формате, то все контрольные мероприятия осуществляются в формате "ОНЛАЙН С ПРОКТОРИНГОМ" Всего будет 4 теста. Резервных дней для написания теста нет. В случае пропуска по уважительной причине можно написать удаленно или перераспределить вес на другие тесты. Синхронный элемент контроля. 5-10 минутные тесты, проводимые на семинарах по пройденному материалу онлайн-курса.
  • неблокирующий Контрольная работа 2
    *Если ваш курс проходит в онлайн формате, то все контрольные мероприятия осуществляются в формате "ОНЛАЙН С ПРОКТОРИНГОМ" Контрольная, основанная на Спецификации НЭ по Анализу данных 2022-23 года базового уровня. В контрольную входит задания, аналогичные части заданий варианта НЭ, на решение которых отводится 60 минут. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по Анализу данных Подлежит обязательной пересдаче при ликвидации академической задолженности. Синхронный элемент контроля. Контрольные: жёсткий дедлайн.
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.25 * Тест + 0.25 * Домашнее задание + 0.25 * Контрольная работа 1 + 0.25 * Контрольная работа 2
Список литературы

Список литературы

Рекомендуемая основная литература

  • Frederick J Gravetter, Lori-Ann B. Forzano, & Tim Rakow. (2021). Research Methods For The Behavioural Sciences, Edition 1. Cengage Learning.

Рекомендуемая дополнительная литература

  • Frederick J Gravetter, Larry B. Wallnau, Lori-Ann B. Forzano, & James E. Witnauer. (2020). Essentials of Statistics for the Behavioral Sciences, Edition 10. Cengage Learning.