• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Анализ данных в Python

2023/2024
Учебный год
RUS
Обучение ведется на русском языке
3
Кредиты
Статус:
Курс обязательный
Когда читается:
3-й курс, 3 модуль

Преподаватель

Программа дисциплины

Аннотация

Данный курс направлен на формирование компетенций у студентов в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Начальный)» в SmartLMS (https://edu.hse.ru/course/view.php?id=136231).
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимать и корректно использовать основные статистические понятия
  • Фильтровать данные по нескольким условиям
  • Создавать сводные таблицы
  • Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
  • Вычислять релевантные описательные статистики и интерпретировать полученные результаты
  • Визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой
  • Сортировать данные
  • Переводить значения признака в z-оценки
  • Обрабатывать пропущенные значения и выбросы
  • Корректно открывать табличные данные различных форматов
  • Использовать собственноручно написанные функции для обработки данных, создания новых переменных
  • Использовать Python в применении к анализу данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в инструменты
  • Введение в статистику. Базовые манипуляции с данными
  • Типы данных. Создание новых переменных
  • Генеральная совокупность и выборка. Частотные таблицы и распределения
  • Описательные статистики: меры центральной тенденции и разброса
  • Z-оценка. Выбросы
  • Корреляция
  • Введение в визуализацию данных
  • Продвинутая визуализация данных
  • Линейная регрессия
  • Введение в машинное обучение и анализ данных
  • Введение в линейные модели и задача регрессии
  • Задача классификации текстовых данных
  • Задачи кластеризации
  • Основные понятия теории нейронных сетей.
  • Рекомендательные системы
Элементы контроля

Элементы контроля

  • неблокирующий Тесты (Онлайн курс)
  • неблокирующий Самостоятельные работы
  • неблокирующий Проект
  • неблокирующий Экзамен
    Экзамен проходит дистанционно онлайн с прокторингом, используя две камеры (одна с компьютера, вторая со смартфона).
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 3rd module
    min(0.05 * Тесты (Онлайн курс) + 0.2 * Самостоятельные работы + 0.25 * Проект + 0.5 * Экзамен, 8). В соответствии с п. 69 “Положения об организации промежуточной аттестации и текущего контроля успеваемости студентов” (ПОПАТКУС) итоговая оценка студента за дисциплину-пререквизит (ДПР) к НЭ по АД не может быть больше 8 баллов.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Elementary statistics : a step by step approach, Bluman, A. G., 2007
  • Essentials of statistics for the behavioral sciences, Gravetter, F. J., 2014

Рекомендуемая дополнительная литература

  • Статистика и котики, Савельев, В. В., 2018