• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2023/2024

Продвинутые методы анализа и визуализации данных в Python

Статус: Курс по выбору (Политология)
Направление: 41.03.04. Политология
Когда читается: 3-й курс, 3, 4 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для всех кампусов НИУ ВШЭ
Язык: русский
Кредиты: 4
Контактные часы: 62

Программа дисциплины

Аннотация

Данный курс направлен на формирование компетенций у студентов в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Начальный)» в SmartLMS (https://edu.hse.ru/course/view.php?id=136231).
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимать и корректно использовать основные статистические понятия
  • Фильтровать данные по нескольким условиям
  • Создавать сводные таблицы
  • Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
  • Вычислять релевантные описательные статистики и интерпретировать полученные результаты
  • Визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой
  • Сортировать данные
  • Переводить значения признака в z-оценки
  • Обрабатывать пропущенные значения и выбросы
  • Корректно открывать табличные данные различных форматов
  • Использовать собственноручно написанные функции для обработки данных, создания новых переменных
  • Использовать Python в применении к анализу данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в инструменты
  • Введение в статистику. Базовые манипуляции с данными
  • Типы данных. Создание новых переменных
  • Генеральная совокупность и выборка. Частотные таблицы и распределения
  • Описательные статистики: меры центральной тенденции и разброса
  • Z-оценка. Выбросы
  • Корреляция
  • Введение в визуализацию данных
  • Продвинутая визуализация данных
  • Линейная регрессия
  • Основные понятия теории нейронных сетей.
  • Классификация: KNN, Алгоритм решающих деревьев
  • Введение в линейные модели и задача регрессии
  • Кластеризация данных
  • Рекомендательные системы
  • Ансамбли
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
    Домашнее задание: решение задачи машинного обучения
  • неблокирующий Самостоятельные работы
  • неблокирующий Работа на семинарах
  • неблокирующий Контрольная работа
  • неблокирующий Проект
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 4 модуль
    0.2 * Домашнее задание + 0.25 * Контрольная работа + 0.15 * Проект + 0.15 * Работа на семинарах + 0.25 * Самостоятельные работы
Список литературы

Список литературы

Рекомендуемая основная литература

  • Elementary statistics : a step by step approach, Bluman, A. G., 2007
  • Essentials of statistics for the behavioral sciences, Gravetter, F. J., 2014

Рекомендуемая дополнительная литература

  • Статистика и котики, Савельев, В. В., 2018