• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2020/2021

Введение в Науку о данных

Лучший по критерию «Новизна полученных знаний»
Статус: Курс обязательный (Цифровые методы в гуманитарных науках)
Направление: 46.04.01. История
Где читается: Социально-гуманитарный факультет (Пермь)
Когда читается: 1-й курс, 1-3 модуль
Формат изучения: без онлайн-курса
Прогр. обучения: Цифровые методы в гуманитарных науках
Язык: русский
Кредиты: 8
Контактные часы: 86

Программа дисциплины

Аннотация

Дисциплина представляет собой вводный курс в Data Science. Он включает в себя изучение необходимых для дальнейшей работы основ математики, прежде всего математической статистики, овладение необходимым инструментарием SPSS и Python; основных задач анализа данных и машинного обучения (регрессия, классификация, кластеризация), методы анализа текстовых данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Цель дисциплины «Введение в науку о данных» – формирование теоретических и практических компетенций в следующих областях: математическая статистика и методы количественного анализа данных; технологии анализа данных, связанные с манипуляцией большими объемами данных (сбор, очистка, подбор подходящей структуры для формального представления) и методами их визуализации; прикладные навыки в области машинного обучения.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает основные понятия матема-тической статистики, использует программные средства для ста-тистического анализа.
  • Демонстрирует навыки визуализации данных.
  • Умеет применить основные методы машинного обучения для решения задач предметной области, может сделать выводы по результатам проделанной работы.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Раздел 1. Основы математики
    Элементы математического анализа, множества, функции, графики функции, аппроксимация, дифференциальное исчисление. Элементы линейной алгебры, понятие вектора, матрицы, метрики. Основы теории вероятностей и математической статистики. Базовые понятия статистики (выборка, распределение, среднее, мода и медиана, доверительные интервалы, дисперсия и среднеквадратическое отклонение). Методы проверки гипотез. Сбор и подготовка данных для анализа. Работа с Excel, SPSS, Python.
  • Раздел 2. Методы визуализации данных: диаграммы рассеяния, визуализация погрешностей, гистограммы.
    Методы визуализации малоразмерных данных. Методы анализа многомерных данных (метод главных компонент и многомерное шкалирование).
  • Раздел 3. Основные задачи и методы машинного обучения.
    Классические задачи машинного обучения: регрессия, классификация, кластеризация. Основы глубинного обучения для анализа текстовых данных.
Элементы контроля

Элементы контроля

  • неблокирующий Проект в рамках 2 и 3 раздела
    Письменный отчёт с постановкой задачи, её решение методами, обсуждаемыми на курсе, и выводы о полученных результатах.
  • неблокирующий Экзамен
    Экзамен по дисциплине пройдет онлайн (в zoom) в период сессии 3-го модуля.
  • неблокирующий Работа на аудиторных занятиях в рамках первого раздела
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (3 модуль)
    0.4 * Проект в рамках 2 и 3 раздела + 0.2 * Работа на аудиторных занятиях в рамках первого раздела + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Иванов Б.Н. - Теория вероятностей и математическая статистика: учебное пособие - Издательство "Лань" - 2019 - 224с. - ISBN: 978-5-8114-3636-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/113901

Рекомендуемая дополнительная литература

  • Дюк В.А. - Логический анализ данных: учебное пособие - Издательство "Лань" - 2020 - 80с. - ISBN: 978-5-8114-4180-8 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/126935
  • Салин В.Н., Шпаковская Е.П., Вахрамеева М.В. - Социально-экономическая статистика: Практикум: учебное пособие - Издательство "Финансы и статистика" - 2016 - 192с. - ISBN: 978-5-279-02637-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/91210
  • Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульма - Анализ больших наборов данных - Издательство "ДМК Пресс" - 2016 - 498с. - ISBN: 978-5-97060-190-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93571