• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2019/2020

Технологии анализа больших данных

Лучший по критерию «Новизна полученных знаний»
Направление: 38.03.04. Государственное и муниципальное управление
Когда читается: 1-й курс, 4 модуль
Формат изучения: с онлайн-курсом
Преподаватели: Бурова Маргарита Борисовна, Курмуков Анвар Илдарович, Пузырев Дмитрий Александрович
Язык: русский
Кредиты: 5
Контактные часы: 36

Программа дисциплины

Аннотация

Активное развитие машинного обучения, накопление больших объёмов данных и появление простых инструментов анализа данных привели к тому, что методы искусственного интеллекта стали применяться во многих предметных областях: экономике, социологии, финансах, маркетинге, политологии, а также государственном и муниципальном управлении. Методы анализа больших данных могут применяться для оптимизации политических кампаний, для выявления закономерностей в новостных источниках, мониторинге качества предоставляемых услуг, автоматизации сервисов и т.д. Данный курс направлен на знакомство с современными кейсами применения анализа данных в государственном и муниципальном управлении. С использованием онлайн-курса "Python для извлечения и обработки данных" (URL: https://openedu.ru/course/hse/PYTHON/).
Цель освоения дисциплины

Цель освоения дисциплины

  • Получение целостного представления о возможностях и ограничениях современных статистических методов и машинного обучения
  • Получение знаний об особенностях анализа данных для решения задач, возникающих в области государственного управления
  • Получение навыков анализа данных в своей профессиональной области
Планируемые результаты обучения

Планируемые результаты обучения

  • Умеет решать профессиональные задачи с помощью анализа данных
  • Умеет рассчитывать основные описательные статистики
  • Умеет решать статистические гипотезы
  • Основы статистического анализа данных
  • Умеет графически представлять данные
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в анализ данных в ГМУ
    Введение в анализ данных, кейсы из предметной области. Использование точных наук в государственном управлении. Применимость анализа данных в ГМУ. Цифровое правительство. Данные для принятия управленческих решений.
  • Поиск и обработка данных
    Поиск данных. Открытые данные, используемые в государственном управлении. Базы данных. Портал открытых данных. Подбор данных для конкретных задач.
  • Основы статистического анализа данных
    Генеральная совокупность, выборка. Репрезентативность выборки. Распределение. Типы переменных (количественные, порядковые, категориальные). Числовые характеристики: МЦТ (медиана, среднее арифметическое, мода) и меры разброса (стандартное отклонение, дисперсия), квантили, перцентили. Соотношение МЦТ и типов переменных. Анализ взаимосвязи переменных, корреляция. Свойства корреляции. Проверка статистической гипотезы, p-value, сравнение средних (критерий Стьюдента). Ложные корреляции. Отличие взаимосвязи от причинно-следственной связи.
  • Машинное обучение
    Задачи машинного обучения: обучение с учителем и без учителя, выбор метода для конкретной задачи. Основная терминология. Регрессия. Классификация и кластеризация: основной смысл, кейсы.
  • Визуализация данных
    Визуализация результатов анализа данных. График плотности распределения. Диаграммы рассеяния. Гистограммы. Столбиковые диаграммы. Линейные диаграммы. Коробчатые диаграммы. Круговые диаграммы. Необычные типы диаграмм. Удачные и неудачные варианты визуализации данных. Подбор графического представления для различных результатов исследований.
Элементы контроля

Элементы контроля

  • неблокирующий Самостоятельная работа
  • неблокирующий Домашнее задание
  • неблокирующий Командный проект
  • неблокирующий Тесты
    Тесты на каждом семинаре и на каждой лекции. Они засчитываются только при условии присутствия на занятии. Оценка за дисциплину выставляется в соответствии с формулой оценивания от всех пройденных элементов контроля. Экзамен не проводится.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    Результирующая = 0,5*ДЗ+0,15*Тесты+0,2*Проект+0,15*КР
Список литературы

Список литературы

Рекомендуемая дополнительная литература

  • HEER, J., BOSTOCK, M., & OGIEVETSKY, V. (2010). A Tour Through the Visualization Zoo. Communications of the ACM, 53(6), 59–67. https://doi.org/10.1145/1743546.1743567
  • James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
  • Гудфеллоу Я., Бенджио И., Курвилль А. - Глубокое обучение - Издательство "ДМК Пресс" - 2018 - 652с. - ISBN: 978-5-97060-618-6 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/107901