Бакалавриат
2019/2020
Технологии анализа больших данных
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Государственное и муниципальное управление)
Направление:
38.03.04. Государственное и муниципальное управление
Где читается:
Факультет социальных наук
Когда читается:
1-й курс, 4 модуль
Формат изучения:
с онлайн-курсом
Язык:
русский
Кредиты:
5
Контактные часы:
36
Программа дисциплины
Аннотация
Активное развитие машинного обучения, накопление больших объёмов данных и появление простых инструментов анализа данных привели к тому, что методы искусственного интеллекта стали применяться во многих предметных областях: экономике, социологии, финансах, маркетинге, политологии, а также государственном и муниципальном управлении. Методы анализа больших данных могут применяться для оптимизации политических кампаний, для выявления закономерностей в новостных источниках, мониторинге качества предоставляемых услуг, автоматизации сервисов и т.д. Данный курс направлен на знакомство с современными кейсами применения анализа данных в государственном и муниципальном управлении. С использованием онлайн-курса "Python для извлечения и обработки данных" (URL: https://openedu.ru/course/hse/PYTHON/).
Цель освоения дисциплины
- Получение целостного представления о возможностях и ограничениях современных статистических методов и машинного обучения
- Получение знаний об особенностях анализа данных для решения задач, возникающих в области государственного управления
- Получение навыков анализа данных в своей профессиональной области
Планируемые результаты обучения
- Умеет решать профессиональные задачи с помощью анализа данных
- Умеет рассчитывать основные описательные статистики
- Умеет решать статистические гипотезы
- Основы статистического анализа данных
- Умеет графически представлять данные
Содержание учебной дисциплины
- Введение в анализ данных в ГМУВведение в анализ данных, кейсы из предметной области. Использование точных наук в государственном управлении. Применимость анализа данных в ГМУ. Цифровое правительство. Данные для принятия управленческих решений.
- Поиск и обработка данныхПоиск данных. Открытые данные, используемые в государственном управлении. Базы данных. Портал открытых данных. Подбор данных для конкретных задач.
- Основы статистического анализа данныхГенеральная совокупность, выборка. Репрезентативность выборки. Распределение. Типы переменных (количественные, порядковые, категориальные). Числовые характеристики: МЦТ (медиана, среднее арифметическое, мода) и меры разброса (стандартное отклонение, дисперсия), квантили, перцентили. Соотношение МЦТ и типов переменных. Анализ взаимосвязи переменных, корреляция. Свойства корреляции. Проверка статистической гипотезы, p-value, сравнение средних (критерий Стьюдента). Ложные корреляции. Отличие взаимосвязи от причинно-следственной связи.
- Машинное обучениеЗадачи машинного обучения: обучение с учителем и без учителя, выбор метода для конкретной задачи. Основная терминология. Регрессия. Классификация и кластеризация: основной смысл, кейсы.
- Визуализация данныхВизуализация результатов анализа данных. График плотности распределения. Диаграммы рассеяния. Гистограммы. Столбиковые диаграммы. Линейные диаграммы. Коробчатые диаграммы. Круговые диаграммы. Необычные типы диаграмм. Удачные и неудачные варианты визуализации данных. Подбор графического представления для различных результатов исследований.
Элементы контроля
- Самостоятельная работа
- Домашнее задание
- Командный проект
- ТестыТесты на каждом семинаре и на каждой лекции. Они засчитываются только при условии присутствия на занятии. Оценка за дисциплину выставляется в соответствии с формулой оценивания от всех пройденных элементов контроля. Экзамен не проводится.
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)Результирующая = 0,5*ДЗ+0,15*Тесты+0,2*Проект+0,15*КР
Список литературы
Рекомендуемая дополнительная литература
- HEER, J., BOSTOCK, M., & OGIEVETSKY, V. (2010). A Tour Through the Visualization Zoo. Communications of the ACM, 53(6), 59–67. https://doi.org/10.1145/1743546.1743567
- James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
- Гудфеллоу Я., Бенджио И., Курвилль А. - Глубокое обучение - Издательство "ДМК Пресс" - 2018 - 652с. - ISBN: 978-5-97060-618-6 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/107901