2023/2024
Теория вероятностей и статистика для анализа данных
Статус:
Дисциплина общефакультетского пула
Когда читается:
2 модуль
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Лапинова Светлана Александровна
Язык:
русский
Кредиты:
3
Контактные часы:
24
Программа дисциплины
Аннотация
Курс позволяет студентам освоить понимание основных концепций теории вероятностей и умение рассчитывать и интерпретировать основные статистические показатели, критерии и метрики, актуальные для бизнес-аналитики. В рамках курса студенты знакомятся с основными идеями и методами статистики, а также с применением статистических методов в эконометрике, науке о данных, осваиваются аналитические инструменты, необходимые для углубленных курсов по машинному обучению.
Цель освоения дисциплины
- Целями освоения дисциплины являются: изучение основных концепций теории вероятностей, умение рассчитывать и интерпретировать основные статистические показатели, критерии и метрики, актуальные для бизнес-аналитики.
Планируемые результаты обучения
- Уметь вычислять вероятности элементарных событий
- Уметь применять формулу полной вероятности и формулу Байеса
- Умеет вычислять основные статистические параметры
- Различает основные распределения, умеет вычислять параметры нормального и равномерного распределений
- Умеет работать с выбросами и пропущенными данными. Выполняет графический и статистический анализ данных
- Умеет планировать статистический эксперимент, формулировать гипотезы
- Умеет строить модели линейной регрессии
- Умеет ставить задачи с применением логистической регрессии. Строит логистические регрессии. Анализирует качество моделей
- Умеет строить кластеры с помощью библиотек языка Python
- Анализирует поведение временного ряда. Строит простые модели временных рядов
Содержание учебной дисциплины
- Введение в статистические методы в экономике и финансах. Источники статистической информации.
- Введение в статистику
- Предварительная подготовка данных и предварительный анализ данных
- Проведение статистических экспериментов. Оценка значимости
- Построение регрессионных моделей
- Логистическая регрессия
- Кластеризация и классификация
- Временные ряды
Список литературы
Рекомендуемая основная литература
- Unpingco, J. (2016). Python for Probability, Statistics, and Machine Learning. Switzerland: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1175813
- Силен Дэви, Мейсман Арно, Али Мохамед - Основы Data Science и Big Data. Python и наука о данных. — (Серия «Библиотека программиста») - 978-5-4461-0944-9 - Санкт-Петербург: Питер - 2019 - 376837 - https://ibooks.ru/bookshelf/376837/reading - iBOOKS
- Теория вероятностей и математическая статистика : учебник для прикладного бакалавриата, Гмурман, В. Е., 2018
- Теория вероятности, [учебно-методическая разработка], ГУ-ВШЭ, Нижегор. фил., каф. мат., 82 с., Бляхман, Л. Г., Малыженкова, В. И., Морозов, В. П., Тютин, В. В., 2008
Рекомендуемая дополнительная литература
- Шведов А. С. - Теория вероятностей и математическая статистика: промежуточный уровень - 978-5-7598-1301-9 - Москва: ВШЭ - 2016 - 352920 - https://ibooks.ru/bookshelf/352920/reading - iBOOKS