Бакалавриат
2019/2020
Основы статистики и анализа данных
Статус:
Курс по выбору
Направление:
38.03.01. Экономика
Кто читает:
Департамент финансов
Где читается:
Санкт-Петербургская школа экономики и менеджмента
Когда читается:
1-й курс, 2 модуль
Формат изучения:
с онлайн-курсом
Язык:
русский
Кредиты:
5
Контактные часы:
32
Программа дисциплины
Аннотация
В результате освоения дисциплины студент должен: - Знать: базовый терминологический аппарат общей теории статистики, различать виды научных дисциплин, имеющих отношение и использующий ее расчетные техники; - Уметь: составить план простого статистического исследования, обрабатывать реальные данные, на продвинутом уровне использовать программную среду Excel для решения прикладных статистических задач; - Иметь навыки (приобрести опыт) самостоятельного сбора и обработки информации, углубленного статистического анализа в программной среде Excel; навыками презентации и оформления результатов статистического исследования.
Цель освоения дисциплины
- Целью освоения дисциплины «Основы статистики и анализа данных» является формирование у слушателей подготовки к информационно-аналитической и научно-исследовательской деятельности, а также к продолжению обучения в магистратуре и аспирантуре.
Планируемые результаты обучения
- Иметь представление о предмете статистики, основных статистических закономерностях. Уметь классифицировать данные.
- Знать основные категории данных, различать информационные системы.
- Знать терминологию, основные группы статистических данных. Уметь решать задачи по предельной теореме теории вероятности.
- Знать основные категории рынка ценных бумаг, проводить расчеты стоимости акций и облигаций на базе общих данных. Уметь решать задачи и строить закономерности на основе генеральной и выборочной совокупности. Проводить группировку статистического ряда.
- Знать основные категории разрозненных типовых данных, иметь представление о регулярных выражениях. Проводить точечное и интегральное оценивание числовых характеристик.
- Знать основные категории работы с большими данными. Проводить проверку гипотез, выявлять критерии значимости. Выявлять параметрические гипотезы.
Содержание учебной дисциплины
- Тема 1. Введение в статистикуПонятие предмета, объекта исследования. Этапы статистического исследования. Данные, типология и шкалы. Вторичные данные.
- Тема 2. Импорт данных из текстовых файлов и табличных представлений в Microsoft ExcelИмпорт данных из текстовых файлов и табличных представлений в Microsoft Excel.
- Тема 3. Импорт данных из PDF документовИмпорт данных из неадаптированных источников на примере сайта Центробанка. Предельные теоремы теории вероятностей. Неравенство Чебышева. Типы сходимости случайных величин. Закон больших чисел и его проявления. Теоремы Чебышева, Маркова, Бернулли, Хинчина. Понятие о центральной предельной теореме и ее роль в науке и обществе.
- Тема 4. Особенности поиска и импорта данных через поисковые формы сайтовОсобенности поиска и импорта данных через поисковые формы сайтов (на примере WorldBank, Центрального банка и Cbonds). Использование AutoIt для автоматизации рутинной деятельности. Выборочный метод математической статистики. Генеральная и выборочная совокупности. Вариационный и статистические ряды. Порядковые статистики и их применения. Выборочная функция распределения. Выборочные числовые характеристики. Группированный статистический ряд, гистограмма. Секторные диаграммы.
- Тема 5. Особенности поиска разрозненных типовых данныхОсобенности поиска разрозненных типовых данных. Регулярные выражения. Точечное и интервальное оценивание числовых характеристик и параметров распределения генеральной совокупности. Понятие точечной статистической оценки. Требования к оценкам. Нахождение точечных оценок методом моментов и методом максимального правдоподобия. Точечные оценки математического ожидания и дисперсии генеральной совокупности. Точечные оценки параметров основных распределений. Основные распределения математической статистики: распределение Пирсона, Стьюдента, Фишера. Интервальное оценивание числовых характеристик и параметров распределения. Основные понятия. Построение доверительных интервалов для математического ожидания и дисперсии нормального закона
- Тема 6. Работа с большими объемами данных – введение в SQLРабота с большими объемами данных – введение в SQL: импорт данных, базовый синтаксис запросов. Обзор возможностей и сред. Проверка статистических гипотез. Проверка статистических гипотез. Критерий значимости. Построение критических областей. Ошибки 1-го и 2-го рода. Проверка гипотезы о законе распределения. Критерий «хи-квадрат». Проверка параметрических гипотез.
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.1 * Индивидуальное домашнее задание + 0.25 * Контрольная работа + 0.15 * Самостоятельная работа + 0.5 * Экзамен
Список литературы
Рекомендуемая основная литература
- Далингер В. А., Симонженков С. Д., Галюкшов Б. С. - ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА С ПРИМЕНЕНИЕМ MATHCAD 2-е изд., испр. и доп. Учебник и практикум для прикладного бакалавриата - М.:Издательство Юрайт - 2019 - 145с. - ISBN: 978-5-534-10080-8 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/teoriya-veroyatnostey-i-matematicheskaya-statistika-s-primeneniem-mathcad-434656
Рекомендуемая дополнительная литература
- Андрухаев Х. М. - ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА. СБОРНИК ЗАДАЧ 3-е изд., испр. и доп. Учебное пособие для прикладного бакалавриата - М.:Издательство Юрайт - 2019 - 177с. - ISBN: 978-5-9916-8599-3 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/teoriya-veroyatnostey-i-matematicheskaya-statistika-sbornik-zadach-437095
- Бугров Я. С., Никольский С. М. - ВЫСШАЯ МАТЕМАТИКА В 3 Т. Т.1. ДИФФЕРЕНЦИАЛЬНОЕ И ИНТЕГРАЛЬНОЕ ИСЧИСЛЕНИЕ В 2 КН. КНИГА 1 7-е изд. Учебник для академического бакалавриата - М.:Издательство Юрайт - 2019 - 253с. - ISBN: 978-5-534-02148-6 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/vysshaya-matematika-v-3-t-t-1-differencialnoe-i-integralnoe-ischislenie-v-2-kn-kniga-1-437223