Бакалавриат
2021/2022
Наука о данных
Статус:
Курс обязательный (Совместная программа по экономике НИУ ВШЭ и РЭШ)
Направление:
38.03.01. Экономика
Кто читает:
Отдел сопровождения учебного процесса в Совместном бакалавриате ВШЭ-РЭШ
Где читается:
Факультет экономических наук
Когда читается:
2-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
100
Охват аудитории:
для своего кампуса
Преподаватели:
Щуров Илья Валерьевич
Язык:
русский
Кредиты:
6
Контактные часы:
64
Программа дисциплины
Аннотация
Изучение дисциплины «Наука о данных» базируется на следующих дисциплинах: математический анализ; линейная алгебра; Для освоения учебной дисциплины студенты должны владеть следующими знаниями и компетенциями: знать основные понятия курса математический анализ знать простейшие методы решения задач; Основные положения дисциплины должны быть использованы в дальнейшем при изучении следующих дисциплин: Эконометрика, машинное обучение, случайные процессы, прикладная микроэконометрика.
Цель освоения дисциплины
- получение навыков обработки и статистического анализа данных с применением специализированных компьютерных инструментов.
Планируемые результаты обучения
- владеть: - навыками сбора данных из структурированных и неструктурированных источников - навыками обработки данных - навыками визуализации данных
- знать: - синтаксис языков программирования Python и R - основные принципы обработки и визуализации данных - описание стандартных библиотек для сбора и обработки данных
- уметь: - решать простые алгоритмические задачи - извлекать информацию из внешних источников в автоматическом режиме - обрабатывать информацию средствами стандартных библиотек
Содержание учебной дисциплины
- Базовые понятия программирования. Переменные, операторы, управляющие конструкции, циклы.
- Типы данных в Python. Функции и элементы функционального программирования.
- Извлечение данных из различных источников (HTML, XML, CSV, JSON).
- Дескриптивная статистика. Построение графиков и диаграмм в Python и R
- Математические инструменты Python. Библиотеки numpy и Scipy
- Статистические инструменты Python. Библиотеки pandas, Statsmodels, scikit-learn.
- Введение в программирование на R. Типы данных и управляющие конструкции
- Работа с данными в R. Библиотека tidyverse и её компоненты. dplyr и tidyr.
- Визуализация данных в R. Библиотека ggplot2.
- Основы работы с базами данных. Язык запросов SQL
- Извлечение информации из текстов. Регулярные выражения
Промежуточная аттестация
- 2021/2022 учебный год 4 модуль0.6 * Домашние задания + 0.4 * Итоговый проект
Список литературы
Рекомендуемая основная литература
- Федоров Д. Ю. - ПРОГРАММИРОВАНИЕ НА ЯЗЫКЕ ВЫСОКОГО УРОВНЯ PYTHON 2-е изд. Учебное пособие для СПО - М.:Издательство Юрайт - 2019 - 161с. - ISBN: 978-5-534-11961-9 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/programmirovanie-na-yazyke-vysokogo-urovnya-python-446505
Рекомендуемая дополнительная литература
- Черткова Е. А. ; Под общ. ред. Чертковой Е.А. - СТАТИСТИКА. АВТОМАТИЗАЦИЯ ОБРАБОТКИ ИНФОРМАЦИИ 2-е изд., испр. и доп. Учебное пособие для вузов - М.:Издательство Юрайт - 2019 - 195с. - ISBN: 978-5-534-01429-7 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/statistika-avtomatizaciya-obrabotki-informacii-437242