• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2019/2020

Наука о данных

Направление: 38.03.01. Экономика
Когда читается: 2-й курс, 3, 4 модуль
Формат изучения: с онлайн-курсом
Преподаватели: Щуров Илья Валерьевич
Язык: русский
Кредиты: 6

Программа дисциплины

Аннотация

Изучение дисциплины «Наука о данных» базируется на следующих дисциплинах:  математический анализ;  линейная алгебра; Для освоения учебной дисциплины студенты должны владеть следующими знаниями и компетенциями:  знать основные понятия курса математический анализ  знать простейшие методы решения задач; Основные положения дисциплины должны быть использованы в дальнейшем при изучении следующих дисциплин: Эконометрика, машинное обучение, случайные процессы, прикладная микроэконометрика.
Цель освоения дисциплины

Цель освоения дисциплины

  • получение навыков обработки и статистического анализа данных с применением специализированных компьютерных инструментов.
Планируемые результаты обучения

Планируемые результаты обучения

  • знать: - синтаксис языков программирования Python и R - основные принципы обработки и визуализации данных - описание стандартных библиотек для сбора и обработки данных
  • уметь: - решать простые алгоритмические задачи - извлекать информацию из внешних источников в автоматическом режиме - обрабатывать информацию средствами стандартных библиотек
  • владеть: - навыками сбора данных из структурированных и неструктурированных источников - навыками обработки данных - навыками визуализации данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Базовые понятия программирования. Переменные, операторы, управляющие конструкции, циклы.
  • Типы данных в Python. Функции и элементы функционального программирования.
  • Извлечение данных из различных источников (HTML, XML, CSV, JSON).
  • Дескриптивная статистика. Построение графиков и диаграмм в Python и R
  • Математические инструменты Python. Библиотеки numpy и Scipy
  • Статистические инструменты Python. Библиотеки pandas, Statsmodels, scikit-learn.
  • Введение в программирование на R. Типы данных и управляющие конструкции
  • Работа с данными в R. Библиотека tidyverse и её компоненты. dplyr и tidyr.
  • Визуализация данных в R. Библиотека ggplot2.
  • Основы работы с базами данных. Язык запросов SQL
  • Извлечение информации из текстов. Регулярные выражения
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
  • неблокирующий Промежуточный проект
  • неблокирующий Итоговый проект
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.6 * Домашние задания + 0.2 * Итоговый проект + 0.2 * Промежуточный проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Федоров Д. Ю. - ПРОГРАММИРОВАНИЕ НА ЯЗЫКЕ ВЫСОКОГО УРОВНЯ PYTHON 2-е изд. Учебное пособие для СПО - М.:Издательство Юрайт - 2019 - 161с. - ISBN: 978-5-534-11961-9 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/programmirovanie-na-yazyke-vysokogo-urovnya-python-446505

Рекомендуемая дополнительная литература

  • Черткова Е. А. ; Под общ. ред. Чертковой Е.А. - СТАТИСТИКА. АВТОМАТИЗАЦИЯ ОБРАБОТКИ ИНФОРМАЦИИ 2-е изд., испр. и доп. Учебное пособие для вузов - М.:Издательство Юрайт - 2019 - 195с. - ISBN: 978-5-534-01429-7 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/statistika-avtomatizaciya-obrabotki-informacii-437242