• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2023/2024

Анализ данных

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 1-й курс, 1, 2 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Прогр. обучения: Прикладные модели искусственного интеллекта
Язык: русский
Кредиты: 6
Контактные часы: 60

Программа дисциплины

Аннотация

Цель освоения дисциплины состоит в изучении базовых статистических методов анализа данных и их практическом применении. В рамках курса предполагается углубленное изучение как механизмов языка python (ООП, элементы функционального программирования, исключения, менеджеры контекстов, генераторы, итераторы и т.д.), так и пользовательских библиотек (numpy, pandas, matplotlib, seaborn, beautiful, soup, lxml, selenium, scipy).
Цель освоения дисциплины

Цель освоения дисциплины

  • Цель курса — познакомить слушателей со сферой анализа данных, основными инструментами, задачами и методами, с которыми сталкивается исследователь данных в работе. В содержание курса включено знакомство с языком Python, разбор основных библиотек для анализа и визуализации данных Pandas, numpy, Matplotlib, прикладной статистический анализ данных, проверка статистических гипотез и работа с временными рядами. Для закрепления полученных теоретических знаний и ознакомления с современными методами анализа данных необходимо будет выполнить мини-проект по анализу данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Способен получать, очищать, анализировать и визуализировать большие объёмы данных
  • Способен реализовывать модели и алгоритмы прикладной математике в виде компьютерных программ
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в Python
  • Библиотека Numpy
    Д/З: написание типовых конструкций с использованием выражений-генераторов и функций.
  • Библиотека Pandas
    Д/З: написать программу для скачивания информации о самых популярных 5000 книг из раздела "Художественная литература" магазина "Relod" с использованием библиотек BeautifulSoup и/или lxml.
  • Визуализация данных
  • Углубленный Python. Часть 1
  • Углубленный Python. Часть 2
  • Парсинг данных с помощью Python
  • Введение в статистику - 1
    Д/З: Мини-проект по анализу данных
  • Введение в статистику - 2
  • Временные ряды
    Д/З: Kaggle Inclass
  • Введение в SQL
Элементы контроля

Элементы контроля

  • неблокирующий Коллоквиум
  • неблокирующий ДЗ
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 2 модуль
    0.7 * ДЗ + 0.2 * Коллоквиум + 0.1 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Provost, Foster, Fawcett, Tom. Data Science for Business: What you need to know about data mining and data-analytic thinking. – " O'Reilly Media, Inc.", 2013.
  • Python и анализ данных, Маккинли, У., 2015
  • Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Мэтиз Э. - Изучаем Python. Программирование игр, визуализация данных, веб-приложения. 2-е изд. - 978-5-4461-0479-6 - Санкт-Петербург: Питер - 2017 - 355480 - https://ibooks.ru/bookshelf/355480/reading - iBOOKS