• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2021/2022

Python для сбора и анализа данных

Язык: русский
Кредиты: 3
Контактные часы: 24

Программа дисциплины

Аннотация

Дисциплина Python для сбора и анализа данных имеет целью обучить студентов не только работе в Python, но и основам программирования вообще, поскольку наиболее базовые принципы являются схожими почти во всех языках программирования. При решении ряда задач исследователи часто сталкиваются с необходимостью работать с большими массивами данных. Характер данных может быть очень разным: политологические индексы, посчитанные для разных стран, социально-экономические показатели по регионам России и муниципальным образованиям, тексты законопроектов и инициатив, тексты пользователей в социальных сетях. Для того чтобы эффективно работать с разными типами данных, необходимо знать основы программирования, так как именно навыки программирования позволяют автоматически собирать необходимую информацию за достаточно быстрое время. В качестве языка программирования в данном курсе используется Python. Язык Python на данный момент является очень популярным, в том числе в исследованиях в рамках социальных наук. Дисциплина подразделяется на два блока. Первый блок посвящен основам программирования и включает необходимые для дальнейшей работы в Python темы: переменные и типы данных, списки и кортежи, словари, условные конструкции, циклы и функции. Второй блок посвящен решению прикладных задач в Python и включает темы, связанные со сбором и анализом данных: выгрузка данных с сайтов, парсинг веб-страниц, работа с таблицами, визуализация и разведывательный анализ данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Развитие навыков анализа данных с использованием современных программных средств для проведения исследований.
Планируемые результаты обучения

Планируемые результаты обучения

  • Уметь провести описательный анализ данных
  • Уметь провести графический анализ данных
  • Уметь провести анализ взаимосвязей переменных и представить его результаты в виде, доступном для широкой аудитории
  • Уметь провести сбор данных с веб-страниц и представить их в структурированном виде
  • Уметь работать с разными типами файлов и данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Типы данных и переменные.
  • Описательный анализ данных.
  • Работа с данными. Типы файлов. Режимы доступа к файлу. Чтение файла.
  • Графический анализ данных
  • Анализ взаимосвязей переменных.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
  • неблокирующий Самостоятельная работа
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 4 модуль
    0.5 * Самостоятельная работа + 0.5 * Домашнее задание
Список литературы

Список литературы

Рекомендуемая основная литература

  • Маккинни, У. Python и анализ данных / У. Маккинни ; перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Северенс, Ч. Введение в программирование на Python : учебное пособие / Ч. Северенс. — 2-е изд. — Москва : ИНТУИТ, 2016. — 231 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100703 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Бонцанини, М. Анализ социальных медиа на Python. Извлекайте и анализируйте данные из всех уголков социальной паутины на Python / М. Бонцанини ; перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2018. — 288 с. — ISBN 978-5-97060-574-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/108129 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.