• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2019/2020

Python для извлечения и обработки данных

Статус: Курс обязательный (Медиакоммуникации)
Направление: 42.03.05. Медиакоммуникации
Когда читается: 1-й курс, 4 модуль
Формат изучения: Blended
Преподаватели: Куприянов Александр Михайлович, Лебедева Валентина Алексеевна, Чуйкин Николай Константинович, Якунина Анастасия Димитриевна
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Язык программирования Python является одним из самых простых в освоении и популярных языков программирования. Данный язык является мощным инструментом анализа данных и может повысить эффективность практически любой деятельности в науке и индустрии. С помощью языка Python можно автоматизировать рутинные операции и обрабатывать объемы данных, на несколько порядков превышающие объемы, доступные для обработки вручную или с помощью электронных таблиц. С использованием онлайн-курса "Python для извлечения и обработки данных" [URL: https://openedu.ru/course/hse/PYTHON/].
Цель освоения дисциплины

Цель освоения дисциплины

  • Обучить студентов навыкам программирования на языке Python, а также базовым приёмам извлечения данных из сети интернет и различных типов файлов, и их обработки, необходимым для дальнейшего обучения и в работе по специальности
Планируемые результаты обучения

Планируемые результаты обучения

  • Решает задачи на ввод-вывод и целочисленную арифметику
  • Применяет логические выражения, условный оператор, оператор цикла while
  • Решает задачи на работу с вещественными числами, применяет функции работы со строками
  • Применяет цикл for, функцию range, решает задачи с использованием локальных и глобальных переменных
  • Применяет словари, множества, методы работы с отдельными элементами и всеми структурами
  • Умеет работать с текстом, файлами csv, электронными таблицами xlsx и листами в них
  • Знает основы HTML, получает ресурсы по URL-адресу, использует библиотеки для обработки HTML
  • Размечает данные с помощью XML, умеет получать геоданные
  • Обрабатывает данные в формате json, работает с публичным интерфейсом API
  • Визуализирует графики с использованием pyplot, отображает картографическую информацию с помощью API leaflet
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Арифметика
    Ввод-вывод и целочисленная арифметика
  • Условный оператор, цикл while
    Логические выражения и условный оператор, оператор цикла while
  • Вещественные числа и строки
    Работа с вещественными числами, функции работы со строками, срезы
  • Цикл for, функции
    Цикл for, функция range, функции, локальные и глобальные переменные
  • Словари и множества
    Словари, множества, методы работы с отдельными элементами и всеми структурами
  • Обработка текстовых файлов и электронных таблиц
    Работа с текстом, файлами csv, электронные таблицы xlsx и листы в них, доступ к ячейкам, чтение и запись
  • Обработка и создание HTML-страниц
    Основы HTML, получение ресурсов по URL-адресу, использование библиотек для обработки HTML
  • XML и передача параметров в URL
    Разметка данных с помощью XML, примеры XML, геоданные OpenStreetMap и их получение
  • json и API
    Обработка данных в формате json, работа с публичным интерфейсом API
  • Визуализация данных
    Визуализация графиков с использованием pyplot, отображение картографической информации с помощью API leaflet
Элементы контроля

Элементы контроля

  • неблокирующий Оценка онлайн курса
    Онлайн-курс "Python для извлечения и обработки данных" [URL: https://openedu.ru/course/hse/PYTHON/].
  • неблокирующий Экзамен
    Экзамен проводится в письменной форме с использованием синхронного прокторинга. Экзамен проводится на платформе Онлайн-образование в НИУ ВШЭ (https://online.hse.ru/), прокторинг на платформе Экзамус (https://hse.student.examus.net). К экзамену необходимо подключиться за 15 минут. На платформе Экзамус доступно тестирование системы. Компьютер студента должен удовлетворять следующим требованиям: https://elearning.hse.ru/data/2020/05/07/1544135594/Технические%20требования%20к%20ПК%20студента.pdf) Для участия в экзамене студент обязан: заранее зайти на платформу прокторинга, провести тест системы, включить камеру и микрофон, подтвердить личность. Во время экзамена студентам запрещено: общаться (в социальных сетях, с людьми в комнате), списывать. Во время экзамена студентам разрешено: пользоваться конспектом курса М.С. Густокашина, опубликованном на платформе OpenEdu; использовать среды разработки, в том числе и онлайн, без использования заготовок. Кратковременным нарушением связи во время экзамена считается прерывание связи не более 5 минут. Долговременным нарушением связи во время экзамена считается прерывание связи 5 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи. По просьбе студента вместо выполнения экзамена, в качестве оценки за экзамен может быть проставлена средняя оценка за самостоятельные работы, но при этом итоговая оценка не должна получаться более 7 баллов, студент может согласиться на итоговую оценку 7 или сдавать экзамен в общем порядке.
  • неблокирующий Самостоятельная работа 1
    Практическая задача и/или тест на практическом занятии
  • неблокирующий Самостоятельная работа 2
    Практическая задача и/или тест на практическом занятии
  • неблокирующий Самостоятельная работа 3
    Практическая задача и/или тест на практическом занятии
  • неблокирующий Самостоятельная работа 4
    Практическая задача и/или тест на практическом занятии
  • неблокирующий Самостоятельная работа 5
    Практическая задача и/или тест на практическом занятии
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.2 * Оценка онлайн курса + 0.08 * Самостоятельная работа 1 + 0.08 * Самостоятельная работа 2 + 0.08 * Самостоятельная работа 3 + 0.08 * Самостоятельная работа 4 + 0.08 * Самостоятельная работа 5 + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392

Рекомендуемая дополнительная литература

  • Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081