Бакалавриат
2019/2020
Python для извлечения и обработки данных
Статус:
Курс обязательный (Медиакоммуникации)
Направление:
42.03.05. Медиакоммуникации
Где читается:
Факультет креативных индустрий
Когда читается:
2-й курс, 3 модуль
Формат изучения:
с онлайн-курсом
Преподаватели:
Карпов Максим Евгеньевич,
Куприянов Александр Михайлович,
Куприянов Юрий Владимирович,
Чуйкин Николай Константинович,
Якунина Анастасия Димитриевна
Язык:
русский
Кредиты:
3
Контактные часы:
12
Программа дисциплины
Аннотация
Язык программирования Python является одним из самых простых в освоении и популярных языков программирования. Данный язык является мощным инструментом анализа данных и может повысить эффективность практически любой деятельности в науке и индустрии. С помощью языка Python можно автоматизировать рутинные операции и обрабатывать объемы данных, на несколько порядков превышающие объемы, доступные для обработки вручную или с помощью электронных таблиц. С использованием онлайн-курса "Python для извлечения и обработки данных" [URL: https://openedu.ru/course/hse/PYTHON/].
Цель освоения дисциплины
- Обучить студентов навыкам программирования на языке Python, а также базовым приёмам извлечения данных из сети интернет и различных типов файлов, и их обработки, необходимым для дальнейшего обучения и в работе по специальности
Планируемые результаты обучения
- Решает задачи на ввод-вывод и целочисленную арифметику
- Применяет логические выражения, условный оператор, оператор цикла while
- Решает задачи на работу с вещественными числами, применяет функции работы со строками
- Применяет цикл for, функцию range, решает задачи с использованием локальных и глобальных переменных
- Применяет списки, кортежи, множества, методы работы с отдельными элементами и всеми структурами
- Умеет работать с текстом, структурированными файлами (csv), xlsx-файлами и листами в них
- Знает основы HTML, получает ресурсы по URL-адресу, использует библиотеки для обработки HTML
- Размечает данные с помощью XML, умеет получать геоданные
- Обрабатывает данные в формате json, работает с публичным интерфейсом API
- Визуализирует графики с использованием pyplot, отображает картографическую информацию с помощью API leaflet
Содержание учебной дисциплины
- АрифметикаВвод-вывод и целочисленная арифметика
- Условный оператор, цикл whileЛогические выражения и условный оператор, оператор цикла while
- Вещественные числа и строкиРабота с вещественными числами, функции работы со строками, срезы
- Цикл for, функцииЦикл for, функция range, функции, локальные и глобальные переменные
- Словари и множестваСловари, множества, методы работы с отдельными элементами и всеми структурами
- Обработка текстовых файлов и электронных таблицРабота с текстом, файлами csv, электронные таблицы xlsx и листы в них, доступ к ячейкам, чтение и запись
- Обработка и создание HTML-страницОсновы HTML, получение ресурсов по URL-адресу, использование библиотек для обработки HTML
- XML и передача параметров в URLРазметка данных с помощью XML, примеры XML, геоданные OpenStreetMap и их получение
- json и APIОбработка данных в формате json, работа с публичным интерфейсом API
- Визуализация данныхВизуализация графиков с использованием pyplot, отображение картографической информации с помощью API leaflet
Элементы контроля
- Оценка онлайн курсаОнлайн-курс "Python для извлечения и обработки данных" [URL: https://openedu.ru/course/hse/PYTHON/].
- ЭкзаменЭкзамен проводится в письменной форме с использованием синхронного прокторинга. Экзамен проводится на платформе Онлайн-образование в НИУ ВШЭ (https://online.hse.ru/), прокторинг на платформе Экзамус (https://hse.student.examus.net). К экзамену необходимо подключиться за 15 минут. На платформе Экзамус доступно тестирование системы. Компьютер студента должен удовлетворять следующим требованиям: https://elearning.hse.ru/data/2020/05/07/1544135594/Технические%20требования%20к%20ПК%20студента.pdf) Для участия в экзамене студент обязан: заранее зайти на платформу прокторинга, провести тест системы, включить камеру и микрофон, подтвердить личность. Во время экзамена студентам запрещено: общаться (в социальных сетях, с людьми в комнате), списывать. Во время экзамена студентам разрешено: пользоваться конспектом курса М.С. Густокашина, опубликованном на платформе OpenEdu; использовать среды разработки, в том числе и онлайн, без использования заготовок. Кратковременным нарушением связи во время экзамена считается прерывание связи не более 5 минут. Долговременным нарушением связи во время экзамена считается прерывание связи 5 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи.
- Самостоятельная работа 1Практическая задача и/или тест на практическом занятии
- Самостоятельная работа 2Практическая задача и/или тест на практическом занятии
- Самостоятельная работа 3Практическая задача и/или тест на практическом занятии
- Самостоятельная работа 4Практическая задача и/или тест на практическом занятии
- Самостоятельная работа 5Практическая задача и/или тест на практическом занятии
Промежуточная аттестация
- Промежуточная аттестация (3 модуль)0.2 * Оценка онлайн курса + 0.08 * Самостоятельная работа 1 + 0.08 * Самостоятельная работа 2 + 0.08 * Самостоятельная работа 3 + 0.08 * Самостоятельная работа 4 + 0.08 * Самостоятельная работа 5 + 0.4 * Экзамен
Список литературы
Рекомендуемая основная литература
- Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392
Рекомендуемая дополнительная литература
- Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081