• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2020/2021

Python для извлечения и обработки данных

Статус: Курс обязательный (Журналистика)
Направление: 42.03.02. Журналистика
Когда читается: 2-й курс, 3 модуль
Формат изучения: с онлайн-курсом
Преподаватели: Бурова Маргарита Борисовна, Куприянов Александр Михайлович, Рогович Татьяна Владимировна
Язык: русский
Кредиты: 3
Контактные часы: 24

Программа дисциплины

Аннотация

Язык программирования Python является одним из самых простых в освоении и популярных языков программирования. Данный язык является мощным инструментом анализа данных и может повысить эффективность практически любой деятельности в науке и индустрии. С помощью языка Python можно автоматизировать рутинные операции и обрабатывать объемы данных, на несколько порядков превышающие объемы, доступные для обработки вручную или с помощью электронных таблиц. С использованием онлайн-курса, размещенного на online.hse.ru
Цель освоения дисциплины

Цель освоения дисциплины

  • Обучить студентов навыкам программирования на языке Python, а также базовым приёмам извлечения данных из сети интернет и различных типов файлов, и их обработки, необходимым для дальнейшего обучения и в работе по специальности
Планируемые результаты обучения

Планируемые результаты обучения

  • Обладает навыками web-scraping
  • Умеет работать с текстом, структурированными файлами (csv)
  • Применяет списки, кортежи, множества, словари, методы работы с отдельными элементами и всеми структурами
  • Применяет цикл for, функцию range, решает задачи с использованием локальных и глобальных переменных
  • Решает задачи на работу с вещественными числами, применяет функции работы со строками
  • Решает задачи на ввод-вывод и целочисленную арифметику
  • Применяет логические выражения, условный оператор, оператор цикла while
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в программирование. Переменные и арифметические действия.
    Ввод-вывод. Естественные типы данных и арифметические действия. Строки и символы. Форматированные строки.
  • Условный оператор, цикл while
    Блок-схемы и логические переменные. Логические выражения. Условный оператор, оператор цикла while
  • Введение в структурированные данные и цикл for
    Списки и кортежи. Цикл for, функция range.
  • Методы строк и списков
    Срезы. Поиск в строке. Основные методы списков. Преобразование строк в списки.
  • Словари и множества
    Словари, множества, методы работы с отдельными элементами и всеми структурами
  • Функции и библиотеки
    Написание собственных функций. Разбиение программы на функции. Локальные переменные. Загрузка функций из специализированных библиотек.
  • Текстовые файлы и таблицы
    Чтение из файла и запись в файл. Работа с текстовыми файлами. Работа со структурированными файлами (csv).
  • Обработка web-страниц
    Основы HTML, загрузка и обработка web-страниц, работа с тегами HTML, обработка ссылок и таблиц.
Элементы контроля

Элементы контроля

  • неблокирующий Онлайн курс
  • неблокирующий Экзамен
    Экзамен проводится онлайн в письменной форме с использованием прокторинга. Экзамен проводится на платформе Онлайн-образование в НИУ ВШЭ (https://online.hse.ru/), прокторинг на платформе Экзамус (https://hse.student.examus.net).
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (3 модуль)
    0.3 * Онлайн курс + 0.7 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392

Рекомендуемая дополнительная литература

  • Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081