• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Python for Data Extraction and Data Mining

2020/2021
Academic Year
RUS
Instruction in Russian
5
ECTS credits
Course type:
Compulsory course
When:
1 year, 4 module

Instructors


Бурданова Софья Павловна


Volkova, Anastasia

Программа дисциплины

Аннотация

Язык программирования Python является одним из самых простых в освоении и популярных языков программирования. Данный язык является мощным инструментом анализа данных и может повысить эффективность практически любой деятельности в науке и индустрии. С помощью языка Python можно автоматизировать рутинные операции и обрабатывать объемы данных, на несколько порядков превышающие объемы, доступные для обработки вручную или с помощью электронных таблиц. Данный курс направлен на знакомство с языком программирования Python. С использованием онлайн-курса "Python как иностранный".
Цель освоения дисциплины

Цель освоения дисциплины

  • Обучить студентов навыкам программирования на языке Python, а также базовым приёмам извлечения данных из сети интернет и различных типов файлов, и их обработки, необходимым для дальнейшего обучения и в работе по специальности.
Планируемые результаты обучения

Планируемые результаты обучения

  • Решает задачи на ввод-вывод и целочисленную арифметику
  • Решает задачи на работу с вещественными числами, применяет функции работы со строками
  • Применяет логические выражения, условный оператор, оператор цикла while
  • Применяет цикл for, функцию range, решает задачи с использованием локальных и глобальных переменных
  • Применяет списки, кортежи, множества, методы работы с отдельными элементами и всеми структурами
  • Умеет работать с текстом, структурированными файлами (csv), xlsx-файлами и листами в них
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Переменные и арифметические действия
    Ввод-вывод, естественные типы данных, строки и символы, форматированные строки
  • Логический тип данных и условный оператор
    Логические переменные, логические операции. Условный оператор, конструкции if-else, применение конструкции if…elif
  • Цикл while
    Цикл с условием, логические выражения в условии цикла while, бесконечный цикл, вложенные циклы while.
  • Введение в структурированные типы данных и цикл for
    Упорядоченные типы данных, работа с последовательностью. Использование цикла for для просмотра списков и кортежей, перебора индексов и числовых промежутков, редактирования списков. Вложенный for и хранение информации в нескольких списках
  • Методы
    Методы строк. Редактирование строки с помощью цикла for. Методы списков. Превращение строки в список. Срезы с параметрами.
  • Неупорядоченные типы данных
    Введение в неупорядоченные типы данных. Операции над множествами. Добавление элементов в словарь и поиск по словарю.
  • Вложенные структуры данных. Сортировки
    Словари списков. Сортировка, минимум и максимум последовательностей. Подсчёт статистики с помощью словарей. Сортировка, минимум и максимум словарей. Словари словарей
  • Функции
    Разбиение программы на функции. Использование библиотек
  • Текстовые файлы и таблицы
    Чтение из файла и запись в файл, работа с текстовыми файлами. Работа с csv-файлами, анализ числовых данных
  • Web-скрейпинг
    Введение в устройство сайтов. Запрос страницы из сети, подсчёт статистики употребления слов на странице сайта. Извлечение данных из таблиц
Элементы контроля

Элементы контроля

  • неблокирующий ДЗ1
    При оценке преподаватель руководствуется следующими критериями: - работоспособность программного кода (запуск программы без ошибок); - оформление программного кода; - соответствие работы описанным в задании условиям (в том числе: использование предложенных инструментов для решения поставленной задачи; прохождение присланным программным кодом тестов, проверяющих соответствие выхода программы ожидаемому выходу для набора тестовых примеров); - срок сдачи работы.
  • неблокирующий ДЗ2
    При оценке преподаватель руководствуется следующими критериями: - работоспособность программного кода (запуск программы без ошибок); - оформление программного кода; - соответствие работы описанным в задании условиям (в том числе: использование предложенных инструментов для решения поставленной задачи; прохождение присланным программным кодом тестов, проверяющих соответствие выхода программы ожидаемому выходу для набора тестовых примеров); - срок сдачи работы.
  • неблокирующий Аудиторная работа
  • неблокирующий Онлайн-курс
    Выставляется в соответствии со следующей схемой соответствия оценок по онлайн-курсу: 95-100% - 10; 85-94% -9; 75-84%- 8; 65-74% -7; 55-64% - 6; 45-54% -5; 35-44% -4.
  • неблокирующий Экзамен
    Для каждого задания в работе указано, сколько баллов получает студент при его полностью корректном выполнении. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.2 * Аудиторная работа + 0.2 * ДЗ1 + 0.2 * ДЗ2 + 0.2 * Онлайн-курс + 0.2 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392

Рекомендуемая дополнительная литература

  • Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081