• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2023/2024

Анализ данных с использованием Python

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс обязательный (Клеточная и молекулярная биотехнология)
Направление: 06.03.01. Биология
Когда читается: 2-й курс, 1, 2 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Преподаватели: Жиянов Антон Павлович, Кириллов Иван Дмитриевич
Язык: русский
Кредиты: 3
Контактные часы: 30

Программа дисциплины

Аннотация

Курс «Анализ данных с использованием Python» имеет целью обучить студентов не только работе в Python, но и основам программирования вообще, поскольку наиболее базовые принципы являются схожими почти во всех языках программированияю При решении ряда задач исследователи часто сталкиваются с необходимостью работать с большими массивами данных. Характер данных может быть очень разным: последовательности нуклеиновых кислот (ДНК, РНК), аминокислот (белки). Для того чтобы эффективно работать с разными типами данных, необходимо знать основы программирования, так как именно навыки программирования позволяют автоматически собирать необходимую информацию за достаточно быстрое время. В качестве языка программирования в данном курсе используется Python. Язык Python на данный момент является очень популярным, в том числе в исследованиях в рамках естественных наук. Дисциплина подразделяется на два блока. Первый блок посвящен основам программирования и включает необходимые для дальнейшей работы в Python темы: переменные и типы данных, списки и кортежи, множества, словари, условные конструкции, циклы и функции. Второй блок посвящен решению прикладных задач в Python и включает темы, связанные со сбором и анализом данных: выгрузка данных с сайтов, парсинг веб-страниц, работа с таблицами, визуализация и разведывательный анализ данных, а также эффективная работа с текстом, поскольку именно с таким форматом данных студентам придется работать больше всего в дальнейшем, и использования машинного обучения. Базовые навыки программирования позволят работать с биологическими данными различного уровня и размеров эффективнее и уже сегодня являются достаточно востребованными навыками у специалистов естественнонаучного профиля.
Цель освоения дисциплины

Цель освоения дисциплины

  • Овладение навыками программирования на языке Python
  • Овладение методами сбора и обработки данных для решения задач анализа биологических последовательностей и биологической статистики
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает этапы предварительной обработки текста и умеет реализовывать их на практике
  • Умеет выполнять операции с массивами NumPy
  • Знает особенности изменяемых и неизменяемых типов данных; умеет создавать разные структуры данных
  • Умеет выполнять базовые операции с табличными данными средствами Python
  • Умеет загружать файлы с данными разных форматов и экспортировать их
  • Умеет писать функции на Python, тестировать их, обрабатывать ошибки
  • Умеет работать в среде Jupyter Notebook, умеет создавать переменные разных типов, принимать информацию от пользователя и выводить информацию на экран
  • Умеет решать прикладные задачи с применением условных конструкций и циклов
  • Знает особенности типов и структур данных в Python: int, float, bool, str, list, tuple, set, dict, вложенные структуры
  • Умеет визуализировать результаты исследований с помощью Matplotlib, seaborn
  • Умеет выгружать данные с веб-страниц
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Начало работы в Python
  • Структуры данных в Python
  • Управляющие конструкции и циклы в Python
  • Функции и работа с файлами в Python
  • Работа с текстами
  • Массивы NumPy и таблицы pandas
  • Визуализация при помощи Matplotlib, seaborn
  • Работа с html-файлами
Элементы контроля

Элементы контроля

  • неблокирующий Лекционные домашние задания
  • неблокирующий Тесты
  • неблокирующий Семинарские домашние задания
  • неблокирующий Участие в лайв-кодинге
  • неблокирующий Экзамен
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 1 модуль
    0.15 * Лекционные домашние задания + 0.25 * Семинарские домашние задания + 0.1 * Тесты + 0.1 * Участие в лайв-кодинге + 0.4 * Экзамен
  • 2023/2024 учебный год 2 модуль
    0.15 * Лекционные домашние задания + 0.25 * Семинарские домашние задания + 0.1 * Тесты + 0.1 * Участие в лайв-кодинге + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Nelli, F. (2018). Python Data Analytics : With Pandas, NumPy, and Matplotlib (Vol. Second edition). New York, NY: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1905344
  • Федоров, Д. Ю.  Программирование на языке высокого уровня Python : учебное пособие для среднего профессионального образования / Д. Ю. Федоров. — 4-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2023. — 214 с. — (Профессиональное образование). — ISBN 978-5-534-15731-4. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/510042 (дата обращения: 28.08.2023).

Рекомендуемая дополнительная литература

  • G. Nair, V. (2014). Getting Started with Beautiful Soup. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=691839