• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2022/2023

Python для сбора и анализа данных

Статус: Дисциплина общефакультетского пула
Когда читается: 3, 4 модуль
Охват аудитории: для своего кампуса
Язык: английский
Кредиты: 3
Контактные часы: 32

Course Syllabus

Abstract

Course is an optional one module course. During this course students will learn basics of programming, methods to process and visualize qualitative and quantitative data, and approaches to retrieving information from the Internet using web scraping and API requests. The ultimate goal of the course is to provide students with techniques useful for data collection, data visualization and exploratory data analysis. The course is taught in two languages: Russian and English. Classes will be taught in Russian, and materials will be available in both Russian and English. Course prerequisites: No special requirements.
Learning Objectives

Learning Objectives

  • The course is aimed at developing basic programming skills, learning methods of data processing and visualization using Python libraries, learning methods of collecting data from the Web.
Expected Learning Outcomes

Expected Learning Outcomes

  • Apply knowledge of different data structures to solve practical problems.
  • Apply methods of data processing and exploratory analysis using Pandas.
  • Collect data from the Internet via web scraping and API requests.
  • Use conditional structures, loops and functions to work with real data.
  • Visualize qualitative and quantitative data using graphical Python libraries.
  • Work in Jupyter Notebook, use interactive widgets and other elements of interaction with users.
Course Contents

Course Contents

  • Introduction to Python
  • Data structures in Python: lists, tuples, dictionaries
  • Control structures and functions in Python
  • Working with data frames in Python with libraries NumPy and Pandas
  • Data visualization with graphical Python libraries
  • Collecting data from the Web using Python
Assessment Elements

Assessment Elements

  • non-blocking homeworks
  • non-blocking final project
    For the final project students are expected to write a program of practical use that includes requesting some input from a user, retrieving data from the Internet and processing these data. For the final project students should submit two files: a file with Python code (ipynb-file or py-file), and a file with documentation for this code that describes its aims, usage and limitations. Project can be done individually or in groups up to 3 people.
  • non-blocking Test
    Test includes multiple choice questions on basic Python syntax and standard data structures. During the test students are not allowed to execute the code or use any materials, it is a 30-minute paper-based test. The score for the test is transferred to the 10-point scale grade.
Interim Assessment

Interim Assessment

  • 2022/2023 4th module
    0.4 * final project + 0.4 * homeworks + 0.2 * Test
Bibliography

Bibliography

Recommended Core Bibliography

  • Python Data Analytics поможет вам освоить мир сбора и анализа данных, используя всю мощь языка Python. В основе этой книги лежит описание pandas, библиотеки с открытым исходным кодом, лицензированной BSD, обеспечивающей высокопроизводительные, простые в использовании структуры данных и инструменты анализа данных для языка программирования Python. Автор Фабио Нелли мастерски демонстрирует силу языка программирования Python в применении к обработке, управлению и извлечению информации. Внутри вы увидите, насколько интуитивно понятным и гибким является обнаружение и передача значимых шаблонов данных с помощью скриптов Python, систем отчетности и экспорта данных. В этой книге рассматривается, как получать, обрабатывать, хранить, управлять и анализировать данные с помощью языка программирования Python. Вы будете использовать Python и другие инструменты с открытым исходным кодом для обработки данных и выявления интересных и важных тенденций в этих данных, которые позволят вам предсказывать будущее. узоры. Независимо от того, имеете ли вы дело с данными продаж, инвестиционными данными (акции, облигации и т. Д.), Медицинскими данными, использованием веб-страниц или любым другим типом набора данных, Python можно использовать для интерпретации, анализа и сбора информации из кучи числа и статистика. Эта книга является бесценным справочником с примерами хранения и доступа к данным в базе данных; он проведет вас через процесс создания отчета; в нем представлены три практических примера или примера, которые вы можете взять с собой для повседневного анализа.

Recommended Additional Bibliography

  • G. Nair, V. (2014). Getting Started with Beautiful Soup. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=691839