• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2022/2023

Анализ данных

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс обязательный (Цифровые методы в гуманитарных науках)
Направление: 45.04.03. Фундаментальная и прикладная лингвистика
Когда читается: 1-й курс, 3, 4 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 30
Охват аудитории: для своего кампуса
Преподаватели: Сенина Анна Васильевна
Прогр. обучения: Цифровые методы в гуманитарных науках
Язык: русский
Кредиты: 6
Контактные часы: 64

Программа дисциплины

Аннотация

Дисциплина представляет собой вводный курс в Data Science на Python. В курсе рассматриваются основы синтаксиса Python, написание простых программ, работа с файлами, веб-скрейпинг. В ходе освоения курса студенты используют стандартные библиотеки Python, а также библиотеки для анализа данных, и учатся решать задачи гуманитарных дисциплин с помощью программирования. В рамках курса студенты учатся писать программы для решения поставленной преподавателем задачи и собственных исследовательских задач, читать и интерпретировать коды других исследователей. Курс включает в себя изучение необходимых для дальнейшей работы основ математики, прежде всего математической статистики, овладение необходимым инструментарием SPSS и Python; основных задач анализа данных и машинного обучения (регрессия, классификация, кластеризация), методы анализа текстовых данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Освоить базовую статистику, овладеть навыками тестирования статистических гипотез, выбрать адекватные инструменты для анализа данных
Планируемые результаты обучения

Планируемые результаты обучения

  • Уметь собирать данные для задач исследования, готовить их к анализу
  • Уметь ставить статистические гипотезы применительно к данным, оценивать их распределение, интерпретировать результат
  • Уметь реализовать самостоятельное исследование, выбрав и адаптировав статистические методы и инструменты анализа
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Работа с данными
  • Распределение данных
  • Статистические исследования и проекты
Элементы контроля

Элементы контроля

  • неблокирующий Исследовательская работа
  • неблокирующий Критический анализ статистики в СМИ
  • неблокирующий Работа на семинарах
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.5 * Исследовательская работа + 0.3 * Работа на семинарах + 0.2 * Критический анализ статистики в СМИ
Список литературы

Список литературы

Рекомендуемая основная литература

  • 20004 - Б.Тирни; Д.Келлехер - Наука о данных: Базовый курс - 9785961433784 - Alpina - Альпина Паблишер - 2020 - https://hse.alpinadigital.ru/book/20004
  • Python и анализ данных, Маккинли, У., 2015
  • Брюс П. - Практическая статистика для специалистов Data Science: Пер. с англ. - 978-5-9775-3974-6 - Санкт-Петербург: БХВ-Петербург - 2018 - 358886 - https://ibooks.ru/bookshelf/358886/reading - iBOOKS
  • Введение в анализ данных : Учебник и практикум для бакалавриата и магистратуры, Миркин Б.Г., НИУ ВШЭ, 2017
  • Введение в анализ данных : учебник и практикум для вузов, Миркин, Б. Г., 2015
  • Грас Д. - Data Science. Наука о данных с нуля: Пер. с англ. — 2-е изд., перераб. и доп. - 978-5-9775-6731-2 - Санкт-Петербург: БХВ-Петербург - 2021 - 356414 - https://ibooks.ru/bookshelf/356414/reading - iBOOKS
  • Дудин, М. Н.  Статистика : учебник и практикум для вузов / М. Н. Дудин, Н. В. Лясников, М. Л. Лезина. — Москва : Издательство Юрайт, 2021. — 374 с. — (Высшее образование). — ISBN 978-5-9916-8908-3. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/470169 (дата обращения: 28.08.2023).
  • Дэви С., Арно М., Мохамед А. - Основы Data Science и Big Data. Python и наука о данных - 978-5-496-02517-1 - Санкт-Петербург: Питер - 2017 - 354390 - https://ibooks.ru/bookshelf/354390/reading - iBOOKS
  • Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Прикладная статистика : учебное пособие, Ганичева, А. В., 2021
  • Салин, В. Н., Наука о данных и статистика в образовании будущего : научное издание / В. Н. Салин. — Москва : Русайнс, 2021. — 300 с. — ISBN 978-5-4365-8765-3. — URL: https://book.ru/book/942063 (дата обращения: 25.08.2023). — Текст : электронный.
  • Теория вероятностей и математическая статистика : учебник для вузов, Гмурман, В. Е., 2021

Рекомендуемая дополнительная литература

  • Kotu, V., & Deshpande, B. (2019). Data Science : Concepts and Practice (Vol. Second edition). Cambridge, MA: Morgan Kaufmann. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1866160
  • Плас Дж. Вандер - Python для сложных задач: наука о данных и машинное обучение - 978-5-496-03068-7 - Санкт-Петербург: Питер - 2018 - 356721 - https://ibooks.ru/bookshelf/356721/reading - iBOOKS
  • Практическая статистика для специалистов Data Science : 50 важнейших понятий: пер. с англ., Брюс, П., 2018
  • Статистика и котики, Савельев, В. В., 2018