Магистратура
2023/2024
Анализ данных
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Курс обязательный (Цифровые методы в гуманитарных науках)
Направление:
45.04.03. Фундаментальная и прикладная лингвистика
Кто читает:
Школа лингвистики
Где читается:
Факультет гуманитарных наук
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Сенина Анна Васильевна
Прогр. обучения:
Цифровые методы в гуманитарных науках
Язык:
русский
Кредиты:
6
Контактные часы:
64
Программа дисциплины
Аннотация
Дисциплина представляет собой вводный курс в Data Science на Python. В курсе рассматриваются основы синтаксиса Python, написание простых программ, работа с файлами, веб-скрейпинг. В ходе освоения курса студенты используют стандартные библиотеки Python, а также библиотеки для анализа данных, и учатся решать задачи гуманитарных дисциплин с помощью программирования. В рамках курса студенты учатся писать программы для решения поставленной преподавателем задачи и собственных исследовательских задач, читать и интерпретировать коды других исследователей. Курс включает в себя изучение необходимых для дальнейшей работы основ математики, прежде всего математической статистики, овладение необходимым инструментарием SPSS и Python; основных задач анализа данных и машинного обучения (регрессия, классификация, кластеризация), методы анализа текстовых данных.
Цель освоения дисциплины
- Освоить базовую статистику, овладеть навыками тестирования статистических гипотез, выбрать адекватные инструменты для анализа данных
Планируемые результаты обучения
- Уметь собирать данные для задач исследования, готовить их к анализу
- Уметь ставить статистические гипотезы применительно к данным, оценивать их распределение, интерпретировать результат
- Уметь реализовать самостоятельное исследование, выбрав и адаптировав статистические методы и инструменты анализа
Содержание учебной дисциплины
- Работа с данными
- Распределение данных
- Статистические исследования и проекты
Промежуточная аттестация
- 2023/2024 учебный год 4 модуль0.5 * Исследовательская работа + 0.2 * Критический анализ статистики в СМИ + 0.3 * Работа на семинарах
Список литературы
Рекомендуемая основная литература
- Alpina - 20004 - Б.Тирни; Д.Келлехер - Наука о данных: Базовый курс - 9785961433784 - Альпина Паблишер - 2020 - https://hse.alpinadigital.ru/book/20004
- Data Science. Наука о данных с нуля: Пер. с англ. — 2-е изд., перераб. и доп. - 978-5-9775-6731-2 - Грас Д. - 2021 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/356414 - 356414 - iBOOKS
- Python и анализ данных, Маккинни, У., 2015
- Введение в анализ данных : Учебник и практикум для бакалавриата и магистратуры, Миркин Б.Г., НИУ ВШЭ, 2017
- Введение в анализ данных : учебник и практикум для вузов, Миркин, Б. Г., 2015
- Дудин, М. Н. Статистика : учебник и практикум для вузов / М. Н. Дудин, Н. В. Лясников, М. Л. Лезина. — Москва : Издательство Юрайт, 2021. — 374 с. — (Высшее образование). — ISBN 978-5-9916-8908-3. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/470169 (дата обращения: 27.08.2024).
- Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Основы Data Science и Big Data. Python и наука о данных - 978-5-496-02517-1 - Дэви С., Арно М., Мохамед А. - 2017 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/354390 - 354390 - iBOOKS
- Практическая статистика для специалистов Data Science: Пер. с англ. - 978-5-9775-3974-6 - Брюс П. - 2018 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/358886 - 358886 - iBOOKS
- Прикладная статистика : учебное пособие, Ганичева, А. В., 2021
- Салин, В. Н., Наука о данных и статистика в образовании будущего : научное издание / В. Н. Салин, ; под ред. В. Н. Салина. — Москва : Русайнс, 2021. — 300 с. — ISBN 978-5-4365-8765-3. — URL: https://book.ru/book/942063 (дата обращения: 27.08.2024). — Текст : электронный.
- Теория вероятностей и математическая статистика : учебник для вузов, Гмурман, В. Е., 2021
Рекомендуемая дополнительная литература
- Kotu, V., & Deshpande, B. (2019). Data Science : Concepts and Practice (Vol. Second edition). Cambridge, MA: Morgan Kaufmann. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1866160
- Python для сложных задач: наука о данных и машинное обучение - 978-5-496-03068-7 - Плас Дж. Вандер - 2018 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/356721 - 356721 - iBOOKS
- Практическая статистика для специалистов Data Science : 50 важнейших понятий: пер. с англ., Брюс, П., 2018
- Статистика и котики, Савельев, В. В., 2018