Магистратура
2022/2023
Анализ данных
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Цифровые методы в гуманитарных науках)
Направление:
45.04.03. Фундаментальная и прикладная лингвистика
Кто читает:
Школа лингвистики
Где читается:
Факультет гуманитарных наук
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
30
Охват аудитории:
для своего кампуса
Преподаватели:
Сенина Анна Васильевна
Прогр. обучения:
Цифровые методы в гуманитарных науках
Язык:
русский
Кредиты:
6
Контактные часы:
64
Программа дисциплины
Аннотация
Дисциплина представляет собой вводный курс в Data Science на Python. В курсе рассматриваются основы синтаксиса Python, написание простых программ, работа с файлами, веб-скрейпинг. В ходе освоения курса студенты используют стандартные библиотеки Python, а также библиотеки для анализа данных, и учатся решать задачи гуманитарных дисциплин с помощью программирования. В рамках курса студенты учатся писать программы для решения поставленной преподавателем задачи и собственных исследовательских задач, читать и интерпретировать коды других исследователей. Курс включает в себя изучение необходимых для дальнейшей работы основ математики, прежде всего математической статистики, овладение необходимым инструментарием SPSS и Python; основных задач анализа данных и машинного обучения (регрессия, классификация, кластеризация), методы анализа текстовых данных.
Цель освоения дисциплины
- Освоить базовую статистику, овладеть навыками тестирования статистических гипотез, выбрать адекватные инструменты для анализа данных
Планируемые результаты обучения
- Уметь собирать данные для задач исследования, готовить их к анализу
- Уметь ставить статистические гипотезы применительно к данным, оценивать их распределение, интерпретировать результат
- Уметь реализовать самостоятельное исследование, выбрав и адаптировав статистические методы и инструменты анализа
Содержание учебной дисциплины
- Работа с данными
- Распределение данных
- Статистические исследования и проекты
Промежуточная аттестация
- 2022/2023 учебный год 4 модуль0.5 * Исследовательская работа + 0.3 * Работа на семинарах + 0.2 * Критический анализ статистики в СМИ
Список литературы
Рекомендуемая основная литература
- 20004 - Б.Тирни; Д.Келлехер - Наука о данных: Базовый курс - 9785961433784 - Alpina - Альпина Паблишер - 2020 - https://hse.alpinadigital.ru/book/20004
- Python и анализ данных, Маккинли, У., 2015
- Брюс П. - Практическая статистика для специалистов Data Science: Пер. с англ. - 978-5-9775-3974-6 - Санкт-Петербург: БХВ-Петербург - 2018 - 358886 - https://ibooks.ru/bookshelf/358886/reading - iBOOKS
- Введение в анализ данных : Учебник и практикум для бакалавриата и магистратуры, Миркин Б.Г., НИУ ВШЭ, 2017
- Введение в анализ данных : учебник и практикум для вузов, Миркин, Б. Г., 2015
- Грас Д. - Data Science. Наука о данных с нуля: Пер. с англ. — 2-е изд., перераб. и доп. - 978-5-9775-6731-2 - Санкт-Петербург: БХВ-Петербург - 2021 - 356414 - https://ibooks.ru/bookshelf/356414/reading - iBOOKS
- Дудин, М. Н. Статистика : учебник и практикум для вузов / М. Н. Дудин, Н. В. Лясников, М. Л. Лезина. — Москва : Издательство Юрайт, 2021. — 374 с. — (Высшее образование). — ISBN 978-5-9916-8908-3. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/470169 (дата обращения: 28.08.2023).
- Дэви С., Арно М., Мохамед А. - Основы Data Science и Big Data. Python и наука о данных - 978-5-496-02517-1 - Санкт-Петербург: Питер - 2017 - 354390 - https://ibooks.ru/bookshelf/354390/reading - iBOOKS
- Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Прикладная статистика : учебное пособие, Ганичева, А. В., 2021
- Салин, В. Н., Наука о данных и статистика в образовании будущего : научное издание / В. Н. Салин. — Москва : Русайнс, 2021. — 300 с. — ISBN 978-5-4365-8765-3. — URL: https://book.ru/book/942063 (дата обращения: 25.08.2023). — Текст : электронный.
- Теория вероятностей и математическая статистика : учебник для вузов, Гмурман, В. Е., 2021
Рекомендуемая дополнительная литература
- Kotu, V., & Deshpande, B. (2019). Data Science : Concepts and Practice (Vol. Second edition). Cambridge, MA: Morgan Kaufmann. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1866160
- Плас Дж. Вандер - Python для сложных задач: наука о данных и машинное обучение - 978-5-496-03068-7 - Санкт-Петербург: Питер - 2018 - 356721 - https://ibooks.ru/bookshelf/356721/reading - iBOOKS
- Практическая статистика для специалистов Data Science : 50 важнейших понятий: пер. с англ., Брюс, П., 2018
- Статистика и котики, Савельев, В. В., 2018