Бакалавриат
2019/2020
Анализ данных в HR и социальных исследованиях
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Курс по выбору (Психология)
Направление:
37.03.01. Психология
Кто читает:
Департамент психологии
Где читается:
Факультет социальных наук
Когда читается:
4-й курс, 3 модуль
Формат изучения:
без онлайн-курса
Язык:
русский
Кредиты:
3
Контактные часы:
26
Программа дисциплины
Аннотация
Дисциплина "Анализ данных в HR и социальных исследованиях" нацелена на формирование у студента навыков программирования в среде R, включая задачи построения циклов и написания функций, проведение обработку сырых данных в соответствии с принципами tidyverse (пакеты dplyr, tidyr, tibble). Дисциплина научит студента решать задачи поиска внутренних взаимосвязей и сокращения размерности при помощи методов эксплораторного факторного и кластерного анализа, и представлять результаты анализа данных при помощи графических средств пакета ggplot2.
Цель освоения дисциплины
- Целями освоения дисциплины «Анализ данных в HR и социальных исследованиях» являются: • формирование представления о круге профессиональных и академических задач, связанных с обработкой данных в HR и социальных науках; • формирование представления о современных методах анализа данных; • формирование навыков использования языка R для решения задач по анализу данных; • формирование навыков решения ключевых задач в сфере анализа данных в HR и социальных науках: обработка сырых данных, поиск внутренних взаимосвязей в структуре данных и снижение размерности, проверка гипотез о взаимосвязях, обработка естественных языков; • формирование навыков представления результатов анализа данных.
Планируемые результаты обучения
- • формирование представления о круге профессиональных и академических задач, связанных с обработкой данных в HR и социальных науках;
- • формирование представления о современных методах анализа данных;
- Студент умеет проводить групповые сессии с использованием Matlab
- • формирование навыков решения ключевых задач в сфере анализа данных в HR и социальных науках: обработка сырых данных, поиск внутренних взаимосвязей в структуре данных и снижение размерности, проверка гипотез о взаимосвязях, обработка естественных языков;
- • формирование навыков представления результатов анализа данных
Содержание учебной дисциплины
- Тема 1. Обработка сырых данных.Принципы tidyverse. Загрузка данных в программную среду R; выделение субвыборок; фильтрация; импутация; преобразование переменных при помощи математических и логических вычислительных операций.
- Тема 2. Поиск внутренних взаимосвязей в структуре данных и снижение размерности.Поиск внутренних взаимосвязей в структуре данных; эксплораторный факторный анализ; иерархический кластерный анализ; кластерный анализ k-средних; кластеризация нечётких множеств; portioning around medoids; оценка ширины силуэтов; обоснование конструктной валидности шкал психологических измерительных методик; оценка надёжности согласованности результатов психологических измерений.
- Тема 3. Проверка гипотез о взаимосвязи.Корреляция; линейная регрессия; биномиальная регрессия; мультилинейная регрессия; мультиномиальная регрессия; ординальная регрессия; регуляризация; кросс-валидизация; random forest.
- Тема 4: Обработка естественных языковОбработка естественных языков; контент-анализ; семантический анализ; bag-of-words; word2vec.
- Тема 5 Представление результатов анализа данныхR Markdown; представление результатов анализа данных в графической форме; ggplot2.
Промежуточная аттестация
- Промежуточная аттестация (3 модуль)О оконч. = 0,4 * О экзамен + 0,6 * О текущ. Где Отекущ = 0,4* О домашнее задание + 0,6* О аудиторная. Где О аудиторная = 0.5 * О посещение занятий + 0.5 * О активность на занятии
Список литературы
Рекомендуемая основная литература
- Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
- Wickham, H., & Grolemund, G. (2016). R for Data Science : Import, Tidy, Transform, Visualize, and Model Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1440131
Рекомендуемая дополнительная литература
- Калинина В.Н., Соловьев В.И. - Анализ данных. Компьютерный практикум (для бакалавров). Учебное пособие - КноРус - 2017 - 166с. - ISBN: 978-5-406-04895-5 - Текст электронный // ЭБС BOOKRU - URL: https://book.ru/book/929386