• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis in HR and Social Studies

2019/2020
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Course type:
Elective course
When:
4 year, 3 module

Программа дисциплины

Аннотация

Дисциплина "Анализ данных в HR и социальных исследованиях" нацелена на формирование у студента навыков программирования в среде R, включая задачи построения циклов и написания функций, проведение обработку сырых данных в соответствии с принципами tidyverse (пакеты dplyr, tidyr, tibble). Дисциплина научит студента решать задачи поиска внутренних взаимосвязей и сокращения размерности при помощи методов эксплораторного факторного и кластерного анализа, и представлять результаты анализа данных при помощи графических средств пакета ggplot2.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины «Анализ данных в HR и социальных исследованиях» являются: • формирование представления о круге профессиональных и академических задач, связанных с обработкой данных в HR и социальных науках; • формирование представления о современных методах анализа данных; • формирование навыков использования языка R для решения задач по анализу данных; • формирование навыков решения ключевых задач в сфере анализа данных в HR и социальных науках: обработка сырых данных, поиск внутренних взаимосвязей в структуре данных и снижение размерности, проверка гипотез о взаимосвязях, обработка естественных языков; • формирование навыков представления результатов анализа данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • • формирование представления о круге профессиональных и академических задач, связанных с обработкой данных в HR и социальных науках;
  • • формирование представления о современных методах анализа данных;
  • Студент умеет проводить групповые сессии с использованием Matlab
  • • формирование навыков решения ключевых задач в сфере анализа данных в HR и социальных науках: обработка сырых данных, поиск внутренних взаимосвязей в структуре данных и снижение размерности, проверка гипотез о взаимосвязях, обработка естественных языков;
  • • формирование навыков представления результатов анализа данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Обработка сырых данных.
    Принципы tidyverse. Загрузка данных в программную среду R; выделение субвыборок; фильтрация; импутация; преобразование переменных при помощи математических и логических вычислительных операций.
  • Тема 2. Поиск внутренних взаимосвязей в структуре данных и снижение размерности.
    Поиск внутренних взаимосвязей в структуре данных; эксплораторный факторный анализ; иерархический кластерный анализ; кластерный анализ k-средних; кластеризация нечётких множеств; portioning around medoids; оценка ширины силуэтов; обоснование конструктной валидности шкал психологических измерительных методик; оценка надёжности согласованности результатов психологических измерений.
  • Тема 3. Проверка гипотез о взаимосвязи.
    Корреляция; линейная регрессия; биномиальная регрессия; мультилинейная регрессия; мультиномиальная регрессия; ординальная регрессия; регуляризация; кросс-валидизация; random forest.
  • Тема 4: Обработка естественных языков
    Обработка естественных языков; контент-анализ; семантический анализ; bag-of-words; word2vec.
  • Тема 5 Представление результатов анализа данных
    R Markdown; представление результатов анализа данных в графической форме; ggplot2.
Элементы контроля

Элементы контроля

  • неблокирующий Активность на практических занятиях
  • неблокирующий Посещаемость
  • неблокирующий Домашнее задание
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (3 модуль)
    О оконч. = 0,4 * О экзамен + 0,6 * О текущ. Где Отекущ = 0,4* О домашнее задание + 0,6* О аудиторная. Где О аудиторная = 0.5 * О посещение занятий + 0.5 * О активность на занятии
Список литературы

Список литературы

Рекомендуемая основная литература

  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Wickham, H., & Grolemund, G. (2016). R for Data Science : Import, Tidy, Transform, Visualize, and Model Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1440131

Рекомендуемая дополнительная литература

  • Калинина В.Н., Соловьев В.И. - Анализ данных. Компьютерный практикум (для бакалавров). Учебное пособие - КноРус - 2017 - 166с. - ISBN: 978-5-406-04895-5 - Текст электронный // ЭБС BOOKRU - URL: https://book.ru/book/929386