• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
21
Апрель

Инструменты и методы в коммуникационных исследованиях

2022/2023
Учебный год
RUS
Обучение ведется на русском языке
2
Кредиты
Статус:
Курс обязательный
Когда читается:
4-й курс, 1 модуль

Преподаватель


Хапаева Наталья Михайловна

Программа дисциплины

Аннотация

Основной курс специализации «Исследования в коммуникациях» посвящен применению современных методов обработки количественных данных для целей коммуникационного исследования. Цель данного курса – обеспечить студентов необходимыми навыками и умениями для работы с эмпирическими данными, обобщения полученных результатов и создания уникальных коммуникационных продуктов на основании исследования. В результате освоения дисциплины студенты смогут применять методы статистики и машинного обучения к методологии количественного коммуникационного исследования, формулировать выводы на основании данных и принимать решения, исходя из результатов исследования. Работа в рамках курса строится вокруг освоения методов и подходов, применения их и разбора сопряженных с данными методами и подходами кейсов. Курс сочетает в себе лучшие практики аналитической работы, анализа больших данных и основы дата-ориентированных коммуникаций, что является приоритетным направлением в индустрии сегодня.
Цель освоения дисциплины

Цель освоения дисциплины

  • формирование профессиональных компетенций по работе с данными, используя язык программирования Python
  • формирование профессиональных компетенций для проведения социологических, маркетинговых и коммуникационных исследований в сфере рекламы и PR.
Планируемые результаты обучения

Планируемые результаты обучения

  • Собирать данные с помощью web-scraping, парсить данные и сохранять их в табличном виде
  • Владеет методами анализа: линейная регрессия, регрессионные деревья, случайный лес
  • Владение методами сегментации на основе анализа данных: кластеризация, анализ текстов, тематическое моделирование, LDA.
  • Умеет применять нейронные сети для решения задач
  • Знает основные стадии ведения проекта машинного обучения; умеет распозанавать задачи машинного обучения в реальных бизнес-задачах; имеет навыки оценки качества и интерпретации полученных результатов
  • Знать: основные методы классификации данных такие как линейная и логистическая регрессия, метод поддерживающих векторов, метод к ближайших соседей, деревья принятия решений, случайный лес; методы оценки качества классификации.
  • Владеет терминологией, обладает базовыми знаниями о нейронные сетях как виде распределенных информационных систем. Знает принципы построения нейронных сетей. Умеет применять нейронные сети в научных и практических целях.
  • Осуществляет анализ текстовой информации с использованием технологии Text Mining
  • Демонстрирует знание специальных видов нейронных сетей: рекуррентные, сверточные, глубокие сети для обработки текстов (распределенные представления слов и рекурсивные нейронные сети)
  • Владеет библиотеками Pandas и Numpy для обработки данных
  • Знать особенности работы с современными дистрибутивами Python
  • Владеет методами кластеризации данных
  • Знает основные понятия и постановки задач машинного обучения
  • Умеет выполнять кластеризацию и визуализацию данных
  • Владеет понятием алгоритмов на больших данных (кластеризация, понижение размерности, популярные предметные наборы и ассоциативные правила)
  • Владеет понятием алгоритмов на больших данных (рекомендательные системы и интернет-реклама)
  • Владеет понятиями: объединения моделей; усреднение, бутстрап, бэггинг; бустинг: AdaBoost. Знает алгоритм Random Forest.
  • Владеет понятием линейной регрессии; лассо-регрессии; гребневой регрессии. Знает ошибки модели в задачах регрессии. Владеет понятием метрик качества.
  • Владеет методом кластеризации для анализа аудитории с помощью библиотек Python.
  • Умеет извлекать (парсить) данные с веб-ресурсов, используя пакеты для Python. Владеет базовыми навыками работы с SQL. Умеет проверять качество данных.
  • Владеет основными методами ручного и машинного анализа текстовых данных.
  • Владеет основными принципами кодирования текстовых данных.
  • Сравнивать задачи классификации и задачи регрессии. Иллюстрировать задачи классификации (бинарной и множественной). Сравнивать наиболее известные классификаторы (логистическая регрессия, деревья решений, случайный лес, метод опорных векторов).
  • Владеет метриками качества линейной регрессии: MSE, MAE, R2.
  • Владеет основами коммуникационных исследований
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основы коммуникационных исследований
  • Язык программирования Python как интрумент коммуникационных исследований
  • Обработка данных в Python с использованием библиотеки Pandas
  • Автоматизированный сбор данных с использованием инструментов парсинга
  • Статистика для обработки данных
  • Обработка текстовых данных средствами и инструментами Python
  • Методы машинного обучения для коммуникационного исследования
  • Предсказание
  • Классификация
  • Основы работы с неструктурированными данными
  • Бэггинг и бустинг
  • Сегментация
  • Анализ сетевых структур
  • Введение в нейронные сети
  • Рекомендательные системы для коммуникационных задач
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
    Домашнее задание представляет собой набор инструкций и задач по работе с данными с использованием языка программирования в Python. Инструкции к каждому домашнему заданию высылаются преподавателем как минимум за 7 дней до предполагаемого срока сдачи работы. При загрузке файлов студент обязан указать корректно свои фамилию и имя. Оценка за домашние задания не подлежит пересдаче, так как данная форма контроля по факту состоит из нескольких форм контроля. В результате, оценка за домашние задания выставляется как среднее арифметическое оценок за все домашние задания, предусмотренные на курсе.
  • неблокирующий Контрольная работа
    Контрольная работа проходит в письменном виде и представляет собой набор открытых и закрытых тестовых вопросов. На выполнение работы студенту отводится 120 минут. Оценка выставляется пропорционально проценту правильных ответов от всех вопросов в тесте.
  • неблокирующий Итоговый проект
    Выполнение студентами этапов проекта предусмотрено на протяжении всего курса. Итоговый проект выполняется строго в группах 2-4 человека. Проект состоит из двух частей - ipynb-файл с содержанием проекта (вес в оценке за итоговый проект: 80%) и презентация основных результатов и степени достижения целей проекта в любом формате (вес в оценке за итоговый проект: 20%).
  • неблокирующий Экзамен
    Оценка достижения студентами планируемых результатов обучения в рамках данного курса проходит в форме сдачи итогового экзамена. Экзамен проходит в письменной форме; его продолжительность - 240 минут. Экзамен состоит из двух частей, где в первой части студент в свободной форме письменно отвечает на любые два из трех вопросов в билете, а затем - выполняет практическое задание по анализу данных с использование Python. Обе части имеют равный вес в итоговой оценке за экзамен.
  • неблокирующий Проект
  • неблокирующий Домашние задания
  • неблокирующий Активность
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 4 модуль
    0.2 * Итоговый проект + 0.2 * Домашние задания + 0.3 * Экзамен + 0.1 * Контрольная работа
  • 2022/2023 учебный год 1 модуль
    0.4 * Домашние задания + 0.5 * Проект + 0.1 * Активность