• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2023/2024

Text Mining. Введение

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Направление: 39.04.01. Социология
Когда читается: 1-й курс, 3 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Прогр. обучения: Социология публичной сферы и цифровая аналитика
Язык: русский
Кредиты: 3
Контактные часы: 40

Программа дисциплины

Аннотация

Text mining часто переводится на русский язык как интеллектуальный анализ текстов. Более точным представляется такой перевод: (полу)автоматизированная обработка и анализ больших текстовых данных. Эта учебная дисциплина нацелена на знакомство студентов с понятиями text mining, типами решаемых задач и подходами к их решению (i предобработка текстов естественного языка, ii выявление среди текстов наиболее наполненных и для них – наиболее высокочастотных слов, iii распределение текстов на релевантные и нерелевантные, iv тематическое моделирование, v сентимент-анализ, vi построение прогностических моделей на текстовых данных), а также на практическое освоение некоторых из этих подходов. Практическое освоение предполагает написание собственного программного кода на языке Python/или R и оперирование готовыми релевантными модулями и пакетами, доступными в этих программных средах. Освоив в таком ключе отдельные подходы и имея концептуальное представление об области text mining в целом, студенты без труда смогут экстраполировать свои навыки и на другие подходы.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знакомство с группой методов Text Mining и типами решаемых с их помощью задач
  • Практическое освоение некоторых методов Text Mining (предобработка текста, базовый анализ) в рамках языков R или Python
Планируемые результаты обучения

Планируемые результаты обучения

  • Получение концептуального представления о группе методов Text Mining (базовая предобработка текста, выделение выосокчастотных слов, тематический и сантимент-анализ)
  • Получение представления о модулях и пакетах Python или R, с помощью которых реализуется автоматизированный анализ текста
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Структура и содержание курса
  • Понятие текста
  • Как собрать материал для анализа?
  • Дизайн исследования
  • Лексические ресурсы
  • Базовая обработка текста
  • Продвинутая обработка текста
  • Методы интеллектального анализа текста
Элементы контроля

Элементы контроля

  • блокирует часть оценки/расчета Разработка проекта
    Постановка проблемы, исследовательский вопрос, цель, задачи, объект, предмет, методология
  • неблокирующий Активность
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 3 модуль
    0.3 * Активность + 0.7 * Разработка проекта
Список литературы

Список литературы

Рекомендуемая основная литература

  • Попов, А. М. Анализ текста в пакете MATLAB : учебное пособие / А. М. Попов. — Санкт-Петербург : БГТУ "Военмех" им. Д.Ф. Устинова, 2018. — 66 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/122085 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Текст майнинг. Интеллектуальный анализ текста : дизайн исследований, сбор данных и методы анализа, Игнатов, Г., 2021

Рекомендуемая дополнительная литература

  • Berry, M. W., & Kogan, J. (2010). Text Mining : Applications and Theory. Chichester, U.K.: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=314553
  • Text mining with R : a tidy approach, Silge, J., 2017