• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site
Master 2021/2022

Text Analysis. Generative Models

Area of studies: Applied Mathematics and Informatics
When: 2 year, 1, 2 module
Mode of studies: offline
Open to: students of one campus
Instructors: Аксенов Сергей Андреевич, Alena Fenogenova
Master’s programme: Финансовые технологии и анализ данных
Language: English
ECTS credits: 5
Contact hours: 56

Course Syllabus

Abstract

Данная дисциплина ставит своей целью изучение основных задач и методов обработки и анализа текстов, а также освоение программных систем и инструментов, в которых реализованы данные методы. Эти базовые знания и навыки необходимы в профессиональной деятельности специалистов по анализу данных и машинного обучения.
Learning Objectives

Learning Objectives

  • Изучение основных задач и методов обработки и анализа текстов
Expected Learning Outcomes

Expected Learning Outcomes

  • Знание методов обработки и анализа текстов
Course Contents

Course Contents

  • Введение
  • Методы сбора и хранения данных
  • Частотный анализ текстов
  • Морфологический анализ и разрешение неоднозначности
  • Синтаксический анализ. Универсальные зависимости
  • Выделение ключевых слов и словосочетаний
  • Векторная модель
  • Классификация текстов
  • Языковые модели
  • Классификация последовательностей
  • Суммаризация текстов, вопросно-ответные системы
  • Исправление опечаток
  • Обработка речи, речевые технологии
  • Информационный поиск
  • Мультимодальная обработка текстов
Assessment Elements

Assessment Elements

  • non-blocking Домашняя работа
  • non-blocking Самостоятельная работа
  • non-blocking Экзамен
  • non-blocking Домашняя работа
  • non-blocking Самостоятельная работа
  • non-blocking Экзамен
Interim Assessment

Interim Assessment

  • 2021/2022 2nd module
    0.49 * Домашняя работа + 0.21 * Самостоятельная работа + 0.3 * Экзамен
Bibliography

Bibliography

Recommended Core Bibliography

  • Indurkhya N., Damerau F. J. Handbook of natural language processing. – Chapman and Hall/CRC, 2010. – 704 pp.
  • The Handbook of Computational Linguistics and Natural Language Processing [Электронный ресурс] / ed. by Alexander Clark, Chris Fox, Shalom Lappin; DB ebrary. – Chichester: John Wiley & Sons, 2013. – 203 p. – Режим доступа: https://ebookcentral.proquest.com/lib/hselibrary-ebooks/reader.action?docID=4035461&query=computational+linguistics

Recommended Additional Bibliography

  • Perkins, J. Python Text Processing with NLTK 2.0 Cookbook: Use Python NLTK Suite of Libraries to Maximize Your Natural Language Processing Capabilities [Электронный ресурс] / Jacob Perkins; DB ebrary. – Birmingham: Packt Publishing Ltd, 2010. – 336 p.