• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Бакалаврская программа «Прикладная математика и информатика»

Глубинное обучение для текстовых данных

2021/2022
Учебный год
RUS
Обучение ведется на русском языке
5
Кредиты
Статус:
Курс по выбору
Когда читается:
4-й курс, 1, 2 модуль

Преподаватели


Артемова Екатерина Леонидовна


Лапидус Анна Александровна

Программа дисциплины

Аннотация

Настоящая учебная дисциплина посвящена вопросам автоматической обработки текстов [natural language processing], области, находящейся на стыке таких дисциплин, как машинное обучение и лингвистика. Курс состоит из двух чатсей: базовой, в ходе которых будут введены основные концепции, и продвинутой, ориентированной на индустриальные технологии и на современные научные вопросы.
Цель освоения дисциплины

Цель освоения дисциплины

  • Изучение базовых задач и методов обработки и анализа текстов
  • Изучение современных нейросетевых моделей для обработки и анализа текстов
  • Освоение программных систем и инструментов для обработки и анализа текстов
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать и применять базовые методы обработки и анализа текстов
  • Знать этические аспекты обработки текстов
  • Уметь решать задачи, связанные с моделированием языка
  • Уметь решать специализированные задачи на текстовых данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение. Статистический анализ текстов
  • Векторные модели представления слов
  • Классификация текстов
  • Классификация последовательностей
  • Предобученные языковые модели
  • Синтаксический анализ
  • Машинный перевод
  • Генерация текстов
  • Разметка данных, активное обучение.
  • Вопросное-ответные системы
  • Мультимодальные методы
  • Мультиязычные методы
  • Обработка текстов в медицине
  • Информационный поиск
  • Этические вопросы в обработке текстов
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание (ДЗ1)
  • неблокирующий Домашнее задание (ДЗ2)
  • неблокирующий Домашнее задание (ДЗ 3)
  • неблокирующий Домашнее задание (ДЗ4)
  • неблокирующий Компьютерный тест (Квизы)
    Квизы по итогам каждой лекции
  • неблокирующий Проект 1 (Домашнее задание)
    Проект на основе SemEval
  • неблокирующий Проект 2 (Домашнее задание)
    Проект на основе SemEval
  • неблокирующий Устный экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 2 модуль
    0.09 * Проект 2 (Домашнее задание) + 0.4 * Устный экзамен + 0.12 * Компьютерный тест (Квизы) + 0.075 * Домашнее задание (ДЗ1) + 0.09 * Проект 1 (Домашнее задание) + 0.075 * Домашнее задание (ДЗ 3) + 0.075 * Домашнее задание (ДЗ2) + 0.075 * Домашнее задание (ДЗ4)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Manning, C. D., & Schèutze, H. (1999). Foundations of Statistical Natural Language Processing. Cambridge, Mass: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=24399

Рекомендуемая дополнительная литература

  • Shay Cohen. (2019). Bayesian Analysis in Natural Language Processing : Second Edition. San Rafael: Morgan & Claypool Publishers. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2102157