• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Компьютерная лингвистика и информационные технологии

2019/2020
Учебный год
RUS
Обучение ведется на русском языке
6
Кредиты
Статус:
Курс обязательный
Когда читается:
4-й курс, 1-3 модуль

Преподаватели


Дроздова Ксения Андреевна


Литвинов Денис Владимирович

Программа дисциплины

Аннотация

Курс знакомит студентов с рядом алгоритмов и структур данных для обработки текстов, дает представление о базовых понятиях и алгоритмах машинного обучения, формирует практические навыки применения машинного обучения в задачах обработки текстов.
Цель освоения дисциплины

Цель освоения дисциплины

  • знакомство с рядом алгоритмов и структур данных для обработки текста
  • знакомство с базовыми понятиями и алгоритмами машинного обучения
  • формирование практических навыков применения машинного обучения в задачах обработки текстов
Планируемые результаты обучения

Планируемые результаты обучения

  • умеет применять модели машинного обучения к задачам классификации текста
  • умеет применять нейронные сети к задачам генерации текста
  • умеет применять модели машинного обучения к задачам тематического моделирования
  • умеет применять модели машинного обучения к задачам information retrieval
  • умеет тренировать и оценивать качество модели машинного обучения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Информационный поиск
    Введение в информационный поиск, булев поиск, обратный индекс, Okapi BM25, семантический поиск, Word2Vec, BERT, ELMo, модель выделения корня слова, основанная на RNN, логирование, добавление в поисковик.
  • Алгоритмы для обработки текста, Избранные главы математики для машинного обучения, Базовые понятия машинного обучения
  • Регуляризация в линейных моделях, Линейный модели классификации, Решающие деревья и ансамбли для регрессии и классификации.
  • Feed Forward Neural Networks, Distributed representations. CNN, RNN, Seq2seq
  • Transfer learning, Information retrieval, Topic Modeling
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
  • неблокирующий Экзамен (3 модуль)
  • неблокирующий Экзамен (1 модуль)
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (1 модуль)
    0.7 * Домашние задания + 0.3 * Экзамен (1 модуль)
  • Промежуточная аттестация (3 модуль)
    0.35 * Домашние задания + 0.5 * Промежуточная аттестация (1 модуль) + 0.15 * Экзамен (3 модуль)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Джеймс Г., Уиттон Д., Хасти Т. - Введение в статистическое обучение с примерами на языке R - Издательство "ДМК Пресс" - 2017 - 456с. - ISBN: 978-5-97060-495-3 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93580

Рекомендуемая дополнительная литература

  • Шипунов А.Б., Балдин Е.М., Волкова П.А. - Наглядная статистика. Используем R! - Издательство "ДМК Пресс" - 2014 - 298с. - ISBN: 978-5-94074-828-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/50572