• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2019/2020

Компьютерная лингвистика и информационные технологии

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Направление: 45.03.03. Фундаментальная и прикладная лингвистика
Когда читается: 4-й курс, 1-3 модуль
Формат изучения: Full time
Язык: русский
Кредиты: 6

Программа дисциплины

Аннотация

Курс знакомит студентов с рядом алгоритмов и структур данных для обработки текстов, дает представление о базовых понятиях и алгоритмах машинного обучения, формирует практические навыки применения машинного обучения в задачах обработки текстов.
Цель освоения дисциплины

Цель освоения дисциплины

  • знакомство с рядом алгоритмов и структур данных для обработки текста
  • знакомство с базовыми понятиями и алгоритмами машинного обучения
  • формирование практических навыков применения машинного обучения в задачах обработки текстов
Результаты освоения дисциплины

Результаты освоения дисциплины

  • умеет применять модели машинного обучения к задачам классификации текста
  • умеет применять нейронные сети к задачам генерации текста
  • умеет применять модели машинного обучения к задачам тематического моделирования
  • умеет применять модели машинного обучения к задачам information retrieval
  • умеет тренировать и оценивать качество модели машинного обучения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Информационный поиск
    Введение в информационный поиск, булев поиск, обратный индекс, Okapi BM25, семантический поиск, Word2Vec, BERT, ELMo, модель выделения корня слова, основанная на RNN, логирование, добавление в поисковик.
  • Алгоритмы для обработки текста, Избранные главы математики для машинного обучения, Базовые понятия машинного обучения
  • Регуляризация в линейных моделях, Линейный модели классификации, Решающие деревья и ансамбли для регрессии и классификации.
  • Feed Forward Neural Networks, Distributed representations. CNN, RNN, Seq2seq
  • Transfer learning, Information retrieval, Topic Modeling
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
  • неблокирующий Экзамен (3 модуль)
  • неблокирующий Экзамен (1 модуль)
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (1 модуль)
    0.7 * Домашние задания + 0.3 * Экзамен (1 модуль)
  • Промежуточная аттестация (3 модуль)
    0.35 * Домашние задания + 0.5 * Промежуточная аттестация (1 модуль) + 0.15 * Экзамен (3 модуль)
Список литературы

Список литературы

Рекомендуемая основная литература

  • - Джеймс Г., Уиттон Д., Хасти Т. — Введение в статистическое обучение с примерами на языке R - Издательство "ДМК Пресс" - 2017 - ISBN: 978-5-97060-495-3 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/93580

Рекомендуемая дополнительная литература

  • - Шипунов А.Б., Балдин Е.М., Волкова П.А. — Наглядная статистика. Используем R! - Издательство "ДМК Пресс" - 2014 - ISBN: 978-5-94074-828-1 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/50572