• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Проектно-исследовательский семинар

2021/2022
Учебный год
RUS
Обучение ведется на русском языке
6
Кредиты
Статус:
Курс обязательный
Когда читается:
2-й курс, 1-3 модуль

Преподаватели

Программа дисциплины

Аннотация

Целями освоения дисциплины «Проектирование лингвистических ресурсов и систем» являются формирование навыков по созданию лингвистических компонентов обработки текстов, формирование навыков работы в команде, формулирования и решения поставленных задач, методологически корректного построения экспериментов и исследований. Для освоения учебной дисциплины, студенты должны владеть следующими знаниями и компетенциями: • Владеть основными методами компьютерной лингвистики • Владеть технологиями и алгоритмами из курсов “Программирование”, “Машинное обучение”, “Компьютерная лингвистика”.
Цель освоения дисциплины

Цель освоения дисциплины

  • Научить студентов основным принципам разработки и создания лингвистических корпусов и ресурсов; преимуществам и недостаткам формальных моделей, лежащих в основе различных модулей автоматической обработки текста; необходимым этапам морфологического анализа и проблемам, возникающим при моделировании каждого из этапов; • основным алгоритмам, используемым для построения автоматического синтаксического анализа; наиболее известным доступным для свободного использования компонентам автоматического анализа, в том числе синтаксическим и морфологическим парсерам, системам распознавания именованных сущностей (NER); принципам оценки качества таких систем.
  • формирование навыков по созданию лингвистических компонентов обработки текстов
  • Научить студентов проводить оценку качества систем автоматического морфологического, синтаксического и семантического анализа; использовать соответствующие модули в различных приложениях; участвовать в разработке отдельных модулей в системах автоматического анализа текстов, самостоятельно разрабатывать лингвистические ресурсы. Основные положения дисциплины должны быть использованы в дальнейшей профессиональной деятельности (дисциплина ведется на выпускном курсе).
  • формирование навыков работы в команде
  • умение формулировать и решать поставленные задачи
  • умение методологически корректно выстраивать эксперименты и исследования
Планируемые результаты обучения

Планируемые результаты обучения

  • выбор проекта, постановка задач
  • знает принципы и требования к ведению проектной работы
  • знакомство с литературой по теме
  • пилотное исследование, разработка технического задания
  • умеет критически оценивать результаты
  • умеет разбираться в документации
  • умеет собирать и размечать данные, обучать модель, программировать алгоритмы
  • умеет тестировать алгоритмы и моделей, ставить и реализовывать задачи по улучшению алгоритмов и моделей
  • знает классифицикацию одномерных сигналов, модели речевого тракта, кластеризацию акустических векторов, нейросетевые технологии обработки звучащей речи.
  • знает основные методы и подходы к машинному переводу
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в проблематику проектной работы
  • Введение в машинный перевод
  • Проектная работа 1
  • Введение в речевые технологии
  • Проектная работа 2
  • Проектная работа 3
Элементы контроля

Элементы контроля

  • неблокирующий Экзамен
    Пересдача может происходить не позднее, чем через две недели после оценивания, без снижения баллов. На пересдаче студенту не предоставляется возможность получить дополнительный балл для компенсации оценки за текущий контроль.
  • неблокирующий Самостоятельная работа
  • неблокирующий Аудиторная работа
  • неблокирующий домашняя работа
  • неблокирующий проект
  • неблокирующий аудиторная работа
Промежуточная аттестация

Промежуточная аттестация

  • 2020/2021 учебный год 4 модуль
    0.4 * Самостоятельная работа + 0.4 * Аудиторная работа + 0.2 * Экзамен
  • 2021/2022 учебный год 3 модуль
    0.4 * домашняя работа + 0.2 * проект + 0.4 * аудиторная работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • The Handbook of Computational Linguistics and Natural Language Processing [Электронный ресурс] / ed. by Alexander Clark, Chris Fox, Shalom Lappin; DB ebrary. – Chichester: John Wiley & Sons, 2013. – 203 p. – Режим доступа: https://ebookcentral.proquest.com/lib/hselibrary-ebooks/reader.action?docID=4035461&query=computational+linguistics
  • Методы и алгоритмы обработки данных : учеб. пособие / А.А. Григорьев. — М. : ИНФРА-М, 2017. — 256 с. + Доп. материалы [Электронный ресурс; Режим доступа http://www.znanium.com]. — (Высшее образование: Бакалавриат). — www.dx.doi.org/10.12737/22119. - Режим доступа: http://znanium.com/catalog/product/545998

Рекомендуемая дополнительная литература

  • The Handbook of Natural Language Processing [Электронный ресурс] / edited by Robert Dale, Hermann Moisl, Harold Somers; DB ebrary. – New York: Marcel Dekker, Inc., 2010. – XIX, 996 p. – режим доступа: https://ebookcentral.proquest.com/lib/hselibrary-ebooks/reader.action?docID=216282&query=natural+language+processing+with
  • Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход / Б.Ю. Лемешко, С.Б. Лемешко, С.Н. Постовалов и др. - М.: НИЦ ИНФРА-М, 2015. - 890 с.: 60x90 1/16 ISBN 978-5-16-103267-1 (online) - Режим доступа: http://znanium.com/catalog/product/515227