• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2020/2021

Научно-исследовательский семинар "Нейросети в компьютерной лингвистике"

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Направление: 45.03.03. Фундаментальная и прикладная лингвистика
Когда читается: 4-й курс, 1, 2 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для всех кампусов НИУ ВШЭ
Преподаватели: Сорокин Семен Александрович
Язык: русский
Кредиты: 6
Контактные часы: 28

Программа дисциплины

Аннотация

Курс знакомит с основными сведениями о существующих инструментах автоматической обработки естественного языка, основанных на машинном обучении и нейронных сетях, формирует навык использовать, строить и оценивать искусственные модели для наиболее типичных задач обработки языка, тренирует обучению собственных моделей.
Цель освоения дисциплины

Цель освоения дисциплины

  • дать представление о существующих инструментах автоматической обработки естественного языка, основанных на машинном обучении и нейронных сетях
  • сформировать представление о принципах работы данных инструментов
  • познакомить с основными фреймворками для решения задач АОЕЯ с применением нейронных сетей
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент знает и умеет выбирать векторные представления лексических единиц в соответствии с типом задачи.
  • Студент знает как построить языковую модель с использованием нейронной сети
  • Студент знает как применяются конволюционные нейронные сети при анализе тональности и какие признаки могут выделены c с помощью CNN
  • Студент знает, что общего в задачах поиска ключевых слов и суммаризации текст
  • Студент знает, как используется синтаксическое дерево при извлечении именованные сущности
  • Студент знает зачем необходима энкодер-декодер структура в вопросно-ответных системах
  • Студент знает как устроен “механизм внимания” в энкодер-декодер структурах моделей НЛП
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Векторное представление лексических единиц.
  • Языковые модели. Классификация текстов: бинарная и многоклассовая.
  • Анализ тональности.
  • Извлечение ключевых слов.
  • Извлечение именованных сущностей.
  • Вопросно-ответные системы. Диалоговые агенты.
  • Нейронный машинный перевод.
Элементы контроля

Элементы контроля

  • неблокирующий Лабораторная работа 1
    Сстудентам будет предложено выполнить две лабораторные работы. Пересдается в течение недели после окончания пропуска по уважительной причине, но не позднее 10 дней до сессии.
  • неблокирующий Тесты
    Студенты будут оцениваться каждый две недели, отвечая на случайно выбранные вопросы из изученных тем. Каждый тест будет оценен по шкале от 0 до 10, в соответствии с количеством правильных ответов.
  • неблокирующий Экзамен
    По общим правилам пересдачи экзамена, пропущенного по уважительной причине.
  • неблокирующий Лабораторная работа 2
    Пересдается в течение недели после окончания пропуска по уважительной причине, но не позднее 10 дней до сессии.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.25 * Лабораторная работа 1 + 0.25 * Лабораторная работа 2 + 0.25 * Тесты + 0.25 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Болотнова Н.С., Болотнов А.В. - Современный русский язык: Лексикология. Фразеология. Лексикография: Контрольно-тренировочные задания - Издательство "ФЛИНТА" - 2016 - 224с. - ISBN: 978-5-9765-0739-5 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/85857

Рекомендуемая дополнительная литература

  • Iba, H. (2018). Evolutionary Approach to Machine Learning and Deep Neural Networks : Neuro-Evolution and Gene Regulatory Networks. Singapore: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1833749