Бакалавриат
2021/2022
Научно-исследовательский семинар "Нейросети в компьютерной лингвистике"
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Курс по выбору (Фундаментальная и компьютерная лингвистика)
Направление:
45.03.03. Фундаментальная и прикладная лингвистика
Кто читает:
Школа лингвистики
Где читается:
Факультет гуманитарных наук
Когда читается:
4-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Сорокин Семен Александрович
Язык:
русский
Кредиты:
3
Контактные часы:
28
Программа дисциплины
Аннотация
Курс знакомит с основными сведениями о существующих инструментах автоматической обработки естественного языка, основанных на машинном обучении и нейронных сетях, формирует навык использовать, строить и оценивать искусственные модели для задач обработки языка, тренирует обучению собственных моделей. В курсе обсуждаются подходы к решению задач, требующих глубокой лингвистической проработки: генерация связанных текстовых фрагментов, специфика разработки моделей для малоресурсных языков, автоматизированное исправление ошибок.
Цель освоения дисциплины
- дать представление о существующих инструментах автоматической обработки естественного языка, основанных на машинном обучении и нейронных сетях
- сформировать представление о принципах работы данных инструментов
- познакомить с основными фреймворками для решения задач АОЕЯ с применением нейронных сетей
- познакомить с основными подходами к решению лингвистических задач с помощью нейронных сетей
Планируемые результаты обучения
- Студент знает зачем необходима энкодер-декодер структура в вопросно-ответных системах
- Студент знает и умеет выбирать векторные представления лексических единиц в соответствии с типом задачи.
- Студент знает как построить языковую модель с использованием нейронной сети
- Студент знает как применяются конволюционные нейронные сети при анализе тональности и какие признаки могут выделены c с помощью CNN
- Студент знает как устроен “механизм внимания” в энкодер-декодер структурах моделей НЛП
- Студент знает, как используется синтаксическое дерево при извлечении именованные сущности
- Студент знает, что общего в задачах поиска ключевых слов и суммаризации текст
- Студент знает о ключевых подходах к задачам автоматического анализа малоресурсных языков
- Студент знает о ключевых подходах к задачам автоматического исправления ошибок с помощью нейросетей
- Студент знает о ключевых подходах к проблеме генерации связного текста
Содержание учебной дисциплины
- Векторное представление лексических единиц.
- Языковые модели. Классификация текстов: бинарная и многоклассовая.
- Анализ тональности.
- Извлечение ключевых слов.
- Извлечение именованных сущностей.
- Вопросно-ответные системы. Диалоговые агенты.
- Нейронный машинный перевод.
Элементы контроля
- Лабораторная работа 1Сстудентам будет предложено выполнить две лабораторные работы. Пересдается в течение недели после окончания пропуска по уважительной причине, но не позднее 10 дней до сессии.
- ТестыСтуденты будут оцениваться каждый две недели, отвечая на случайно выбранные вопросы из изученных тем. Каждый тест будет оценен по шкале от 0 до 10, в соответствии с количеством правильных ответов.
- ЭкзаменПо общим правилам пересдачи экзамена, пропущенного по уважительной причине.
- Лабораторная работа 2Пересдается в течение недели после окончания пропуска по уважительной причине, но не позднее 10 дней до сессии.
Промежуточная аттестация
- 2021/2022 учебный год 2 модуль0.25 * Лабораторная работа 1 + 0.25 * Тесты + 0.25 * Экзамен + 0.25 * Лабораторная работа 2
Список литературы
Рекомендуемая основная литература
- Speech and language processing : an introduction to natural language processing, computational linguistics, and speech recognition, Jurafsky, D., 2009
- Болотнова, Н. С. Современный русский язык: Лексикология. Фразеология. Лексикография: Контрольно-тренировочные задания : учебное пособие / Н. С. Болотнова, А. В. Болотнов. — 3-е изд., стер. — Москва : ФЛИНТА, 2016. — 224 с. — ISBN 978-5-9765-0739-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/85857 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Iba, H. (2018). Evolutionary Approach to Machine Learning and Deep Neural Networks : Neuro-Evolution and Gene Regulatory Networks. Singapore: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1833749