Бакалавриат
2019/2020
Обработка естественного языка
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Прикладная математика и информатика)
Направление:
01.03.02. Прикладная математика и информатика
Кто читает:
Департамент информатики
Когда читается:
4-й курс, 2 модуль
Формат изучения:
с онлайн-курсом
Преподаватели:
Браславский Павел Исаакович
Язык:
русский
Кредиты:
4
Контактные часы:
44
Программа дисциплины
Аннотация
Является дисциплиной по выбору. Данная дисциплина направлена на овладение навыками машинной обработки естественного языка.Понимание сложных фраз на любом языке - один из необходимых компонентов развития искусственного интеллекта. В курсе будут рассмотрены как классические лингвистические подходы к задачам NLP (анализу предложений, машинному переводу и т.д.), так и современные методы, основанные на глубинном обучении. В результате освоения дисциплины студент должен:знать основные алгоритмы NLP; уметь извлекать именованные сущности и определять тональность текста; владеть математическим аппаратом и алгоритмами морфологического анализа и машинного перевода.
Цель освоения дисциплины
- Целями освоения дисциплины «Обработка естественного языка» являются формирование у студентов теоретических знаний и практических навыков по основам машинной обработки естественного языка.
Планируемые результаты обучения
- Владеет понятиями: лемматизация, грамматические характеристики (POS-tagging), генерация. Знает: модели на основе n-грамм. Владеет понятиями: оценка вероятностей; перплексия; откат и интерполяция. Знает: лексические цепочки; скрытые марковские модели; веб-сниппеты.
- Владеет понятиями: формализмы; контекстно-свободная грамматика; лексикализация. Имеет навык работы с классификацией; словарями. Знает: нейронные сети для анализа тональности. Владеет понятиями: WordNet; семантическая близость на основе тезауруса; векторное представление на основе нейронных сетей.
- Владеет понятиями и имеет навык работы с поиском сущностей; базой знаний; именованными сущностями; извлечением отношений. Имеет навык работы с поиском в текстовых коллекциях. Занет подход на основе баз знаний. Владеет понятиями: взвешивание ответов; вопросно-ответные сервисы. Умеет работать с диалоговыми системами.
Содержание учебной дисциплины
- Морфологический анализМорфологический анализ. Языковые модели. Автоматическое реферирование.
- Синтаксический анализСинтаксический анализ. Анализ тональности. Вычислительная семантика.
- Извлечение информацииИзвлечение информации. Вопросно-ответный поиск. Диалоговые системы.
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.16 * Домашнее задание 1 + 0.17 * Домашнее задание 2 + 0.17 * Домашнее задание 3 + 0.5 * Устный экзамен
Список литературы
Рекомендуемая основная литература
- Mariani, J. (2009). Language and Speech Processing. London, UK: Wiley-ISTE. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=310778
Рекомендуемая дополнительная литература
- Biemann, C. (2012). Structure Discovery in Natural Language. Berlin: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1299312