Бакалавриат
2025/2026




Методы обработки текстов
Статус:
Курс обязательный (Информатика и вычислительная техника)
Когда читается:
4-й курс, 1, 2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
6
Программа дисциплины
Аннотация
Спецкурс предназначен для студентов, желающих получить знания и практические навыки в области обработки текстовой информации. Курс знакомит слушателей с основными проблемами компьютерной обработки текстов и современными подходами к их решению. Рассматриваются как фундаментальные понятия и идеи, так и современные исследования в данной области. Особое внимание уделяется применению методов машинного обучения, которые активно развиваются в настоящее время и показывают лучшие результаты.
Актуальность обработки текстовой информации на естественном языке связана с ростом количества документов, доступных для автоматической обработки, потребностью в их анализе и наличием вычислительных ресурсов. Слушатели получат базовые знания в области обработки текстов на естественном языке, понимание проблем, возникающих при разработке систем текстового анализа, и подходов к их решению.
Цель освоения дисциплины
- Целью освоения дисциплины является получение базовых знаний в области обработки текстов на естественном языке, а также приобретение навыков решения задач, возникающих при разработке систем текстового анализа.
Планируемые результаты обучения
- Способность решать проблемы в профессиональной деятельности на основе анализа и синтеза
- Способность вести исследовательскую деятельность, включая анализ проблем, постановку целей и задач, выделение объекта и предмета исследования, выбор способа и методов исследования, а так-же оценку его качества
- Способность использовать методы и инструментальные средства исследования объектов профессиональной деятельности
- Способность использовать различные технологии разработки программного обеспечения
- Способность обосновать принимаемые проектные решения, осуществлять постановку и выполнение экспериментов по проверке их корректности и эффективности
- Способность оценивать потребность в ресурсах и планировать их использование при решении задач в профессиональной деятельности
- Способность применять основные методы и инструменты разработки программного обеспечения
- Способность проектировать, конструировать и тестировать программные продукты
- Способность читать, понимать и выделять главную идею прочитанного исходного кода, документации
- Способность Способен работать с информацией: находить, оценивать и использовать информацию из различных источников, необходимую для решения научных и профессиональных задач (в том числе на основе системного подхода)
Содержание учебной дисциплины
- Введение
- Базовые методы обработки текстов
- Современные методы обработки текстов
- Задачи обработки текстов
- Семантический анализ текстов
- Прикладное применение методов анализа текстов
Промежуточная аттестация
- 2025/2026 2nd module0.25 * Домашнее задание + 0.25 * Домашнее задание + 0.5 * Экзамен
Список литературы
Рекомендуемая основная литература
- Bird, S., Loper, E., & Klein, E. (2009). Natural Language Processing with Python. O’Reilly Media.
- Ian Goodfellow, Yoshua Bengio, & Aaron Courville. (2016). Deep Learning. The MIT Press.
Рекомендуемая дополнительная литература
- Введение в информационный поиск, Маннинг, К. Д., 2014
- Искусственный интеллект : современный подход, Рассел, С., 2006
- Программируем коллективный разум, Сегаран, Т., 2008