• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Методы обработки текстов

Статус: Курс обязательный (Информатика и вычислительная техника)
Когда читается: 4-й курс, 1, 2 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 6

Программа дисциплины

Аннотация

Спецкурс предназначен для студентов, желающих получить знания и практические навыки в области обработки текстовой информации. Курс знакомит слушателей с основными проблемами компьютерной обработки текстов и современными подходами к их решению. Рассматриваются как фундаментальные понятия и идеи, так и современные исследования в данной области. Особое внимание уделяется применению методов машинного обучения, которые активно развиваются в настоящее время и показывают лучшие результаты. Актуальность обработки текстовой информации на естественном языке связана с ростом количества документов, доступных для автоматической обработки, потребностью в их анализе и наличием вычислительных ресурсов. Слушатели получат базовые знания в области обработки текстов на естественном языке, понимание проблем, возникающих при разработке систем текстового анализа, и подходов к их решению.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины является получение базовых знаний в области обработки текстов на естественном языке, а также приобретение навыков решения задач, возникающих при разработке систем текстового анализа.
Планируемые результаты обучения

Планируемые результаты обучения

  • Способность решать проблемы в профессиональной деятельности на основе анализа и синтеза
  • Способность вести исследовательскую деятельность, включая анализ проблем, постановку целей и задач, выделение объекта и предмета исследования, выбор способа и методов исследования, а так-же оценку его качества
  • Способность использовать методы и инструментальные средства исследования объектов профессиональной деятельности
  • Способность использовать различные технологии разработки программного обеспечения
  • Способность обосновать принимаемые проектные решения, осуществлять постановку и выполнение экспериментов по проверке их корректности и эффективности
  • Способность оценивать потребность в ресурсах и планировать их использование при решении задач в профессиональной деятельности
  • Способность применять основные методы и инструменты разработки программного обеспечения
  • Способность проектировать, конструировать и тестировать программные продукты
  • Способность читать, понимать и выделять главную идею прочитанного исходного кода, документации
  • Способность  Способен работать с информацией: находить, оценивать и использовать информацию из различных источников, необходимую для решения научных и профессиональных задач (в том числе на основе системного подхода)
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение
  • Базовые методы обработки текстов
  • Современные методы обработки текстов
  • Задачи обработки текстов
  • Семантический анализ текстов
  • Прикладное применение методов анализа текстов
Элементы контроля

Элементы контроля

  • неблокирующий Экзамен
  • неблокирующий Домашнее задание
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.25 * Домашнее задание + 0.25 * Домашнее задание + 0.5 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Bird, S., Loper, E., & Klein, E. (2009). Natural Language Processing with Python. O’Reilly Media.
  • Ian Goodfellow, Yoshua Bengio, & Aaron Courville. (2016). Deep Learning. The MIT Press.

Рекомендуемая дополнительная литература

  • Введение в информационный поиск, Маннинг, К. Д., 2014
  • Искусственный интеллект : современный подход, Рассел, С., 2006
  • Программируем коллективный разум, Сегаран, Т., 2008

Авторы

  • Романова Ирина Ивановна