• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Научно-исследовательский семинар "Вопросы автоматической обработки текста"

Статус: Курс по выбору (Филология)
Когда читается: 4-й курс, 2, 3 модуль
Охват аудитории: для всех кампусов НИУ ВШЭ
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Научно-исследовательский семинар «Вопросы автоматической обработки текста» посвящен подготовке студентов к проведению собственных исследований и написанию научных работ в области компьютерной лингвистики. В ходе занятий слушатели знакомятся с направлениями в компьютерной лингвистики, учатся использовать программные системы для обработки текстов на естественном языке.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знакомство студентов с основными задачами компьютерной лингвистики и digital humanities и с программными средствами для обработки и визуализации текстовых данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент знает основные задачи в области прикладной лингвистики и автоматической обработки текстов.
  • Студент умеет грамотно оформить текст собственного исследования, ориентируется в научной литературе по вопросу.
  • Студент умеет пользоваться программными средствами для автоматической обработки текстов, ориентируется в лингвистических ресурсах.
  • Студент умеет создавать корпусы текстов для собственных исследований, размечать данные.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Текст как объект исследования в компьютерной лингвистике
  • Исследования в области компьютерной лингвистики и смежных дисциплин
  • Системы обработки текстовых данных и ресурсы
  • Общие принципы организации научной работы
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
    Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Асинхронный элемент контроля. Оценивается по принципу "зачет/незачет". При выполнении задания студенты могут использовать только те генеративные модели ИИ, которые указаны в условии задания. Если в тексте задания не оговорено иное, то применять можно только эти модели и только для тех задач, которые прописаны в условии. Использование ИИ должно сопровождаться указанием названия конкретной генеративной модели, которая применялась, и предоставлением ссылки на эту модель в Интернете. При нарушении требований использования ИИ за задание выставляется оценка 0.
  • неблокирующий Экзамен
    Представляет собой эссе по теме дипломной работы студента. Объем - около 20 тыс. знаков. Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Асинхронный элемент контроля. Оценивается по 10-балльной шкале. Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. В случае возникновения сомнений в самостоятельности подготовки текста работы может быть проведено устное собеседование по содержанию работы.
  • неблокирующий Доклад
    Доклад работы представляет собой презентацию результатов исследования в формате доклада. По структуре доклад соответствует требованиям к защите выпускной квалификационной работы. В докладе следует обосновать исследовательский вопрос, описать источники/исследовательские данные и методы работы с ними, дать аргументированный ответ на исследовательский вопрос, показывающий, как были получены основные выводы. Доклад должен сопровождаться презентацией, содержащей наглядный графический (таблицы, схемы) или иной материал, иллюстрирующий основные положения работы. При выполнении задания студенты могут использовать только те генеративные модели ИИ, которые указаны в условии задания. Если в тексте задания не оговорено иное, то применять можно только эти модели и только для тех задач, которые прописаны в условии. Использование ИИ должно сопровождаться указанием названия конкретной генеративной модели, которая применялась, и предоставлением ссылки на эту модель в Интернете. При нарушении требований использования ИИ за задание выставляется оценка 0.
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 3rd module
    0.3 * Доклад + 0.4 * Домашние задания + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Сабиржанов Равшан Анварович. (n.d.). Компьютерная Лингвистика Как Наука Автоматической Обработки Информации. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsclk&AN=edsclk.https%3a%2f%2fcyberleninka.ru%2farticle%2fn%2fkompyuternaya-lingvistika-kak-nauka-avtomaticheskoy-obrabotki-informatsii

Рекомендуемая дополнительная литература

  • Lappin, S., Fox, C., & Clark, A. (2010). The Handbook of Computational Linguistics and Natural Language Processing. Chichester, West Sussex: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=330500

Авторы

  • Кирина Маргарита Александровна
  • Кессель Ксения Витальевна