Бакалавриат
2025/2026




Научно-исследовательский семинар "Вопросы автоматической обработки текста"
Статус:
Курс по выбору (Филология)
Кто читает:
Департамент филологии
Где читается:
Санкт-Петербургская школа гуманитарных наук и искусств
Когда читается:
4-й курс, 2, 3 модуль
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Кирина Маргарита Александровна
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Научно-исследовательский семинар «Вопросы автоматической обработки текста» посвящен подготовке студентов к проведению собственных исследований и написанию научных работ в области компьютерной лингвистики. В ходе занятий слушатели знакомятся с направлениями в компьютерной лингвистики, учатся использовать программные системы для обработки текстов на естественном языке.
Цель освоения дисциплины
- Знакомство студентов с основными задачами компьютерной лингвистики и digital humanities и с программными средствами для обработки и визуализации текстовых данных.
Планируемые результаты обучения
- Студент знает основные задачи в области прикладной лингвистики и автоматической обработки текстов.
- Студент умеет грамотно оформить текст собственного исследования, ориентируется в научной литературе по вопросу.
- Студент умеет пользоваться программными средствами для автоматической обработки текстов, ориентируется в лингвистических ресурсах.
- Студент умеет создавать корпусы текстов для собственных исследований, размечать данные.
Содержание учебной дисциплины
- Текст как объект исследования в компьютерной лингвистике
- Исследования в области компьютерной лингвистики и смежных дисциплин
- Системы обработки текстовых данных и ресурсы
- Общие принципы организации научной работы
Элементы контроля
- Домашние заданияВместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Асинхронный элемент контроля. Оценивается по принципу "зачет/незачет". При выполнении задания студенты могут использовать только те генеративные модели ИИ, которые указаны в условии задания. Если в тексте задания не оговорено иное, то применять можно только эти модели и только для тех задач, которые прописаны в условии. Использование ИИ должно сопровождаться указанием названия конкретной генеративной модели, которая применялась, и предоставлением ссылки на эту модель в Интернете. При нарушении требований использования ИИ за задание выставляется оценка 0.
- ЭкзаменПредставляет собой эссе по теме дипломной работы студента. Объем - около 20 тыс. знаков. Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Асинхронный элемент контроля. Оценивается по 10-балльной шкале. Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. В случае возникновения сомнений в самостоятельности подготовки текста работы может быть проведено устное собеседование по содержанию работы.
- ДокладДоклад работы представляет собой презентацию результатов исследования в формате доклада. По структуре доклад соответствует требованиям к защите выпускной квалификационной работы. В докладе следует обосновать исследовательский вопрос, описать источники/исследовательские данные и методы работы с ними, дать аргументированный ответ на исследовательский вопрос, показывающий, как были получены основные выводы. Доклад должен сопровождаться презентацией, содержащей наглядный графический (таблицы, схемы) или иной материал, иллюстрирующий основные положения работы. При выполнении задания студенты могут использовать только те генеративные модели ИИ, которые указаны в условии задания. Если в тексте задания не оговорено иное, то применять можно только эти модели и только для тех задач, которые прописаны в условии. Использование ИИ должно сопровождаться указанием названия конкретной генеративной модели, которая применялась, и предоставлением ссылки на эту модель в Интернете. При нарушении требований использования ИИ за задание выставляется оценка 0.
Список литературы
Рекомендуемая основная литература
- Сабиржанов Равшан Анварович. (n.d.). Компьютерная Лингвистика Как Наука Автоматической Обработки Информации. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsclk&AN=edsclk.https%3a%2f%2fcyberleninka.ru%2farticle%2fn%2fkompyuternaya-lingvistika-kak-nauka-avtomaticheskoy-obrabotki-informatsii
Рекомендуемая дополнительная литература
- Lappin, S., Fox, C., & Clark, A. (2010). The Handbook of Computational Linguistics and Natural Language Processing. Chichester, West Sussex: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=330500