Бакалавриат
2019/2020
Компьютерная лингвистика
Статус:
Курс по выбору (Филология)
Направление:
45.03.01. Филология
Кто читает:
Департамент филологии
Где читается:
Санкт-Петербургская школа гуманитарных наук и искусств
Когда читается:
4-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Шерстинова Татьяна Юрьевна
Язык:
русский
Кредиты:
3
Контактные часы:
42
Программа дисциплины
Аннотация
Курс предполагает знакомство студентов с основными направлениями и методами компьютерной лингвистики, формированию у них практических навыков работы с лингвистическими ресурсами и программами компьютерного анализа текстов, построение собственного корпуса текстов или лингвистической базы данных и проведение лингвистического исследования с использованием компьютерных средств. Курс предназначен для студентов-филологов и не требует специальной компьютерной подготовки или навыков программирования. Предлагаемый курс будет полезен не только студентам лингвистического направления, но и студентам-литературоведам, поскольку синтез традиционного и компьютерного подхода в филологических исследованиях является весьма перспективным.
Цель освоения дисциплины
- Получение студентами знания об основных методах и направлениях развития компьютерной лингвистики.
- Приобретение студентами навыков адекватного пользование основными программными продуктами, необходимыми при работе с текстами и корпусами текстов, и навыков создания собственных корпусов текстов для решения локальных научных и академических задач.
Планируемые результаты обучения
- Студент имеет представление об основных задачах и приложениях компьютерной лингвистики.
- Студент знает программы по автоматической обработке текстов на лексическом и морфологическом уровнях и умеет ими пользоваться
- Студент знает программы по автоматической обработке текстов на синтаксическом, семантическом и прагматическом уровнях и умеет ими пользоваться.
- Студент знаком с основами статистического анализа, методами и подходами квантитативной лингвистики
Содержание учебной дисциплины
- Основные задачи, основания и приложения компьютерной лингвистикиМатематические и лингвистические основания компьютерной лингвистики. Основные понятия компьютерной лингвистики. Компьютерная лингвистика в контексте смежных дисциплин — общей лингвистики, компьютерной лингвистики, квантитативной лингвистики, корпусной лингвистики, цифровой гуманитаристики и др. Компьютерные, корпусные и информационные технологии для лингвистов и литературоведов. Онлайн ресурсы для филологов.
- Возможности и программы автоматической обработки текстов на лексическом и морфологическом уровняхПостроение частотных словарей. Программы для лексикографической работы, лемматизация, морфологическая разметка, построение конкордансов и др.
- Возможности и программы автоматической обработки текстов на синтаксическом, семантическом и прагматическом уровняхКомпьютерный синтаксис. Компьютерное представление значений. Анализ прагматического аспекта.
- Основы статистики. Элементы квантитативной лингвистикиОсновные понятия и методы статистического анализа лингвистических данных. Дескриптивные статистики, проверка гипотез. Программы статистической обработки данных. Введение в стилеметрический анализ. Задачи атрибуции.
Элементы контроля
- ПрезентацияУстная презентация со слайдами PowerPoint готовится дома и должна отражать возможности и ограничения одной из современных компьютерных программ обработки лингвистических данных или программы, предназначенной для построения лингвистических теоретических моделей. Презентация, текст которой полностью заимствован из печатного или Интернет-источника и никак критически не переработан студентом, оценивается в 0 баллов.
- Практическая работа №1Постройте частотные словари для двух предложенных текстов. Сопоставьте состав и относительные частоты 25 наиболее употребительных слов.
- Домашнее заданиеЦель домашнего задания — получить навык работы с синтаксической разметкой, проверить качество синтаксической разметки программой ЭТАП-4 и программы ее визуализации (синтаксических схем предложения). Выполняется письменно. Направляется студентам по электронной почте. Студенты направляют ответ преподавателю также по электронной почте.
- Практическая работа № 2Краткая самостоятельная практическая работа на проверку владением основными статистическими понятиями и умением просчитывать их в MS Excel. Выполняется аудиторно. Время выполнения 20 минут, результат присылается в виде файла Excel по электронной почте не позднее времени окончания занятия. Таблица для анализа посылается студентам по электронной почте непосредственно перед проведением работы.
- Контрольная работаВыполняется письменно вне аудитории. Задачей итоговой контрольной работы — проверка того, как 1) студенты используют компьютерные программы обработки текста и 2) в какой мере студенты могут использовать статистические методы в лингвистических исследованиях.
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.2 * Домашнее задание + 0.3 * Контрольная работа + 0.2 * Практическая работа № 2 + 0.2 * Практическая работа №1 + 0.1 * Презентация
Список литературы
Рекомендуемая основная литература
- Davies, A., & Elder, C. (2004). The Handbook of Applied Linguistics. Malden, MA: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=108713
- Lappin, S., Fox, C., & Clark, A. (2010). The Handbook of Computational Linguistics and Natural Language Processing. Chichester, West Sussex: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=330500
Рекомендуемая дополнительная литература
- Baker, P., Hardie, A., & McEnery, T. (2006). A Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=169612