Специализация «Компьютерная лингвистика»
Специализация по компьютерной лингвистике программы "Теория языка и компьютерная лингвистика" направлена на формирование следующих компетенций :
- обладание хорошей базой в знании современных лингвистических технологий, математических методов работы с данными;
- понимание, как устроена современная электронная языковая среда и умение увидеть в ней новые проектные задачи, умение их формулировать и формализовать;
- умение работать с данными: понимать, какие именно данные нужны для решения поставленной задачи, как взаимодействуют лингвистические и иные данные, откуда их можно получить;
- понимание, какие языковые структуры лежат за той или иной локальной задачей, каковы лингвистические и экстралингвистические свойства текстов, используемых для решения задач;
- знание, какие лингвистические технологии следует применять в зависимости от условий задачи, понимать на какие лингвистические данные и ресурсы может опираться технология;
- умение программировать прототипы и модели решений;
- умение подготавливать необходимые лингвистические ресурсы;
- умение проектировать цепочку процесса обработки языковых данных;
- умение интерпретировать результаты автоматической обработки лингвистических данных;
- умение оценить трудоемкость разных решений и пороги допустимых ошибок;
- умение выбирать оптимальную методологию тестирования.
Роль компьютерного лингвиста позиционируется программой как точка пересечения других профессиональных компетенций: собственно программистских, менеджерских, экспертных лингвистических и др. Такое понимание соответствует междисциплинарному характеру большинства задач и командному подходу к их решениям.
Структура специализации
Основная часть
- математические модели компьютерной лингвистики;
- программирование для лингвистов (практический курс);
- машинное обучение
- интегрированный курс двухгодового цикла по компьютерной лингвистике;
- мастер-класс по компьютерной лингвистике: гостевые лекции специалистов из ключевых компаний, занимающихся разработками в области лингвистических технологий;
- научно-исследовательский семинар «Проектирование лингвистических ресурсов и систем»: командные проекты по лингвистическим технологиям, осуществляемые в тесном взаимодействии с основными работодателями и практикующими специалистами; основная площадка для подготовки магистерской дипломной работы.
Курсы по выбору
- digital humanities;
- машинный перевод
- речевые технологии;
- онтологии и семантические технологии;
Преподаватели
В программе принимают участие преподаватели школы лингвистики НИУ ВШЭ, а также преподаватели кафедры высшей математики и факультета компьютерных наук.
Рынок труда
Специалисты по компьютерной лингвистике востребованы и в самых крупных компаниях, занимающихся собственно автоматической обработкой текста (Яндекс, АBBYY, Mail.ru), и в других крупных, средних и мелких компаниях, занимающихся менеджментом текстового контента или анализом неструктурированных данных.
