• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Компьютерная лингвистика: «мы ждем бакалавров разных специальностей»

На факультете филологии ВШЭ открывается новая магистерская программа «Компьютерная лингвистика», о которой рассказывают ее руководитель Екатерина Рахилина и заместитель руководителя направления «Фундаментальная и прикладная лингвистика» ВШЭ Анастасия Бонч-Осмоловская.

― Насколько актуальна магистерская программа по компьютерной лингвистике?

Екатерина Рахилина
Екатерина Рахилина
Екатерина Рахилина: На рынке труда специалисты по компьютерной лингвистике на сегодняшний день очень востребованы, а программ адресной подготовки компьютерных лингвистов в магистратуре пока нет, так что программа безусловно актуальна. В прошлом году в нижегородском кампусе Вышки была открыта такая специализация в рамках магистерской программы «Прикладная математика и информатика». С участия в подготовке магистратуры в Нижнем и началась разработка магистерской программы филологического факультета в Москве.

Анастасия Бонч-Осмоловская: Компьютерная лингвистика — это междисциплинарная область, и к ней обращаются разные специалисты: и лингвисты, и математики, и программисты, и те, кто занимаются анализом медиа, социальных сетей, используют в своих исследованиях информацию из «неструктурированных» (то есть текстовых) источников.

Когда мы сегодня говорим о компьютерной лингвистике, нужно понимать, что области применения лингвистических технологий стремительно расширяются. Ключевым элементом современного общественного устройства, которое часто называют «информационным обществом», является коммуникация — свободный обмен знаниями и информацией. Основной механизм коммуникации человека — это естественный язык. По сути, все современные лингвистические технологии направлены на то, чтобы сделать эту коммуникацию максимально эффективной. Это отличная ниша и с точки зрения рынка труда, и с точки зрения возможностей сделать что-то принципиально новое.

― Эта магистерская программа рассчитана в первую очередь на тех, кто имеет лингвистическое либо компьютерное образование?

Екатерина Рахилина: Не обязательно. Нам интересно, чтобы к нам пришли люди с разным базовым образованием. Был бы у них интерес к растущим сейчас в цене и популярности лингвистическим технологиям, которые они смогут применить в уже знакомой или совсем новой для них области. Это могут быть и лингвисты, и математики, и социологи, и даже маркетологи — никаких специальных ограничений здесь нет. Для того, чтобы помочь им преодолеть разрыв между прежней и новой специализацией мы запланировали специальные адаптационные курсы: курс по математике и программированию и курс по общей лингвистике.

― Как выстроена образовательная программа? Какие базовые курсы в ней представлены?

Екатерина Рахилина: Программой предусмотрен специальный курс программирования, который называется «Программирование для лингвистов». Этот курс интегрирован с курсом математики, который также ориентирован на лингвистов. Он называется «Математические основания компьютерной лингвистики» и нацелен на решение задач, связанных с обработкой текста и речи. Дело в том, что в компьютерной лингвистике многие задачи решаются исключительно математическими методами безо всякого обращения к лингвистике, и мы хотим, чтобы наши студенты могли в них разобраться, умели читать статьи по этой сугубо компьютерной тематике, представлять себе возможные технологические пути решения собственно лингвистических задач, а главное — чтобы они как будущие разработчики умели говорить на одном языке со своими коллегами — профессиональными программистами. Это, как нам кажется, безусловный залог успеха будущих компьютерных проектов — причем один из главных.

Кроме того, у нас в магистратуре будет два серьезных лингвистических курса — они представляют современные теории, которые складываются в рамках, соответственно, функциональной и формальной лингвистики. Теории меняются и сменяют друг друга — почему и как это происходит? — об этом интересно думать. Ну и конечно, о том, какие прикладные продукты рождаются из уже ушедших и еще живущих чисто теоретических идей.

Анастасия Бонч-Осмоловская: Но центральным курсом программы, вокруг которого все выстраивается, должен стать двухгодичный курс по компьютерной лингвистике. Мы не стали его разбивать на маленькие части, считаем, что это даст возможность более гибко планировать тематику и содержание занятий.

Кроме этого, есть две линейки курсов по выбору: одна линейка углубляющая, интенсивная, а вторая — экстенсивная. Отдельные крупные направления студенты будут иметь возможность изучить более глубоко. Например, машинный перевод. Это глобальная тема, которая в последнее время получила новый импульс в развитии. Или компьютерная лексикография — создание нового типа словарей. Это также актуальная задача, большая ниша для исследований и разработок. Или корпусные технологии, разработка и создание новых корпусов и продуктов на их основе. Замечу, что почти все преподаватели лингвистического направления факультета филологии так или иначе задействованы в подобных проектах — прежде всего, это конечно Национальный корпус русского языка, машинный перевод «Этап» и другие. И мы надеемся, что все курсы, которые мы объявляем, будут способствовать продвижению этих проектов. В частности, наши студенты-бакалавры уже принимают участие в разработках по оптимизации словарей. И студенты магистратуры, я уверена, с интересом включатся в эту работу.

Вторая линейка курсов — курсы «вширь». Это то, что немного выходит за пределы собственно компьютерной лингвистики. Например, мы рассчитываем, что у нас будет курс на английском языке «Digital humanities». Он о том, как можно компьютеризировать разные гуманитарные проекты и представить гуманитарное знание с помощью современных компьютерных инструментов. Предусмотрена и фундаментальная подготовка в области анализа данных — то, что позволит выпускникам быть востребованными в тех областях, которые прямо с лингвистикой не связаны.

И главное — это наш исследовательский проектный семинар. Идея такая: студенты работают в проектных группах, результатом будет создание реальных продуктов. И мы будем привлекать в качестве соруководителей практиков, работающих в сфере компьютерных лингвистических технологий, тех, кому эта проблематика интересна. Наша цель — создание живой среды, где будет рождаться новое.

― Какими вы видите своих выпускников, с какими умениями и навыками? Как будет выглядеть магистерская диссертация как итог обучения?

Анастасия Бонч-Осмоловская
Анастасия Бонч-Осмоловская
Анастасия Бонч-Осмоловская: Мы хотим, чтобы наши выпускники понимали, как устроена современная электронная языковая среда, могли сами увидеть, сформулировать новые проектные задачи, могли их формализовать и придумать алгоритмы решений. Наша программа открывается на базе филологического факультета в рамках направления «Фундаментальная и прикладная лингвистика». Поэтому центральной задачей является развитие именно лингвистических компетенций: умения работать с языковыми данными, понимания, какие языковые структуры стоят за решением той или иной локальной задачи, каковы лингвистические и экстралингвистические свойства текстов, как языковые данные взаимодействуют с неязыковыми, какие лингвистические технологии и ресурсы следует (или не следует) использовать для решения задач. Безусловно, наши выпускники должны будут уметь программировать прототипы и модели предлагаемых решений.

Мы рассчитываем, что у нас будут реальные проекты, проекты, направленные на создание инструментов и продуктов, которых пока нет, по крайней мере, для русского языка. Вообще, я считаю, что университеты должны делать некоммерческие проекты на благо общества, это должны быть открытые или частично открытые проекты, в зависимости от того, сколько сил и средств в них вложено. В американских университетах, например, такие ресурсы есть, и они играют очень важную роль в развитии современной науки. Если мы существуем в некоммерческом учреждении, то должны делать и некоммерческие продукты. Это общая идея нашего проектного семинара.

― То есть речь идет, прежде всего, о формировании среды профессионалов…

Екатерина Рахилина: Именно. Причем не узких, а широких специалистов. Может быть даже — в их числе — лингвистов-теоретиков, просто умеющих решить теоретическую задачу на другом технологическом уровне.

― Что требуется от желающих обучаться на магистерской программе по компьютерной лингвистике?

Анастасия Бонч-Осмоловская: Чтобы стать студентом магистерской программы «Компьютерная лингвистика», необходимо, прежде всего, сдать экзамен по иностранному языку. Это важно, потому что в магистратуре не предполагается преподавание иностранного языка (на это просто нет времени). Кроме экзамена, будет конкурс портфолио. В портфолио будет входить, во-первых, мотивационное письмо, а во-вторых, вся информация, которая поможет нам составить «профессиональный портрет» претендента: его успехи в бакалавриате, в академической сфере, практики, которые он проходил, проекты, в которых участвовал, публикации, выступления на конференциях, может быть, даже преподавание, — словом, все, что характеризует человека и отражает его мотивацию.

― Кто будет преподавать на этой программе?

Екатерина Рахилина: Преподавать в основном будут сотрудники факультета филологии, общеуниверситетской кафедры высшей математики, отделения прикладной математики и информатики, базовой кафедры Яндекса. Конечно, будут привлекаться и преподаватели других факультетов ВШЭ, и внешние специалисты. В частности, запланированы мастер-классы, которые будут проводить приглашенные эксперты в этой области, что полезно, кстати, и в плане знакомства с потенциальными работодателями.

 

Андрей Щербаков, Новостная служба портала ВШЭ

Вам также может быть интересно:

«Мы хотели показать, что изучение лингвистики — это актуально и нескучно»

Второй год подряд на конкурсе студенческих проектов факультета гуманитарных наук Вышки побеждает проект выпускников и студентов ВШЭ «Лингвоподкаст». Это серия аудиопрограмм о лингвистике и тех, кто ее изучает, в которых обсуждаются лингвистические исследования, карьерные перспективы, академическая деятельность студентов и выпускников Школы лингвистики. Новый сезон проекта готовится к запуску в ноябре 2023 года.

Разработанную при участии ВШЭ систему «Лингвотест» представили в Нижегородской области

Первую российскую систему сертификации по иностранному языку «Лингвотест» представили в Нижегородской области. Система разработана специалистами Высшей школы экономики совместно с Национальным аккредитационным агентством в сфере образования и Группой компаний «Просвещение», обеспечивающими сертификационную и издательскую поддержку проекта. Нижний Новгород станет первым городом после столицы, где можно будет получить сертификат «Лингвотеста».

Новый онлайн-курс ВШЭ представит язык как энергию

На Национальной платформе открытого образования стартовал новый курс Вышки «Лингвистические подходы к дискурсу». Сколько прилагательных на 1 тысячу слов мы используем в устной речи? Как ударение в слове «дискурс» поделило философов и лингвистов на два лагеря? На эти и другие вопросы отвечают авторы курса — доцент школы лингвистики Алексей Козлов и заведующая Лабораторией по формальным моделям в лингвистике Светлана Толдова.

Новая магистерская программа ВШЭ посвящена немецкоязычным странам

В 2020\21 учебном году на факультете гуманитарных наук НИУ ВШЭ откроется магистерская программа «Germanica: история и современность». Она направлена на подготовку специалистов широкого профиля по странам немецкоязычного ареала - Германии, Австрии и Швейцарии. Обучение будет проходить на русском и немецком языках, уровень владения немецким нужно подтвердить при поступлении. Об особенностях программы рассказывает ее академический руководитель Петр Резвых.

«Мы еще не выяснили, как устроены языки, но уже утрачиваем 90% их разнообразия»

Почему бабушка и внук могут не понимать друг друга? Зачем лингвистам ехать в Дагестан? Можно ли спасти языки малых народов и русские диалекты? Руководитель Международной лаборатории языковой конвергенции Нина Добрушина ответила на вопросы новостной службы портала.

Как нас правят гаджеты: могут ли девайсы и глобальная сеть заменить справочник по грамматике

Для человека, который хочет изучать язык и его устройство, в сети доступно невероятное количество данных: самые разные тексты на всех возможных языках. Сейчас, например, мы можем не просто посмотреть, как люди употребляют новое слово, но и проследить, когда оно появилось в языке и как со временем меняется его значение. О том, как интернет изменил лингвистику, — в авторской колонке размышляет доцент Школы лингвистики НИУ ВШЭ, преподаватель Школы анализа данных «Яндекса», заведующий сектором теоретической семантики и ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН Борис Иомдин.

Тест: лихие или роковые

Золотые шестидесятые, лихие девяностые — за каждым десятилетием недавней российской истории закрепилась своя память и устойчивые эпитеты. Самые распространенные из них выделили лингвисты НИУ ВШЭ на выборке из Национального корпуса русского языка. IQ.HSE предлагает по эпитетам определить, о каком времени идет речь.

Нейролирика

В книжной серии журнала «Контекст» вышла первая книга стихов, созданных нейронной сетью. Сборник «Нейролирика» объединил тексты, написанные в стиле поэтов разных эпох, от античности в русском переводе до Серебряного века и современности. Автор эксперимента, доцент Школы лингвистики НИУ ВШЭ Борис Орехов, рассказал IQ.HSE, зачем нужна компьютерная поэзия, и как это работает.

Местные, дистантные и русский

Сто лет назад большинство жителей высокогорного Дагестана владели как минимум двумя языками. Более того, мужчины, помимо знания местных наречий, обычно могли изъясняться еще на трех-четырех иностранных языках. Сегодня же в качестве единственного лингва франка для общения за пределами семьи и родного села дагестанцы используют русский. Причины утраты многоязычия и языковое распределение между гендерами описаны в статье Gendered Multilingualism in highland Daghestan: story of a loss.

Песни на заказ

В 1937 году издательство газеты «Правда» выпустило сборник «Творчество народов СССР». Более чем наполовину он состоял из поэтических переводов с армянского, украинского, казахского и других языков на русский. Эта книга могла продемонстрировать культурное разнообразие СССР, но на практике оказалась примером колониальной гомогенизации. Тому, как это происходило, посвящена статья доцента Школы филологии ВШЭ Елены Земсковой Soviet Folklore as Translation Project.