• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Паспорт образовательной программы

Направление подготовки

45.04.03 Фундаментальная и прикладная лингвистика

Утверждение программы
Протокол Ученого совета НИУ ВШЭ от 28.09.2018 № 10
Дата обновления паспорта
26.08.2019
Сетевая форма реализации

Нет

Срок, форма обучения и объем

2 года

Очная форма обучения, 120 з.е.

Язык реализации

RUSENG

Обучение ведётся на русском и английском языках

Специализация
Не предусмотрена
Квалификация выпускника

Магистр

Программа двух дипломов

Нет

Конкурентные преимущества программы

Образовательная программа «Цифровые методы в гуманитарных науках» готовит специалистов, которые владеют современными технологиями (программирование, анализ и визуализация данных, автоматическая обработка естественного языка, веб-девелопмент), понимают специфику гуманитарного знания и гуманитарных объектов исследования, знакомы с  лингвистической теорией и современными подходами к формальному описанию естественного языка. Это редкое сочетание делает выпускников программы востребованными в таких быстро растущих областях современной экономики знаний, как цифровые культурно-просветительские проекты, онлайн-образование и EdTech, электронные музеи и цифровое сохранение культурного наследия. Наряду с традиционным лекционно-семинарским форматом обучения на программе широко применяется проектный подход. В течение всего цикла студенты работают над групповыми проектами, одновременно приобретая как технические навыки, так и soft skills в области командной работы, проектного менеджмента, презентации и защиты результатов проекта.

Характеристика профессиональной деятельности и перечень профессиональных компетенций выпускника

Выпускники программы «Цифровые методы в гуманитарных науках» могут профессионально заниматься:

  • научно-исследовательской работой в гуманитарных (и некоторых социально-гуманитарных) областях с применением информационных технологий;
  • реализацией культурных, культурно-просветительских и образовательных цифровых проектов в государственных организациях, коммерческих компаниях, медиа и НКО;
  • выстраиванием коммуникации и посредничеством между гуманитарными исследователями и технологическими командами (например, в вузах)
  • педагогической работой, в т.ч. связанной с повышением цифровой грамотности, преподаванием технологических компетенций людям, не имеющих инженерно-технического высшего образования.

Профессиональные компетенции выпускника:

  • программирование
  • анализ данных, в т.ч. автоматическая обработка и анализ естественного языка
  • работа с текстовыми корпусами 
  • базовые навыки визуализации данных
  • базовые навыки оцифровки культурных объектов, создания для них цифровых репрезентаций
Характеристики образовательных модулей программы

Программа «Цифровые методы в гуманитарных науках» состоит из четырех основных блоков:
1.    Инженерно-математический
2.    Гуманитарный
3.    Когнитивно-лингвистический
4.    Проектный

1. Инженерно-математический блок 
Цель блока — вооружить студентов навыками программирования и работы с данными, а также привить основы математической культуры. Блок включает в себя следующие предметы:
Математика (адаптационный курс)
Цель курса — познакомить студентов с языком математики и основными общематематическими понятиями, сформировать навык оперировать абстрактными объектами, научить корректно употреблять математические понятия и символы. 3. Компетенции обучающегося, формируемые в результате освоения дисциплины По итогам освоения дисциплины студент должен  знать базовые математические понятия и определения, необходимые для дальнейшего изучения прикладных математических дисциплин, уметь формализовывать задачи и применять необходимый математический инструментарий при их решении. Темы курса:
●    Элементы теории множеств и комбинаторики
●    Исследование функций одной переменной 
●    Введение в теорию вероятностей
Математические основы анализа данных
Цель курса — создание у студента фундаментальной математической базы для дальнейшей работы с количественными методами анализа данных. В ходе курса изучаются следующие разделы математики: линейная алгебра, теория вероятностей, математический анализ, математическая логика, математическая статистика. Курс направлен на развитие логического мышления и умения оперировать абстрактными объектами, выработку навыка корректного употребления математических понятий и символов для выражения количественных и качественных отношений. 
В ходе курса студенты осваивают базовые математические понятия и определения, необходимые для дальнейшего изучения прикладных математических дисциплин, овладевают необходимым математическим инструментарием при решении задач, обучаются математической формализации задач, использованию основных принципов и методов анализа, линейной алгебры и теории вероятностей. Ожидается, что после прохождения курса студент будет способен производить в своей научной работе строгие математические рассуждения и доказательства.
Введение в науку о данных
Количественные исследования в современной науке опираются на общий набор ключевых компетенций: 
●    знание математической статистики и методов количественного анализа данных;
●    владение элементами компьютерных наук, связанными с манипуляцией большими объемами данных (сбор, очистка, подбор подходящей структуры для формального представления) и методами их визуализации;
●    прикладные навыки в области машинного обучения. 
Первая часть курса посвящена математической статистике, методам обработки и статистического анализа данных. Рассматриваются базовые понятия статистики (выборка, распределение, среднее, мода и медиана, доверительные интервалы, дисперсия и среднеквадратическое отклонение), методы проверки гипотез, дисперсионный анализ, анализ зависимостей. Одновременно на практике изучаются инструменты для проведения статистического анализа, подходы к сбору и подготовке данных для анализа. 
Во второй части курса осваиваются методы визуализации данных: графики диаграммы рассеяния, визуализация погрешностей, гистограммы. От простых методов визуализации малоразмерных данных студенты переходят к более сложным методам разведочного анализа, подходящим для многомерных данных, таким как метод главных компонент и многомерное шкалирование.
В третьей части курса изучаются основные методы машинного обучения. Рассматриваются классические задачи машинного обучения: регрессия, классификация, кластеризация. Изучаются основные алгоритмы машинного обучения: наивная байесовская классификация, линейная регрессия, метод опорных векторов, деревья решений, случайные леса, классификатор на основе метода k-средних. Курс также покрывает применение современных алгоритмов с применением искусственных нейронных сетей и основы глубинного обучения. Упор делается на задачи машинного обучения, применяемые при анализе текстовых данных.  Студенты получают опыт применения инструментов анализа данных к современным задачам лингвистики и гуманитарных наук.  
Программирование (Python). 
Цель курса — знакомство с основами функционального и объектно-ориентированного программирования, обучение применению функционального и объектно-ориентированного программирования для решения задач обработки текстовых и числовых данных. В ходе курса студенты учатся применять средства языка Python для решения статистических задач, осваивают инструменты машинного обучения, реализованные в Python, а также на практике знакомятся с библиотеками Python, применяемыми в современных научных исследованиях. 
Курс знакомит студентов с различными парадигмами программирования и основными особенностями архитектуры языка Python. Рассматриваются основы синтаксиса Python, типы данных, поддерживаемые в этом языке, его возможности по работе с файловой системой и операционной системой.
Веб-девелопмент
Цель курса— снабдить студентов навыками создания веб-сайтов и веб-приложений. В программу курса входят базовое знакомство с устройством сети Интернет, освоение основ системы контроля версий Git, верстки и разработки веб-сайтов и веб-приложений с использованием современных технологий и получение практических навыков разработки бизнес-логики с использованием языка программирования Python и предназначенных для этого фреймворков (Flask, Django).

2. Гуманитарный блок
Гуманитарный блок программы посвящен истории и современному состоянию гуманитарных наук, в частности, современным цифровым гуманитарным исследованиям. В исторической части (курс «Эволюция гуманитарного знания») основное внимание уделяется выработанным в гуманитарных науках принципам и практикам формализации сложно организованных культурных объектов. Гуманитарный блок включает в себя следующие предметы:
Эволюция гуманитарного знания
В курсе рассматривается история гуманитарного знания и научного поиска в гуманитарных областях от Античности до XXI века. На протяжении веков интеллектуалы самых разных культур и традиций проявляли стремление к поиску закономерностей и общей логики развития в произведениях человеческой культуры — музыке, живописи, словесности, фольклоре. Вопреки стереотипу о субъективно-герменевтическом характере гуманитарных областей (который обычно противопоставляется объективным методам естественных дисциплин), история гуманитарной научной мысли знает множество попыток сделать универсальные обобщения, выявить законы эволюции культуры на основе анализа больших выборок, построить строгую формальную модель культурного объекта. 
Сегодня исследования такого рода вновь становятся актуальными и «переоткрываются» в связи с цифровым поворотом в гуманитарных науках. С одной стороны, с появлением информационных технологий многие масштабные исследовательские программы перестали быть неосуществимыми — самые тяжелые и трудоемкие их элементы теперь можно переложить на машину. С другой стороны, достижения математики, статистики и компьютерных наук подсказывают новые пути и подходы для исследований культурных объектов. Обсуждению этих подходов, а также связанных с ними сложностей и перспектив, посвящена основная часть курса.  
Цифровые гуманитарные науки
Цель курса — познакомить студентов с новыми исследовательскими подходами и задачами в литературоведении, лингвистике, истории, культурологии и философии, базирующимися на применении методов компьютерной обработки текста, анализа и визуализации данных в гуманитарных областях. Эти методы включают в себя создание и анализ корпусов текстов, построение статистических моделей, работу с большими данными, формализацию параметров текста, картографирование и т.п. Указанные методы широко используются в современной гуманитарной науке. Задача курса состоит в том, чтобы показать потенциал цифровых методов в гуманитарных исследованиях и снабдить студентов практическими навыками их применения. Курс включает в себя теоретический и практический компоненты. 
3. Когнитивно-лингвистический блок
Блок знакомит студентов с основными подходами к формализации языковых структур и научному осмыслению когнитивной деятельности человека. Блок включает следующие курсы:
Формальное представление естественного языка
Цель курса — познакомить студентов с методологическим аппаратом и теоретической базой формального моделирования языка и формального анализа языковых структур. Такой курс особенно актуален в свете современного цифрового поворота в гуманитарных науках, так как именно формальные модели позволяют работать с языковыми структурами как с машиночитаемым объектом, вести разработку инструментов автоматического анализа естественного языка. 

При моделировании естественно-языковых процессов формальные теории опираются каждая на свой набор исходных допущений о природе естественного языка и используют формальные языки, ограниченные рядом параметров и правил, предсказывающих допустимые и недопустимые языковые структуры. Формальные модели языка имеют тесную связь с формальной философией и логикой, а в прикладной сфере — также с компьютерными науками и сферой автоматической обработки естественного языка.  
В курсе рассматриваются основные теории, связанные с разными уровнями языка – фонетикой, морфологией, синтаксисом и семантикой.
Функциональные модели в естественном языке
Функциональные и когнитивные модели исходят из того, что язык является лишь одной из многих базовых когнитивных способностей  человека  и имеет много общего с другими когнитивными способностями. В языковой структуре когнитивисты видят отображение общих процессов, характерных для познания и мышления человека.  
Цель данного курса — познакомить студента с методологическим аппаратом и базовыми теоретическими положениями современных направлений функциональной и когнитивной лингвистики. Студентам будет предложен подход к языку как к инструменту, предназначенного для выполнения некоторых функций, прежде всего коммуникативной и когнитивной. Таким образом, это направление оказывается актуальным для всего спектра наук, объектом которых является человек, его творческая и мыслительная деятельность, продукты этой деятельности.
4. Проектный блок
Целью проектного блока является подготовка магистров к самостоятельной научно- исследовательской, научно-педагогической и проектно-организационной работе. В рамках проектно-исследовательского семинара студенты выполняют групповую проектную работу (в группах по 3-4 человека). В рамках исследовательского семинара — индивидуальную исследовательскую работу.
Групповая проектная часть проходит в 1-3 модуле первого года обучения и в 1-2 модулях второго года обучения. Эта работа состоит в реализации группой студентов проекта (разработке продукта), представляющего научный или общественный интерес в области цифровых гуманитарных технологий. Студенты от начала до конца работают над проектом самостоятельно, постоянно консультируясь с кураторами (преподавателями программы или внешними приглашенными экспертами). 
Работа над проектом строится следующим образом: 
Первый год: в 1 модуле — обзор возможных задач, выбор задачи для проекта, во 2 модуле — пилотные исследования, формирование технического задания, в 3 и 4 модуле — реализация пилотной версии проекта. На первом году по результатам разработки проекта проектная группа готовит научную публикацию, которая оценивается по индивидуальному вкладу каждого участника в качестве его курсовой работы.  
Второй год: в 1-2 модуле — финальная часть работы над проектом, разработка веб-приложения по результатам проекта. Индивидуальная исследовательская часть работы в рамках научно-исследовательского семинара проходит в 3-4-м модулях второго года обучения.
Предметом коллективного обсуждения на семинаре являются проектные работы студентов на первом году и магистерская диссертация на втором.
 

Адаптация программы для обучения лиц с ограниченными возможностями здоровья и инвалидов

Образовательная программа высшего образования НИУ ВШЭ адаптирована для обучения на ней инвалидов и лиц с ограниченными возможностями здоровья. В учебном процессе используются специальные технические средства обучения коллективного и индивидуального пользования для инвалидов и лиц с ограниченными возможностями здоровья. Особенности адаптации программ учебных дисциплин содержатся в полной версии каждой программы учебной дисциплины и доступны студентам через электронную образовательную среду.

Комплект документов образовательной программы

Все документы образовательной программы хранятся в электронном виде на настоящем сайте образовательной программы. Учебные планы, календарные учебные графики, программы учебных дисциплин разрабатываются и проходят электронные процедуры утверждения в корпоративных информационных системах. Их актуальные версии автоматически публикуются на сайте ОП. Методические материалы, оценочные средства и иные материалы образовательной программы в актуальном виде хранятся на сайте образовательной программы в соответствии локальными нормативными актами университета.

Подтверждаю актуальность комплекта документов образовательной программы, размещенных на настоящем сайте образовательной программы.

Проректор С.Ю. Рощин

Паспорт образовательной программы «Цифровые методы в гуманитарных науках»

Перейти к содержанию программы