• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Диссертации, представленные на защиту и подготовленные в НИУ ВШЭ

Сортировка:по дате защитыпо имени научного руководителяпо имени соискателя

Показаны работы: 1 - 10 из 12

Система цветообозначений в балканославянских языках в сопоставлении с албанским и румынским (этнолингвистический аспект)Кандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Чиварзина Александра Игоревна
Руководитель:
Плотникова Анна Аркадьевна
Дисс. совет:
Совет по филологии
Диссертация посвящена исследованию лексики цветообозначений, ее семантике и символике, культурным функциям и географии в балканославянских языках (болгарском, македонском, сербском) в сопоставлении с неславянскими балканскими – албанским и румынским. Выявление общих и специфических черт исследуемых языков на примере систем цветообозначения, а также направление взаимных влияний стало целью исследования. Работа выполнена с применением этнолингвистического подхода, позволяющего увидеть, как функционируют колоронимы в культурных текстах, как в них отражаются мифологические представления и как система цветообозначений может эволюционировать под влиянием изменяющихся культурных условий. Актуальность исследования обусловлена тем, что до сих пор сопоставление систем цветообозначений в рассматриваемых языках и место систем цветообозначений в балканской модели мира названных народов ранее не становились предметом специального исследования.
Диссертация [*.pdf, 2.19 Мб] (дата размещения 4/4/2024)
Резюме [*.pdf, 257.85 Кб] (дата размещения 4/4/2024)
Summary [*.pdf, 199.85 Кб] (дата размещения 4/4/2024)

Модели и методы автоматической обработки неструктурированных данных в биомедицинской областиДокторская диссертацияУченая степень НИУ ВШЭ

Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
11/7/2023
Диссертационная работа представляет собой комплексное исследование, направленное на улучшение эффективности моделей и методов автоматической обработки текстов в биомедицинской области на основе современных языковых моделей архитектуры Трансформер. Разработаны новые модели и методы классификации и извлечения информации, в том числе модель связывания именованных сущностей, оптимизирующая сходство представлений сущностей и концептов, многоязычные модели для распознавания именованных сущностей, мультимодальные методы для обнаружения побочных реакций на лекарственные препараты. Впервые предложены и созданы аннотированные корпуса текстов на английском и русском языках из различных биомедицинских источников: научные абстракты (корпус NEREL-BIO), пользовательские отзывы о лекарствах (RuDReC), электронные медицинские карты (RuCCoN) и клинические испытания. Предложены новые подходы к оценке моделей связывания именованных сущностей. Эффективность предложенных моделей и методов подтверждена в рамках большого числа вычислительных экспериментов и открытых тестирований CLEF eHealth 2017 Task 1, #SMM4H Shared Tasks 2019-2021 годов. Предложенные корпуса, кодовая база и другие материалы находятся в открытом доступе.
Диссертация [*.pdf, 10.78 Мб] (дата размещения 7/27/2023)
Резюме [*.pdf, 1.89 Мб] (дата размещения 7/27/2023)
Summary [*.pdf, 1.81 Мб] (дата размещения 7/27/2023)

Синтаксис тохарских языков в сопоставительном аспектеКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Курицына Анна Вячеславовна
Дисс. совет:
Совет по филологии
Дата защиты:
6/13/2023
Тохарский А и тохарский В – два близкородственных индоевропейских языка, на которых говорили в оазисах Таримского бассейна вдоль северного Шелкового пути (современный китайский Синьцзян). Известны благодаря написанным на них рукописям 5-9 вв. н.э., обнаруженным в начале 20 в. Типологические особенности тохарской грамматики и вопрос об их возможном источнике важны для понимания истории тохар и их языковых контактов до и после заселения оазисов Таримского бассейна. Но, в отличие от лексических заимствований, возможные структурные параллели в языках тохарского лингвистического ареала остаются малоизученными. Диссертация исследует несколько явлений, связанных с синтаксисом именных и глагольных конструкций в тохарских языках: 1) повтор предлога при сочиненных именных группах, 2) групповая адъективация сочиненных именных групп, 3) выбор между «медиальным» и «активным» причастием настоящего времени в атрибутивной позиции, 4) выбор между «активным» причастием настоящего времени и некоторыми именами деятеля, 5) варьирование позиции абсолютивного оборота в предложении. Для каждой из перечисленных тем сравниваются данные обоих тохарских языков, поскольку, несмотря на близкое родство тохарского А и тохарского В, реализация отдельных синтаксических характеристик в них может существенно различаться. Также предпринимается попытка интерпретации обсуждаемых явлений в типологическом и ареальном контексте. Исследовательский корпуссоставили все доступные для изучения письменные памятники тохарских языков, опубликованные в электронных проектах CEToM, TITUS и IDP (“International Dunhuang Project”). Полученные результаты могут быть интересны лингвистам, занимающимся исследованиями по ареальной лингвистике Восточного Туркестана и по типологии синтаксических заимствований.
Диссертация [*.pdf, 2.30 Мб] (дата размещения 2/22/2023)
Резюме [*.pdf, 378.45 Кб] (дата размещения 2/22/2023)
Summary [*.pdf, 330.26 Кб] (дата размещения 2/22/2023)

Бенефактивные конструкции в современной японской речи: корпусное исследованиеКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Соломкина Наталия Алексеевна
Руководитель:
Подлесская Вера Исааковна
Дисс. совет:
Совет по филологии
Дата защиты:
5/16/2023
Диссертация посвящена комплексному анализу синтаксиса и семантики японских бенефактивных конструкций на материале устного и письменных корпусов. Под бенефактивной конструкцией мы понимаем конструкцию, состоящую из конверба и одного из семи бенефактивных вспомогательных глаголов. При этом рассматриваются случаи употребления таких конструкций во всех дополнительных значениях (малефактивном и др.), а не только в собственно бенефактивном. В работе проверяются и уточняются с помощью корпусных данных существующие гипотезы: о возможности употребления бенефактивов со смысловыми глаголами разной степени переходности, о схожести японских бенефактивов и инверсива, о степени морфологичесой и синтаксической автономности частей японских бенефактивных конструкций. Также впервые предлагается объединенная классификация возможных значений японских бенефактивных конструкций, применимая ко всем семи бенефактивным вспомогательным глаголам.
Диссертация [*.pdf, 20.88 Мб] (дата размещения 3/6/2023)
Резюме [*.pdf, 980.49 Кб] (дата размещения 3/6/2023)
Summary [*.pdf, 633.43 Кб] (дата размещения 3/6/2023)

Анализ тональности текстов из социальных сетей на основе методов машинного обучения для мониторинга общественных настроенийКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Сметанин Сергей Игоревич
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
12/15/2022
Данная работа посвящена разработка моделей, методов и программных комплексов, предназначенных для мониторинга общественных настроений путем анализа тональности текстовых постов из социальных сетей, написанных на русском языке. Предлагаемые модели и методы открывают путь к дальнейшему развитию мониторинга общественных настроений на основе контента из социальных сетей и позволяют заинтересованным сторонам измерять общественные настроения не только автоматически, но и за прошлые периоды времени. Для анализа настроений были выявлены наиболее эффективные подходы с точки зрения качества классификации русскоязычных текстов. Для решения проблемы отсутствия 100% точности классификационных алгоритмов была предложена новая модель и метод моделирования, позволяющий оценить влияние погрешности ошибочной классификации на вычисляемые индексы общественного настроения. Для расчета индексов настроений была предложена новая модель и метод расчета индекса настроений на основе цифровых следов, учитывающий демографические характеристики пользователей. Предложенные модели и методы были применены к данным социальной сети «Одноклассники» и был рассчитан индекс общественного настроения на основе текстовых постов. Полученный индекс продемонстрировал высокую корреляцию с традиционным опросным Индексом счастья ВЦИОМ.
Диссертация [*.pdf, 12.22 Мб] (дата размещения 10/14/2022)
Резюме [*.pdf, 4.11 Мб] (дата размещения 10/14/2022)
Summary [*.pdf, 4.02 Мб] (дата размещения 10/14/2022)

Корпусные методы как инструмент исследования микродиахронии русского языка XVIII-XXI вековДокторская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Добрушина Екатерина Роландовна
Дисс. совет:
Совет по филологии
Дата защиты:
12/15/2022
В диссертации изложены результаты корпусных исследований разноуровневых единиц русского языка. В области морфемной семантики анализируется развитие многозначности корня благ-, интересного энантиосемией, а также связанного корня -каз- и русских глагольных приставок: например, с опорой на представления о единой семантике приставок по- и об- обсуждается история глагола покрестить. В области формообразования рассматривается, во-первых, история попытки вхождения в язык притяжательного местоимения ихний. Во-вторых, анализируется трансформация системы деепричастий от такой, при которой они образуются двумя разнотипными суффиксами вне зависимости от вида образующего глагола, к современной, в которой выбор суффикса зависит от вида. В-третьих, рассматривается судьба уходящих из языка форм невозвратных деепричастий с суффиксом -вши (например, снявши). Наконец, рассмотрена языковая игра с ненормативным окончанием -ов для существительных женского рода (рыбов, собаков и др.) и в связи методикой этого исследования введено понятие «нанодиахрония». В области лексики рассматривается, во-первых, микродиахроническая история семи идиоматизированных сочетаний, грамматиколизовавшихся в кванторных значениях (постольку-поскольку, будь здоров, малая толика и др). Во-вторых, изменение семантики религиозных лексем, обусловленное отходом от религиозного восприятия мира в XIX веке, затем частичным запретом на подобное восприятие на советском этапе и возвращением к нему в постсоветское время. На стыке формообразования и синтаксиса анализируется выбор для функции сказуемого полной или краткой формы прилагательного, относящегося к семантическому типу «цвет» (цветок алый / ал). Наконец, в области синтаксиса описывается соотношение с нормой в течение 300 лет абсолютивного деепричастного оборота. Таким образом, работа объединяет микродиахронические исследования семантического и грамматического движения разнотипных языковых единиц и обобщает их результаты с тем, чтобы сделать выводы о методах микродиахронических исследований русского языка трех последних веков.
Диссертация [*.pdf, 2.84 Мб] (дата размещения 10/6/2022)
Резюме [*.pdf, 323.10 Кб] (дата размещения 10/6/2022)
Summary [*.pdf, 648.42 Кб] (дата размещения 10/6/2022)

Лингвистическая интерпретация и оценка векторных моделей слов русского языкаКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Шаврина Татьяна Олеговна
Дисс. совет:
Совет по филологии
Дата защиты:
5/13/2022
Предлагаемая диссертация посвящена разработке методик лингвистической интерпретации и оценки векторных моделей слов для русского языка. Векторные модели слов и текстов являются базовой компонентой современных механизмов автоматического анализа текста и задействованы в широком ряде задач, как прикладных, так и теоретических, в частности, в задаче статистического моделирования языка. В качестве основного инструмента оценки качества такого моделирования языка и общей интеллектуальности моделей выступают корпуса языковых тестов. Корпуса являются самым доступным способом обучения векторных моделей и одновременно обладают высокой вариативностью, необходимой для формулировки интеллектуальных задач. В работе приводится обзор актуальной методологии обучения и тестирования интеллектуальных систем, в которых векторные модели слов и текстов являются объектами исследований. Впервые представляется набор корпусов и инструментов оценки для русскоязычных векторных моделей слов и текстов. Набор корпусов формирует т.н. бенчмарк, то есть позволяет выстроить общий рейтинг качества векторных моделей для русского языка одновременно на множестве задач. К настоящему времени с помощью представляемого бенчмарка было оценено 1530 моделей. Для каждой из них проведена оценка качества выполнения интеллектуальных задач и подверженности различным типам ошибок, а также устойчивости модели к разнообразным языковым явлениям.
Диссертация [*.pdf, 3.44 Мб] (дата размещения 3/2/2022)
Резюме [*.pdf, 436.97 Кб] (дата размещения 3/2/2022)
Summary [*.pdf, 371.60 Кб] (дата размещения 3/2/2022)

Социолингвистическая ситуация в Ладакхе (проблемы становления Ладакхи как письменного языка)Кандидатская диссертацияУченая степень НИУ ВШЭ

Руководитель:
Серебряный Сергей Дмитриевич
Дисс. совет:
Совет по филологии
Дата защиты:
11/12/2021
Диссертация посвящена одному из тибето-бирманских языков современной Азии – ладакхи. В работе впервые дается детальное описание сферы функционирования ладакхи, рассматривается процесс становления ладакхи как письменного языка, а также факторы, влияющие на этот процесс. Кроме того, предпринимается попытка рассмотреть ситуацию ладакхи в более широкой, сравнительно-исторической перспективе. В России языком ладакхи до сих пор почти никто не занимался. Небогата научная литература о нем и на европейских языках. На конкретную же тему данной работы специальных исследований пока вообще не было.Ладакхи – идиом, распространенный в основном на территории Ладакха (региона, до 2019 года входившего в состав штата Джамму и Кашмир), а также в районах Китая и Пакистана, граничащих с нынешним Ладакхом. Большинство ладакхцев считают тибетский и ладакхи одним языком и часто объединяют их лингвонимом «бхоти». Последние несколько десятилетий на уровне центрального правительства Индии обсуждается вопрос о будущей государственной политике в отношении языка ладакхи и нескольких других языков тибето-бирманской группы, на которых говорят в пригималайской Индии различные этнические группы. Подавляющее большинство чиновников, работников сферы образования и буддийских лам Ладакха до сих пор полагают, что ладакхи – это не отдельный язык, а лишь устная форма классического тибетского, каковой ему и надлежит оставаться. А любые попытки письменной кодификации языка они воспринимают как посягательство на святыню, так как, по их мнению, тибетский язык был создан Тхонми Самбхотой для записи священных буддийских текстов и должен оставаться неизменным. Тем не менее, за прошедшие сорок с лишним лет произошли значительные изменения. Теперь, когда ладакхи постепенно становится письменным языком, людям, ратующим за его развитие, приходится решать множество проблем, связанных с тем, что долгое время ладакхи существовал в качестве «низкого» языка в условиях диглоссии. Будущее ладакхи как самостоятельного письменного языка зависит, вероятно, не только и даже не столько от ситуации в самом Ладакхе, сколько от развития языковой ситуации во всех «бхоти-язычных» областях Индии и от государственной политики по отношению к языковым проблемам этого региона.
Диссертация [*.pdf, 7.12 Мб] (дата размещения 8/20/2021)
Резюме [*.pdf, 275.33 Кб] (дата размещения 8/20/2021)
Summary [*.pdf, 235.91 Кб] (дата размещения 8/20/2021)

Некоторые вопросы сегментной и супрасегментной фонологии и фонетики адыгских языковКандидатская диссертацияУченая степень НИУ ВШЭ

Дисс. совет:
Совет по филологии
Дата защиты:
6/10/2021
Диссертационная работа посвящена изучению фонологии и фонетики адыгских идиомов (абхазо-адыгская языковая семья). Так как основным предметом исследования является разнообразие адыгских идиомов, в первой главе представлена подробная социолингвистическая картина расселения адыгов и среднего и высшего образования на адыгских языках. Исследование направлено как на сегментную, так и на супрасегментную сторону языков. В диссертации впервые предлагается единообразное описание вокалических и консонантных систем, вводятся в научный оборот новые данные, собранные в ходе полевых исследований в 21 адыгском ауле, а также представлены исследования системы ударения, слоговой структуры и скорости речи в отдельных адыгских идиомах. Данные о звуковых инвентарях собраны автором в базу данных «The Circassian Consonant Correspondences Database», которая стала основой для кластеризации идиомов на основании фонологических инвентарей и регулярных соответствий, во многом совпавшая с традиционной классификацией адыгских языков. Для анализа слоговой структуры был разработан и применен алгоритм, который позволяет полуавтоматически проводить исследования слоговой структуры.
Диссертация [*.pdf, 14.07 Мб] (дата размещения 4/8/2021)
Резюме [*.pdf, 1.73 Мб] (дата размещения 4/8/2021)
Summary [*.pdf, 1.57 Мб] (дата размещения 4/8/2021)

Финитные стратегии релятивизации в славянских языкахКандидатская диссертацияУченая степень НИУ ВШЭ

Руководитель:
Сай Сергей Сергеевич
Дисс. совет:
Совет по филологии
Дата защиты:
9/7/2020
В статьях, собранных в настоящей диссертации, рассматриваются финитные относительные конструкции в славянских языках и в особенности в русском, при этом основное внимание уделяется структурам, демонстрирующим внутриязыковую и/или межъязыковую вариативность. Три статьи посвящены общеславянским закономерностям в выборе между следующими типами финитных конструкций: со специализированными и неспециализированными относительными местоимениями (например, кој‑што и кој в македонском), с местоимениями типа ‘который’ и ‘кто’ (‘те, кто были’ vs. ‘те, которые были’), с согласованием предиката с вершиной по лицу и без согласования (например, меня, который хочу vs. меня, который хочет). В остальных шести статьях, включенных в диссертацию, преимущественно рассматриваются русские данные, например выбор между средствами релятивизации посессора (человек, чей дом vs. человек, дом которого), между одушевленным и неодушевленным маркированием местоимения который (животное, которое выбрали vs. животное, которого выбрали), между согласованием и несогласованием предиката в относительной конструкции с вершиной по числу (те, кто пришел vs. те, кто пришли). Славянские данные в диссертационном исследовании рассматриваются в рамках подхода внутригенетической типологии, что позволяет выдвинуть некоторые гипотезы о типологических тенденциях в устройстве финитных относительных конструкций.
Диссертация [*.pdf, 6.10 Мб] (дата размещения 6/25/2020)
Резюме [*.pdf, 622.54 Кб] (дата размещения 6/25/2020)
Summary [*.pdf, 485.36 Кб] (дата размещения 6/25/2020)