• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Версия для слабовидящихЛичный кабинет сотрудника ВШЭПоискМеню

Формальные подходы к информационной структуре: синтаксис, семантика, дискурс

Приоритетные направления развития: гуманитарные науки
2019

Цель работы

Целью проекта является развитие формальных подходов к анализу информационной структуры и явлений, связанных с взаимодействием информационной структуры и грамматического кодирования. Мы стремимся предложить описание исследуемых явлений с точки зрения формальных синтаксических, семантических и прагматических теорий.

В задачи проекта входит расширение эмпирической базы существующих в данной области формально-теоретических исследований, которое должно привести, в числе прочего, к пересмотру или углублению соответствующих теорий и моделей. В частности: (а) привлечь данные русского языка как языка со свободным порядком слов для исследования различных теоретических подходов к анализу отклонений от стандартного порядка слов; (б) привлечь конкретно-языковые данные разноструктурных языков, относящихся к разным семьям, собранные методом грамматического анкетирования; полученные таким методом данные позволяют применить существующие теории к языкам, для которых до сих пор отсутствовали парадигматические данные о грамматической правильности высказываний в различных условиях; (б) разработать дизайн экспериментов по выявлению механизма взаимодействия информационной структуры с порядком слов и интонацией; (г) отработать корпусные методы для обоснования тех или иных положений формальных теорий в исследуемой области; (д) предложить анализ новых данных, позволяющий выявить сильные и слабые стороны существующих теоретических подходов. Исследования затрагивают такие явления, как порядок слов и интонация, грамматическое кодирование аргументов, семантика и синтаксис фокусно-чувствительных элементов, связь информационной структуры со сферой действия операторных выражений, связь прагматических факторов с варьированием грамматического кодирования и др.

Используемые методы

Проект использует следующие методы работы с языковым материалом:

  • метод элицитации, в том числе и в полевых условиях: консультация с представительной выборкой носителей языка о грамматичности тех или иных предложений;
  • корпусный метод (поиск примеров интересующей исследователя формы в представительных корпусах текстов);
  • более сложные экспериментальные методики, направленные на изучение порождения и понимания предложений в различных контекстах.

Эмпирическая база исследования

Эмпирической базой исследования являются языковые данные, полученные методом элицитации (грамматического анкетирования), включая данные, полученные в полевых исследованиях, результаты экспериментов, корпусные данные.

Экспериментальные исследования : эксперименты по порождению и пониманию различных конструкций в определенном дискурсивном контексте. Основным методом при исследовании порождения являются опросники, в рамках которых участникам эксперимента предложено читать минитексты и дополнять их предложениями, используя данные в скобках слова, а затем зачитывать получившийся текст вслух. Так возможно получить представление о предпочтении определенного порядка слов и просодических характеристик в зависимости от информационной структуры предложения, заданной контекстом. В качестве метода для исследования понимания испытуемым предлагается оценить предложения с различным порядком слов и просодическими свойствами в зависимости от контекста (т.е. оценить, насколько хорошо, естественно, звучит минитекст в целом по шкале от 1 до 5 или от 1 до 10). Еще один метод — предложить испытуемым выбрать, ответом на какой вопрос (из списка предложенных) могло бы быть данное предложение. Это позволяет оценить представления о допустимой для данного предложения информационной структуре.

Полевые данные : собираются с помощью специально разработанных парадигм примеров. Либо примеры предъявляются для перевода носителям языка, либо порождаются исследователем на исследуемом языке; далее фиксируются суждения носителей языка. Полевые исследования проводились в ареалах распространения следующих языков: горномарийский, хантыйский, бесермянский диалект удмуртского языка (финно-угорские), балкарский, чувашский (тюркские), бурятский (монгольские) и чукотский (чукотско-камчатские) языки. Методом элицитации по типологическим анкетам и анкетам, составленным на основе проработки теоретических статей по исследуемым темам, собран корпус примеров.

Корпусные данные: для исследования русского языка использованы данные Национального корпуса русского языка и недавно разработанного корпуса «Тайга»(https://tatianashavrina.github.io/taiga_site/); также использовались корпусы текстов малых языков.

Результаты работы

В области теории были получены следующие результаты.

Известно, что в языках с т.н. «свободным» порядком составляющих вариация порядка слов используется как одно из средств выражения информационной структуры. Однако информационная структура — не единственное, что определяет эту вариацию. На примере русского языка был исследован ряд конструкций (OV/VO – конструкция с разным порядком прямых дополнений по отношению к глаголу, VSO – конструкция с позицией глагола в начале предложения, а также конструкция с вынесенной вперед ремой). Были выявлены информационно-структурные особенности прямых дополнений, занимающих нестандартную позицию, а также основные факторы, провоцирующие возникновение маркированного порядка слов: это прономинализация прямого дополнения, а также факторы, обуславливающие различие в коммуникативном статусе глагола и прямого дополнения. Была показана несостоятельность предложенных ранее формальных подходов к анализу порядка SOV и VSO. Был предложен признаково-обусловленный анализ передвижений для порядка слов VSO и новый взгляд на порядок SOV. Также для конструкций с вынесенным в начало обстоятельством-ремой было показано, что такое вынесение сильно коррелирует с типом просодического акцента при произнесении. Были проведены эксперименты, направленные на исследование синтаксических и просодических средств выражения информационной структуры в русском языке.

Было исследовано явление косвенного контроля в русском языке, которое ранее не было ни засвидетельствовано, ни изучено. Полученные результаты оказались важны для теоретических подходов к синтаксическому контролю. Был изучен ряд феноменов, связанных с вариативностью грамматического кодирования и информационной структурой в разноструктурных языках. Было рассмотрено вариативное кодирование субъекта в относительных предложениях в хантыйском языке; часть выявленных ограничений имеет информационно-структурное объяснение. Кроме того, было изучено взаимодействие линейной позиции и информационной структуры в предложениях проспективного вида в английском языке и предложено новое теоретическое объяснение различия между конструкциями ‘going to’ и ‘about to’.

Были проведены исследования сферы действия количественных именных групп, а также взаимодействия сферы действия отрицания и квантора ‘все’ в русском языке. Было обнаружено, что сфера действия количественных именных групп в русском языке связана с согласованием глагола по числу с количественной группой в позиции подлежащего. Также были выявлены факторы, влияющие на взаимодействие сферы действия отрицания и универсальных кванторных выражений: наличие элементов отрицательной полярности, информационная структура предложения, падеж квантора в объектной позиции, употребление некоторых приглагольных наречий, референтный статус именной группы с квантором.

Были исследованы семантика и синтаксис ряда элементов, чувствительных к позиции в информационной структуре (фокусно-чувствительных элементов). В частности, были изучены рестриктивные фокусные частицы в индонезийском языке: было описано их употребление и рассмотрена их сочетаемость с различными типами составляющих. Была исследована семантика скалярной аддитивной частицы ‘ещё’ в русском языке и предложен композициональный анализ в рамках семантики альтернатив. Был предложен анализ семантики числовых показателей в бурятском языке, также основанный на семантике альтернатив. Наконец, была исследована дистрибуция фокусной частицы ‘da’ в карачаево-балкарском языке.

В рамках исследования референции языковых выражений было исследовано поведение дискурсивного показателя посессивности в хантыйском языке. Были приведены аргументы в пользу того, что данный показатель обладает двумя значениями: посессивности с расширенной семантикой и определенности.

Был проведен ряд других исследований на материале языков разного генетического происхождения. В частности, были исследованы синтаксис и семантика вопросительных конструкций в чукотском языке и описан ряд нетривиальных явлений в этой области. Была исследована вариативность в интерпретации русских временных наречий и обнаружена зависимость данной вариативности от времени глагола в главной и зависимой клаузах. Было осуществлено типологическое исследование показателей, совмещающих компаративную и аттенуативную семантику и выдвинут ряд типологических обобщений. В ходе исследования механизма согласования в тюркских и монгольских языках было показано, что отсутствие синтаксического согласования не всегда означает отсутствие согласования семантического. Наконец, были исследованы сложные глагольные конструкции в горномарийском и чувашском языке: впервые была подробно описана семантика таких конструкций.

В области развития методологии были получены следующие результаты.

Во-первых, при исследовании порядка SOV (предглагольной позиции прямого дополнения) был применен корпусный анализ. Данные для анализа были получены из недавно разработанного корпуса «Тайга»(https://tatianashavrina.github.io/taiga_site/), для которого доступна автоматическая синтаксическая разметка и который включает в себя огромные массивы текстов, ранее не попадавших в корпуса или представленных в них скудно. Далее материал был размечен по целому ряду факторов (тип языкового выражения (например, прономинальный или нет), тип ремы, референциальный статус именной группы и т.п.). С использованием различных статистических критериев было выявлено, что основная тенденция выбора такого порядка слов связана с прономинализацией прямого дополнения и теми значеиями исследуемых параметров, при которых глагол и прямое дополнение имеют разный информационный статус.

Во-вторых, при исследовании порядка с начальной позицией глагола в предложении (VSО) был метод тестов на грамматическую правильность. Кроме того, важным методом для этого исследования было тестирование разных теоретических подходов к порядку слов на материале данных русского языка.

В-третьих, при исследовании вынесенной в начало ремы-обстоятельства был применен экспериментальный подход.

Был детально проработан дизайн экспериментов, позволяющих исследовать взаимодействие информационной структуры с интонацией. Так, был разработан дизайн, основанный на минидиалогах. Испытуемым предлагались как стимулы, представляющие собой пару реплик одного диалога, так и пару реплик из диалогов, различающихся информационной структурой.

Для выполнения задач проекта в ходе полевых исследований были собраны данные разноструктурных языков (индонезийского, чукотсткого, горно-марийского, хантыйского, бесермянского, балкарского). Помимо сбора спонтанных текстов было проведено анкетирование, основанное на переводе специально подобранных примеров. В анкету входили парадигмы примеров, тестирование грамматической правильности которых позволяет выявить и доказать те или иные гипотезы о формальном устройстве исследуемого явления.

Публикации по проекту:


Бикина Д. А., Старченко А. М. Относительная клауза или номинализованная клауза: данные хантыйского языка (казымский диалект) // Типология морфосинтаксических параметров. 2019. Т. 1. № 2. C. 49-69. 
Рахман Д. М. Нулевой субъект целевых клауз и эллипсис аргумента в горномарийском языке // Acta Linguistica Petropolitana. Труды института лингвистических исследований. 2019. Т. 15. № 2. C. 213-228. doi
Slioussar N., Popova S. Production and comprehension of different means to encode Information Structure: an experimental study on Russian // Journal of Psycholinguistic Research. 2019. 
Голосов Ф. В. Легкий глагол-деинкрементализатор: грамматикализация чувашского глагола prak ‘бросить’, in: Шестнадцатая конференция по типологии и грамматике для молодых исследователей. Тезисы докладов. Санкт-Петербург, 21-23 ноября 2019 г.. Санкт-Петербург : ИЛИ РАН, 2019. С. 25-28. 
Михайлов С. К. Два контекста конкуренции двух северохантыйских показателей посессивности, in: Шестнадцатая конференция по типологии и грамматике для молодых исследователей. Тезисы докладов. Санкт-Петербург, 21-23 ноября 2019 г.. Санкт-Петербург : ИЛИ РАН, 2019. С. 75-78. 
Сидорова А. Н. Вопросительные предложения в чукотском языке. (Говор с. Амгуэма), in: Шестнадцатая конференция по типологии и грамматике для молодых исследователей. Тезисы докладов. Санкт-Петербург, 21-23 ноября 2019 г.. Санкт-Петербург : ИЛИ РАН, 2019. С. 127-130. 
Slioussar N., Popova S., Tyshkevich N. B. Different means to encode IS: how they interact and when they do not, in: The 52nd Annual Meeting of the Societas Linguistica Europaea (21st – 24th August 2019). Leipzig : Leipziger Universitätsverlag, 2019. С. 532-533. 
Старченко А. М. В поисках антипассива в амгуэмском диалекте чукотского языка, in: Шестнадцатая конференция по типологии и грамматике для молодых исследователей. Тезисы докладов. Санкт-Петербург, 21-23 ноября 2019 г.. Санкт-Петербург : ИЛИ РАН, 2019. 
Черемисинова М. О. Компаративно-аттенуативный показатель =šək в казымском диалекте хантыйского языка, in: Шестнадцатая конференция по типологии и грамматике для молодых исследователей. Тезисы докладов. Санкт-Петербург, 21-23 ноября 2019 г.. Санкт-Петербург : ИЛИ РАН, 2019. С. 159-161. 
Язык: категории, функции, речевое действие Выпуск 12, часть 1. Материалы международной научной конференции.. Коломна , 2019. 
Bylinina L., Podobryaev A. Plurality in Buriat and structurally constrained alternatives // Journal of Semantics. 2020. Vol. 37. No. 1. P. 117-128. doi
Slioussar N., Cherepovskaia N., Denissenko A. Acquisition of the nominal case system in Russian as a second language // Second Language Research. 2020. doi
Постникова А. Е. Грамматикализация и тип эвиденциальной системы // Типология морфосинтаксических параметров. 2021. Т. 3. № 2. C. 147-165. 
Starchenko A. Periphrastic Nominalization in Khanty / ГУ ВШЭ. Series WP BRP "Linguistics". 2019. No. 78.