• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Тенденции развития языка в корпусном отражении

Приоритетные направления развития: гуманитарные науки
2016

Цель работы: цель проекта 2016 года заключалась в выявлении — с опорой на обширные корпусные данные (в том числе собранные в ходе реализации проекта) — актуальных для нашего времени и существенных для истории развития языка предшествующих периодов тенденций в становлении и изменении словаря и системы правил комбинирования языковых единиц разных уровней с учетом намерений говорящего и пишущего. Особенность проекта 2016 года заключалась в повышенном внимании к диахронической составляющей данных. С этим ракурсом рассмотрения языкового материала связано, в частности, направление корпусного изучения древнерусской орфографии. Проект 2016 года включает совершенствование шаблонов для нестандартных лингвистических корпусов, описание сдвига грамматической и лексической норм в узусе, реконструкцию и моделирование объективно существующих системных закономерностей, позволяющих описать отступления от кодифицированной схемы; совершенствование лингвистических корпусов (пополнение коллекций, оптимизацию аннотирования и поискового механизма), отладку и пополнение стилистического тренажера, автоматизацию описанных в ходе реализации проекта речевых правил; формирование учебных принципов, компетентностно-ориентированных лингвистических заданий, основанных на описании сдвига нормы в сопоставлении с нормативно организованной речью; описание особенностей функционирования языка в речи эритажных говорящих (несбалансированных билингвов), инофонов, носителей региолекта, осваивающих новый регистр русскоговорящих, актуальных тенденций развития современного русского языка, отраженных в речевой продукции, представленной в интернет-пространстве.

Используемые методы: в области сбора данных: тексты-источники порождаются  информантами в направленной беседе (расшифровки устных интервью участников проекта с носителями регионального варианта русского языка в селах Дагестана и в Махачкале, на русском Севере), в ходе выполнения аудиторных и самостоятельных письменных учебных заданий (речевая продукция инофонов, эритажных говорящих, студентов, осваивающих академический регистр русского языка - компьютерный набор, текст набирает автор); спонтанная речевая продукция блогеров извлекается из интернет-пространства. Обработка данных осуществляется в формате корпуса, при помощи "рабочего места разметчика" - исследуемым единицам присваивается метка, позволяющая автоматически искать лексико-грамматическое явление или речевой сбой. Интерпретация данных опирается на качественные и количественные методы корпусной лингвистики. Корпус позволяет статистически обрабатывать большие массивы однородных данных, фиксировать диахронические изменения в лексике и грамматике, квалифицировать выдачу в зависимости от типа текста и характера его атрибуции, уточнять запрашиваемый лексический и грамматический контекст.

Эмпирическая база исследования: собранные в ходе реализации проекта письменные работы студентов-носителей русского языка и студентов-инофонов, а также эритажных говорящих, для которых русский язык является домашним и изучаемым в учебной аудитории, но не доминирующим, проведенные участниками проекта интервью с носителями диалектов, собранная участниками проекта по сфокусированным запросам речь пользователей интернет-ресурсов (открытые данные), коллекции письменных текстов разных эпох (в частности, Национального корпуса русского языка).

Результаты работы: В январе-декабре 2016 года продолжалось пополнение коллекций для корпусов речевой продукции носителей нестандартного русского языка (нестандартность включает освоение новых регистров носителями):

  • регионального корпуса (русский язык в Дагестане, язык русского Севера), руководитель Н. Р. Добрушина
  • корпуса английских учебных текстов (учебных работ, написанных русскоязычными студентами по-английски, REALEC), руководитель О. И. Виноградова
  • корпуса русских учебных текстов, руководитель Н. А. Зевахина
  • корпуса речи эритажных говорящих (носителей унаследованного русского языка в иноязычном окружении) и инофонов, руководитель А. С. Выренкова.

Итоги года

Корпус REALEC. Усовершенствована система разметки, продуман интерфейс рабочего места разметчика, созданы упражнения на базе корпуса. Адрес доступа: http://www.realec.org/

Корпус Russian Learner Corus (RLC): в составе выделены лонгитюдный подкорпус эритажа RULEC и подкорпус текстов, дополнительно собранных в ходе новейших этапов реализации проекта. В 2016 году коллекция упорядочена по количеству и характеру доминантных языков, представленных в корпусе. Главная линия года - нейтрализация расхождений в стратегиях разметчиков: систематизация причин разночтений и разработка алгоритма устранения множественных интерпретаций в типовых случаях (И.Смирнов). Е. Смоловская под руководством А. С. Выренковой положила начало коллекции текстов летней школы для инофонов, которую проводят участники проекта. Адрес доступа: web-corpora.net/RLC

Корпус русских учебных текстов - КРУТ: коллекции пополнены работами 2015-2016 гг., созданными студентами первых лет обучения в ходе освоения дисциплин "Риторика: практика устной и письменной коммуникации", "Академическое письмо (русский язык)", "Культура речи", "Литературное редактирование текста", "Основы перевода". Усовершенствовано электронноое рабочее место разметчика (виртуальный кабинет). Адрес доступа: http://web-corpora.net/learner_corpus (новый), поиск в корпусе http://web-corpora.net/learner_corpus/search/ Статистика: http://web-corpora.net/learner_corpus/stats/

Разработана усовершенствованная версия стилистического тренажера для диагностики владения литературной нормой и формирования навыков редактирования текста у студентов, рук. А. И. Левинзон (в проекте заняты студенты, составляющие новые варианты из 12 упражнений по 15 заданий тематического рубрикатора и оптимизирующие включенные). Адрес доступа: http://web-corpora.net/acad/accounts/login/ 

Для решения исследовательских задач, связанных с выявлением и описанием тенденций развития звуковой, лексической и грамматической систем языка и влияния на структуру высказывания прагматических установок говорящего/пишущего, на корпусном материале с привлечением данных интернет-узуса проанализированы следующие аспекты развития элементов языковой системы в речевой среде и отражения этих тенденций в корпусных ресурсах:

в области исследований эмпирического материала

  • мена согласных в суффиксах и окончаниях словоформ в современном узусе
  • стратегии словоизменения и словообразования, включая нестандартные для системы и отрицаемые рекомендательной нормой, но типичные для повседневного речепорождения решения (архаизирующее чередование в неологизмах, отказ от исторического чередования, ненормативные варианты чередования, варьирование твердых и мягких реализаций в речи носителей, характер комбинаторных изменений в области места и способа образования звука);
  • в корпусном исследовании древнерусской орфографии рассматривается гипотеза, согласно которой орфографическая вариативность в окончаниях отличается от орфографической вариативности в основе и носит орфологизованный характер;
  • функционирование конструкций с русским сослагательным наклонением для обозначения хабитуальных ситуаций (использование формы для обозначения типичной ситуации - повторяемой в разное время, в разных местах, с разными участниками, разными способами - без оттенков модальных значений, конструирование темпоральной семантики формальными средствами, типичными для выражения условной модальности; анализируются синтаксические структуры, провоцирующие транспозицию, в частности условно-уступительные придаточные);
  • уточнение понятия амбитранзитивности (ср. понимание переходности-непереходности как способности распространять действие на прямой объект) в сфере арабского залога с учетом данных корпусных коллекций;
  • оформление однородного ряда при помощи маркеров коннекции "затем" и "потом" (в отличие от традиционного показателя сочинения "и");
  • особенности употребления глаголов "добиться" и "следить" в ситуациях корефрентности и некореферентности субъектов, объясняющие различие в присоединении придаточного и инфинитива;
  • динамика конструирования базовой социальной дихотомии “свой-чужой” в дискурсе власти: эволюция делегирования права голоса (от имени правительства, от имени нации), механизмы создания образа врага/союзника — на основе анализа лексической, семантической, прагматической составляющих дискурса;
  • функционирование кванторов в современном узусе на фоне исторических трансформаций употребления, на пути к расширению сочетаемости и абстрагированию значения, утрате оценочного компонента семантики (стратегии грамматикализации фразем сниженного регистра, в частности "как грязи", "до жути"; нейтрального регистра, таких как "постольку-поскольку", "ни на шаг"; парадоксально продуктивных архаичных кванторов типа "ни на йоту", "видимо-невидимо"); учтено явление речевой моды (кванторы-однодневки быстро обновляемого сленга, в частности - "децл"), подробно проанализированы диахронические изменения в круге сочетаемости, детерминологизация фразем (например, "мизер", "мизерный"); особое внимание уделено функциям редупликации и судьбе конструкций с редупликатами ("едва-едва", "чуть-чуть");
  • специфика организации передачи пространственных концептов в предложно-падежных сочетаниях на фоне англоязычной системы (в частности, избыточные для русского языка вербализации "вниз);
  • зависимость выбора числа предиката при подлежащем "кто" от синтаксической и семантической характеристик высказывания в речи нестандартных говорящих в диапазоне от маргинальной нормы до аграмматизма;
  • сохранение и углубление синкретизма семантических ролей при переходе от исходного значения слова к переносному;
  • определение прагматических функций избыточного причастия;

в области методики

  • значение и применение экспертной аннотации ошибок в корпусе англоязычных учебных текстов для формирования корректирующих стратегий в области методики преподавания неродного языка, для оптимизации преподавательских стратегий, направленных на изучение и предотвращение системных речевых сбоев, для исследователя межъязыковой интерференции и этапности освоения неродного языка;
  • активизация обращения к дейктическим категориям и фреймовому подходу при описании грамматических явлений;
  • эффективность методов и приемов грамматики ошибок как стратегии построения описания грамматической системы языка и ее речевых реализаций;
  • исследование речи инофонов и эритажных говорящих как материал к реконструкции системного устройства языка и демонстрации актуальных для развития языка тенденций;
  • совершенствование механизма обработки данных интернет-узуса при помощи программы фильтрации запроса.

Рекомендации по внедрению результатов НИР: разрабатываемые в долгосрочном проекте ресурсы полезны специалисту-гуманитарию и популяризатору гуманитарных наук для изучения русской языковой картины мира, преподавателю-гуманитарию для составления комплексов учебных заданий и разработки учебных кейсов. Внимание к речевым ошибкам позволяет реконструировать тенденции развития языка. Ресурсы адресованы лингвистам, филологам, историкам, антропологам, культурологам, философам, психологам, журналистам, специалистам по связям с общественностью, переводчикам, преподавателям русского языка как родного и иностранного, разработчикам учебных курсов, связанных с риторикой, культурой речи, литературным редактированием, литературным переводом, методистам, специализирующимся на сопровождении преподавании речевых дисциплин.

Публикации по проекту:


Panicheva P., Badryzlova Y. Distributional semantic features in Russian verbal metaphor identification., in: Компьютерная лингвистика и интеллектуальные технологии: По мате­риалам ежегодной международной конференции «Диалог» (Москва, 31 мая — 3 июня 2017 г.). Вып. 16 (23): В 2 т. / Науч. ред.: В. Селегей. Т. 1. М. : Изд-во РГГУ, 2017. P. 179-190.
Polinsky M., Ekaterina Rakhilina, Anastasia Vyrenkova. Linguistic creativity in heritage speakers // Glossa: a journal of general linguistics. 2016. Vol. 43. P. 1-29. doi
Slioussar N., Magomedova V. Stem-final consonant mutations in modern Russian, in: Formal Approaches to Slavic Linguistics: The First New York Meeting 2015. Ann Arbor : Michigan Slavic Publications, 2016.
Рахилина Е. В., Тестелец Я. Г. Научное наследие Ч. Филлмора и современная теория языка // Вопросы языкознания. 2016. № 2. С. 7-21.
Зарифян М. С. Семантическая симметрия и асимметрия дейктических наречий тут и там // Компьютерная лингвистика и интеллектуальные технологии. 2016
Rakhilina E. V., Vyrenkova A. S., Mustakimova E., Smirnov I., Ladygina A. Building a learner corpus for Russian, in: Proceedings of the joint workshop on NLP for Computer Assisted Language Learning and NLP for Language Acquisition at SLTC. Linköping : LiU Electronic Press, 2016. Ch. 10. P. 1-10.
Kuzmenko E. Morphological Analysis for Russian: Integration and Comparison of Taggers // Communications in Computer and Information Science. 2016. No. 661. P. 194-203.
Сборник по результатам семинара CLLS 2016. , 2016.
Сборник статей по результатам семинара CLLS 2016. , 2016.
Vybornova Anna. Corpus-based analysis of punctuation errors in schoolchildren’s texts, in: Сборник по результатам семинара CLLS 2016. , 2016.
Badryzlova Y., Lyashevskaya O. Metaphor Shifts in Constructions: the Russian Metaphor Corpus, in: The AAAI 2017 Spring Symposium on Computational Construction Grammar and Natural Language Understanding. AAAI Press, 2017. P. 127-130.
Кувшинская Ю. М. Студенческие речевые ошибки и актуальные тенденции в развитии русского языка // В кн.: Leo philologiae. Фестшрифт в честь 70-летия Льва Иосифовича Соболева / Под общ. ред.: А. А. Бонч-Осмоловская, М. А. Кучерская, К. М. Поливанов, А. А. Зубов, Майофис Мария Львовна. М. : [б.и.], 2016. С. 157-178.
Плисецкая А. Д. О семантике безличных причастных конструкций с кратким страдательным причастием совершенного вида в романе И.А. Гончарова «Обломов» // В кн.: Leo philologiae. Фестшрифт в честь 70-летия Льва Иосифовича Соболева / Под общ. ред.: А. А. Бонч-Осмоловская, М. А. Кучерская, К. М. Поливанов, А. А. Зубов, Майофис Мария Львовна. М. : [б.и.], 2016. С. 259-278.