• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
ФИО студента
Название работы
Руководитель
Факультет
Программа
Оценка
Год защиты
Соколова Ирина Сергеевна
Using Word Co-occurrence Networks for Measuring the Complexity of Constructed Languages
9
2019
This paper has two goals: 1) to measure the linguistic complexity of a sample of constructed languages of different types, and 2) to develop and test a new, graph-based method of measuring linguistic complexity automatically, without knowledge of a language’s grammar.

In the first part of the paper, we assess the complexity of the constructed languages in our sample using the criteria that have been suggested by linguists. We compare the complexity of our sample of languages to a large sample of natural languages, and we trace how complexity relates to the type of constructed language and the time of its creation.

In the second part of our study, we put forward and test the hypothesis that language complexity can be predicted from the structure of word co-occurrence networks built from text. We collect texts in 17 natural languages that have numeric complexity scores computed in previous studies. We build graphs from the texts and train different models to predict complexity from graph features. The paper describes our experiments with different text sizes and different feature extraction methods as well as experiments with text embeddings.

We receive good predictions from training the model on the entire sample of natural languages. However, the error rate grows when the model is tested on languages not present in the train set. Experiments show that our graph method yields better results that training the model on text embeddings. We use our best model to predict the complexity of the constructed languages in our sample and compare the results to the conclusions we made in the first part of the paper.

In the conclusion, we suggest several ways to improve predictions.
Текст работы (работа добавлена 28 мая 2019г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Расширенный поиск ВКР