• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site
Language Proficiency
English
Contacts
Phone:
+7 (495) 772-95-90
22724
Address: 21/4 Staraya Basmannaya Ulitsa, Building 1, room A-114
Timetable
SPIN-RSCI: 3237-4710
ORCID: 0000-0002-5777-9161
ResearcherID: C-2740-2012
Scopus AuthorID: 56147544600
Google Scholar
Office hours
Friday 12.00 - 16.00
Supervisor
E. V. Rakhilina
Printable version

 

Have you spotted a typo?
Highlight it, click Ctrl+Enter and send us a message. Thank you for your help!
To be used only for spelling or punctuation mistakes.

Svetlana Toldova

  • Svetlana Toldova has been at HSE University since 2013.

Education and Degrees

  • 1994

    Candidate of Sciences* (PhD) in Language Theory
    Lomonosov Moscow State University
    Thesis Title: Discourse structure and focusing as the important factors for the nomination of a particular referent

  • 1990

    Degree in Applied mathematics
    Lomonosov Moscow State University

  • 1985

    Degree in Linguistics
    Lomonosov Moscow State University

* Candidate of Sciences
According to the International Standard Classification of Education (ISCED) 2011, Candidate of Sciences belongs to ISCED level 8 - "doctoral or equivalent", together with PhD, DPhil, D.Lit, D.Sc, LL.D, Doctorate or similar. Candidate of Sciences allows its holders to reach the level of the Associate Professor.

Continuing education / Professional retraining / Internships / Study abroad experience

The 9th Russian Summer School in Information Retrieval (RuSSIR 2015). August 24-28, 2015 in St. Petersburg, Russia. Сo-organized by the National Research University Higher School of Economics and the Russian Information Retrieval Evaluation Seminar (ROMIP).

Courses (2023/2024)

Courses (2022/2023)

Courses (2021/2022)

Courses (2020/2021)

Courses (2019/2020)

Courses (2018/2019)

Courses (2017/2018)

Grants

Recent research projects

Linguistics

2022-2-23 "Variation in the discourse and lexicon: an investigation of closely related languages with digital methods" (RSF)

2021-2023 "The morphology of agreement" (RFBR)

2019-2021. "Syntax and Semantics of Uralic and Altaic languages: converging functional typological and formal perspectives" (RFBR, participant)

Natural Language Processing

2017-2019 "Models and methods of discourse and narrative parsing for text mining, text understanding and dialogue systems", RFBR research project №17-29-07033, under supervision of I. Smirnov 

2020-2022. Automated methods for sentiment analysis of coherent texts with multiple attitudes based on Russian sentiment frames. RFBR research project №20-07-01059, under supervision of N. Lukashevich

Previous projects

2016-2018 "Four Grammars of Languages of Multilingual Russia", RSF 16-18-02081, under supervision of S.Tatevosov

2016-2018 "Syntax-Semantics Interface in Uralic and Altaic Languages" RFBI  16-06-00536, supervisor 

Conferences

  • 2023

    Малые языки в большой лингвистике 2023 (Москва). Presentation: Глаголы со значением изменения/мены в кадарском и в литературном даргинском

  • Linguistic forum 2023. Language functioning in remote areas: the arctic and beyond (Москва). Presentation: Совместно с Сумбатовой Н.Р. Труднодоступность и морфологическая сложность (на примере языков даргинской группы)
  • 13-я конференция «Типология морфосинтаксических параметров» (Москва). Presentation: Person-number asymmetry: Agreement of passive miratives in Kazym Khanty
  • 2022

    12-я конференция «Типология морфосинтаксических параметров» (Москва). Presentation: Относительный порядок дативного аргумента в дитранзитивных конструкциях в русском языке: корпусные и экспериментальные исследования

  • Малые языки в большой лингвистике (Москва). Presentation: Рефлексивная посессивность в уйльтинском и эвенском

  • Syntax of Uralic Languages 4 (Санкт-Петербург). Presentation: The mirative construction in Kazym Khanty

  • The Second International Conference ANATOLIA-THE CAUCASUS-IRAN (Ереван). Presentation: The system of Reflexive Pronouns in Dargwa languages.
  • Международная научная конференция «Современная лингвистика: от теории к практике» («Contemporary linguistics: theory and practice») (Казань). Presentation: Standard Dargwa Corpus
  • 28-я МЕЖДУНАРОДНАЯ КОНФЕРЕНЦИЯ по компьютерной лингвистике и интеллектуальным технологиям "Диалог-2022". Presentation: Non-canonical constructions with reflexive possessives in Russian: u-possessor constructions

  • 2021

    27-ая Международная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог-2021» (Москва). Presentation: The order of objects in Russian: a corpus study

  • 11-я конференция «Типология морфосинтаксических параметров» (Москва). Presentation: Possessive pronouns in Russian: A corpus and experimental study

  • Workshop on the Structure of Uralic Languages (Pécs). Presentation: The morphosyntax of non-finite clauses in Kazym Khanty and some of its puzzles
  • 2020
    26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Presentation: Discourse Features of Blogs in Subcorpus of Russian RST-treebank
  • Интернет и современное общество (IMS-20) (он-лайн). Presentation: Формирование набора отношений для корпуса с дискурсивной разметкой текста
  • 53rd Annual Meeting of the Societas Linguistica Europaea. Presentation: Kazym Khanty non-finite forms: Multifunctionality and variability in the amount of structure

  • 2019
    Formal Approaches to Russian Linguistics 3 (Москва). Presentation: “Fig/Hren” and their semantic interpretation in Russian Or: Wondering what the f*** fig (tebe) is?
  • 3rd SOUL - Syntax of Uralic Languages (Tartu). Presentation: Syntax of DO-encoding patterns in Moksha

  • Диалог (25-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям) (Москва). Presentation: Classification Models for Rst Discourse Parsing of Texts In Russian

  • Диалог (25-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям) (Москва). Presentation: Contrast and Comparison Relations in RST Framework: the Case of Russian

  • Descriptive grammars and typology (Хельсинки). Presentation: Competing motion-cumpurpose strategies in Northern Selkup: a corpus study
  • Workshop on Discourse Relation Parsing and Treebanking 2019 (Миннеаполис). Presentation: Towards the Data-driven System for Rhetorical Parsing of Russian Texts

  • Congreso Internacional CORE 2019 (Мехико). Presentation: Discourse analysis: a Rethoric structure theory approach
  • 52nd Annual Meeting of the Societas Linguistica Europaea (Лейпциг). Presentation: Dedicated possessive reflexives in languages with head marking of a possessor
  • 52nd Annual Meeting of the Societas Linguistica Europaea (Лейпциг). Presentation: Evidential and epistemic semantics of modal particles in Northern Selkup
  • 25 Международная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог» (Москва). Presentation: Discourse Features of Blogs in Subcorpus of Russian RST-treebank
  • 25 Международная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог» (Москва). Presentation: Discourse Features of Blogs in Subcorpus of Russian RST-treebank
  • 2018
    Computational Methods for Endangered Language Documentation and Description (Париж). Presentation: The possible re-usage of fieldwork data for automated morphological parsing (the case of Moksha)
  • DGfS 2018: 40th Annual Conference of the German Linguistic Society (Штутгарт). Presentation: Properties of definite declension in Moksha

  • The 18th International Morphology Meeting. Workshop 3. Morphological aspects of Uralic and Turkic languages (Budapest). Presentation: The split in nominal paradigms and the size of extended nominal projection in Moksha

  • 3-й Колмогоровский семинар по компьютерной лингвистике и наукам о языке (Москва). Presentation: Extraction of multi-word ‘Cause-Effect’ connectives
  • 51st Annual Meeting of the Societas Linguistica Europaea (Таллинн). Presentation: Differential object marking, word order and verb adjacency in Komi
  • Linguistic diversity, minority languages and digital research infrastructures (Hamburg). Presentation: Towards semi-automated shallow syntax using FLEx data
  • Concort-2018 (Нижний Новгород). Presentation: Корпусное исследование оборотов с местоимением с предикативным антецедентом
  • Concort-2018 (Нижний Новгород). Presentation: Корпусное исследование порядка слов в северном диалекте селькупского языка
  • Язык, история, культура бесермян: состояние и перспективы исследований (Глазов). Presentation: Категория притяжательности в языке бесермян и других пермских языках
  • Языки народов России в контакте с русским языком: явления морфосинтаксической и семантической интерференции (Москва). Presentation: Порядок слов в северных диалектах селькупского языка: к вопросу об изменении порядка слов под влиянием русского языка
  • 4th Workshop on Languages of the Volga-Kama Sprachbund (Москва). Presentation: Grammatical and lexical case distinction in Moksha and Hill Mari
  • 2017

    XLVI Международная филологическая научная конференция (Санкт-Петербург). Presentation: Семантика глагола и выбор оформления прямого дополнения в мокшанском языке

  • Чтения памяти А. И. Кузнецовой (Москва). Presentation: Посессивный показатель в коми-зырянском языке как маркер пресуппозиции
  • Чтения памяти А. И. Кузнецовой (Москва). Presentation: Посессивный показатель в коми-зырянском языке как маркер пресуппозиции

  • Компьютерная лингвистика и интеллектуальные технологии: Диалог 2017 (Москва). Presentation: Порядок следования прилагательных разных семантических классов в русском языке в свете корпусных данных

  • Компьютерная лингвистика и интеллектуальные технологии: Диалог 2017 (Москва). Presentation: Coreferenсe resolution for Russian: the impact of semantic features

  • Conference on the Syntax Of Uralic Languages (Будапешт). Presentation: The NP/DP-structure in Moksha language

  • The 50th Annual Meeting of the Societas Linguistica Europaea (Цюрих). Presentation: Looking for a D-layer in Moksha

  • The 50th Annual Meeting of the Societas Linguistica Europaea (Цюрих). Presentation: The interaction of possessive and definite noun declensions in Moksha

  • Малые языки в большой лингвистике (Москва). Presentation: Possessive markers in Komi-Zyrian: topic, presupposition, or discourse markers

  • Малые языки в большой лингвистике (Москва). Presentation: Синтаксические, семантические и прагматические свойства посессивных рефлексивных местоимений (на материале финно-угорских и тунгусо-маньчжурских языков)
  • ConCort (Москва). Presentation: Выбор референциальных средств разграничения эпизодов на примере текстов корпуса Russian CliPS

  • INLG 2017, 6th Workshop on Recent Advances in RST and Related Formalisms (Santiago de Compostela). Presentation: Rhetorical relations markers in Russian RST Treebank
  • 2016
    The 17th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing-2016) (Konya). Presentation: Features for discourse-new referent detection in Russian
  • Рабочее совещание, посвящённое дифференцированному маркированию актантов (Москва). Presentation: Кодирование прямого дополнения в мокшанском языке: определенность vs. топикальность
  • 6-я тематическая конференция серии «Типология морфосинтаксических параметров» (Москва). Presentation: Структурная позиция прямого дополнения и его коммуникативный статус
  • The 17th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing-2016) (Konya). Presentation: Features for discourse-new referent detection in Russian
  • Information structure and discourse in the minority languages of the Russian Federation (2016). Presentation: Topicality and Differential Object Marking in Moksha

  • Grammar and Corpora (Мангейм). Presentation: Multiple prenominal adjectives ordering in Russian: a corpus study

  • Компьютерная лингвистика и наука о языке (Москва). Presentation: Identification of singleton mentions in Russian
  • Компьютерная лингвистика и наука о языке (Москва). Presentation: Coreference in Russian oral movie retellings (the experience of coreference relations annotation in Russian CliPS corpora)
  • 2015

    Dialogue - 2015 (international conference for computational linguistics) (Москва). Presentation: Coreference Chains in Czech, English and Russian: Preliminary Findings.

  • Congressus Duodecimus Internationalis Fenno-Ugristarum. (Оулу). Presentation: Differential object marking in Moksha language

  • 2014

    CILC 2014 : 6th International Conference on Corpus Linguistics (Лас Пальмас). Presentation: Coreference Corpus in Russian

  • CILC 2014 : 6th International Conference on Corpus Linguistics (Лас Пальмас). Presentation: Corpora Acquisition for Machine Learning Web Query Intent Classification

  • Искусственный интеллект и естественный язык (AINL) (Сколково). Presentation: Форум по оценке методов автоматической обработки текстов: распознавание анафорических и кореферентных связей

Publications

20231

Book Caha P., Kasenov D., Starke M., Cortiula M., Taraldsen Medová L., Taraldsen T., Letuchiy A., Rudnev P., Slioussar N. The many facets of agreement / Ed. by P. Caha, P. Rudnev, S. Toldova. Muenchen : Lincom Europa, 2023.

20223

20212

20202

  • Chapter Toldova S., Ivtushok E. I., Shulgina K., Khudyakova M. Coreference in Aphasic and non-Aphasic Spoken Discourse: Annotation Scheme and Preliminary Results, in: Proceedings of the LREC 2020 Workshop on: Resources and Processing of Linguistic, Para-linguistic and Extra-linguistic Data from People with Various Forms of Cognitive/Psychiatric/Developmental Impairments (RaPID-3). European Language Resources Association (ELRA), 2020. P. 116-122.
  • Chapter Toldova S., Davydova T., Kobozeva M., Pisarevskaya D. Discourse features of blogs in subcorpus of Russian Ru-RSTreebank, in: Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной международной конференции «Диалог» (Москва, 17–20 июня 2020 г.) / Ed. by В. Селегей. Issue 19(26): дополнительный том. -, 2020. P. 747-761. doi

20195

20184

  • Chapter Toldova S., Pisarevskaya D., Kobozeva M. Automatic Mining of Discourse Connectives for Russian, in: Artificial Intelligence and Natural Language, 7th International Conference, AINL 2018, St. Petersburg, Russia, October 17–19, 2018, Proceedings Issue 930. Switzerland : Springer, 2018. doi P. 79-87. doi
  • Chapter Klimov A., Toldova S., Kopotev M., Zevakhina N., Дмитриева А. Д., Kisselev O., Баранчикова А., Федорова М. CAT&kittens: a corpus-based text-analytic tool for Russian academic writing, in: SlaviCorp 2018 Book of Abstracts. Charles University, 2018. P. 22-25.
  • Chapter Toldova S., Ionov M. Features for Discourse-New Referent Detection in Russian, in: Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 17th International Conference on Intelligent Text Processing and Computational Linguistics, CICLing 2016 / Отв. ред.: A. Gelbukh.; Ed. by A. Gelbukh.; Ed. by A. Gelbukh. Vol. 1. Issue 9623. Springer Publishing Company, 2018. doi P. 648-662. doi
  • Chapter Toldova S., Pisarevskaya D., Vasilyeva M., Kobozeva M. The cues for rhetorical relations in Russian: "Cause-Effect" relation in Russian Rhetorical Structure Treebank, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 30 мая — 2 июня 2018 г.) / Под общ. ред.: В. Селегей, И. М. Кобозева, Т. Е. Янко, И. Богуславский, Л. Л. Иомдин, М. А. Кронгауз, А. Ч. Пиперски. Вып. 17(24). М. : Издательский центр «Российский государственный гуманитарный университет», 2018. P. 747-761.

20173

  • Chapter Toldova S., Maxim Ionov. Coreference resolution for Russian: the impact of semantic features, in: Computational Linguistics and Intellectual Technologies. International Conference "Dialogue 2017" Proceedings / Ed. by В. Селегей. Vol. 1. Issue 16 (23). M. : -, 2017. P. 339-348.
  • Chapter Toldova S., Max Ionov. Identification of Singleton Mentions in Russian, in: CLLS 2016. Computational Linguistics and Language Science. Proceedings of the Workshop on Computational Linguistics and Language Science. Moscow, Russia, April 26, 2016 / Ed. by E. Artemova, D. Ilvovsky, D. Skorinkin, A. Vybornova. Vol. 1886. Aachen : CEUR Workshop Proceedings, 2017. Ch. 5. P. 33-41.
  • Chapter Toldova S., Dina Pisarevskaya, Ananyeva M., Kobozeva M., Nasedkin A., Nikiforova S., Pavlova I., Shelepov A. Rhetorical relation markers in Russian RST Treebank, in: Proceedings of the 6th Workshop on Recent Advances in RST and Related Formalisms. Stroudsburg, PA : Association for Computational Linguistics, 2017.

20167

20153

20141

Chapter Toldova S.Ju., Roytberg A., Nedoluzhko А., Kurzukov M., Ladygina A., Vasilyeva M., Azerkovich I., Grishina Y., Sim G., Ivanova A., Gorshkov D. Evaluating Anaphora and Coreference Resolution for Russian, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 4 — 8 июня 2014 г.) / Под общ. ред.: В. Селегей. Вып. 13(20). М. : Изд-во РГГУ, 2014. P. 681-695.

20133

20121

Chapter Gareyshina A., Ionov M., Lyashevskaya O., Privoznov D., Sokolova E., Toldova S. RU-EVAL-2012: Evaluating dependency parsers for Russian, in: Proceedings of COLING 2012: Posters. Mumbai : The COLING 2012 Organizing Committee, 2012. P. 349-360.

Employment history

1987 – 2017     Research fellow, Department of theoretical and applied linguistics, Faculty of Philology, Moscow State University
2000 – 2013     Associate Professor, State Academic University for the Humanities, Institute of Linguistics
2013 - 2013      Senior Fellow, Institute of World Cultures, Lomonosov State University

1991 – 2002 Engineer, Russian Research Institute for Artificial Intelligence; 

2007 – 2010 Linguist, Medialogia (NLP consultant); 

2011 – 2014 Leading Research Fellow, Center for Semantic Technologies, National Research University “Higher School of Economics”
2010-2011 - News360

 

Timetable for today

Full timetable

Results of Competition for Research and Teaching Laboratories Announced

This year, HSE has supported the founding of 10 new Research and Teaching Laboratories (RTLs) in various fields, from cognitive psychology and computer modeling, to international justice and economics of sports.