• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Владение языками
английский
французский
армянский
Контакты
Электронная почта:
Расписание
ORCID: 0000-0002-6976-0185
ResearcherID: B-9043-2014
Scopus AuthorID: 57194513345
Google Scholar
Руководитель
Ляшевская О. Н.
Версия для печати

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.

Шаврина Татьяна Олеговна


Дополнительное образование / Повышение квалификации / Стажировки

2019 – анализ больших данных на Spark   https://newprolab.com/ru/spark-module

2018 – LXMLS summer school on Deep Learning in NLP, Instituto Superior Técnico, Lisbon

2016 – 2017 – 1-year course “Practical Data Analysis and Machine Learning” at National Research
University “Higher School of Economics”, Faculty of Computer Science
2017 – UCREL Summer School in Computational linguistics and other digital methods, University of
Lancaster, Lancaster, UK
2017 – The New York -St. Petersburg Institute of Linguistics, Cognition and Culture (NYI), Stony
Brook University; St. Petersburg State University.
2017 – The actual problems of competitive intelligence at National Research University “Higher
School of Economics”, Institute of security problems
2016 - The New York -St. Petersburg Institute of Linguistics, Cognition and Culture (NYI), Stony
Brook University; St. Petersburg State University.
2013 – CIMO Summer School in the University of Turku, Finland

Обучение в аспирантуре

2-й год обучения
Утвержденная тема диссертации: A Contact Grammar of Daghestan
Научный руководитель: Ляшевская Ольга Николаевна

Учебные курсы (2019/2020 уч. год)

Машинное обучение (Магистратура; где читается: Факультет гуманитарных наук; 1-й курс, 3, 4 модуль)Рус

Проекты

Корпус для машинного обучения с разметкой Universal Dependencies (Taiga Corpus)

С развитием технологий компьютерной лингвистики растет число специалистов, которые рассматривают корпуса не как источник примеров отдельных языковых явлений, а как источник статистики и обучающую выборку под различные задачи машинного обучения. В нашем проекте мы создаем уникальный корпус русского языка из открытых источников, собранный, чтобы удовлетворять актуальным нуждам исследователей -

1) большой

2) с открытыми исходными текстами

3) с синтаксической и морфологической разметкой в формате universal dependencies

4) с большим набором дополнительной разметки текстов

В нашем корпусе можно выделить отдельные однородные сегменты: - новости - социальные сети - художественная литература - субтитры - стихи - журналы всего около 600 млн токенов на состояние начала 2018 года В разметке корпуса применены методы, опирающиеся на машинное обучение - синтаксические модели, участвующие в разметке, чувствительны к жанру текста, что позволяет добиваться более высокого качества автоматической разметки на типично "проблемных" жанрах текстов - коротких диалогах, сообщениях соцсетей.

Публикации13

  • Глава книги Lyashevskaya O., Shavrina T., Trofimov I., Vlasova N. A. GRAMEVAL 2020 Shared Task: Russian Full Morphology and Universal Dependencies Parsing, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 17 июня — 20 июня 2020 г.). Вып. 19(26), 2020. / Под общ. ред.: В. Селегей. Вып. 19(26). М. : Изд-во РГГУ, 2020. Ch. 38. P. 553-569.
  • Глава книги Shavrina T., Emelyanov A., Fenogenova A., Fomin V., Михайлов В. Н., Evlampiev A., Malykh V., Larin V., Natekin A., Vatulin A., Romov P., Anastasiev D., Zinov N., Chertok A. Humans Keep It One Hundred: an Overview of AI Journey, in: Proceedings of The 12th Language Resources and Evaluation Conference Vol. 12. European Language Resources Association (ELRA), 2020. P. 2276-2284.
  • Глава книги Smurov I., Пономарева М. А., Shavrina T., Дроганова К. А. AGRR-2019: AUTOMATIC GAPPING RESOLUTION FOR RUSSIAN, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 29 мая — 1 июня 2019 г.) Вып. 18(25). [б.и.], 2019. P. 600-614.
  • Глава книги Shavrina T. Genre Classification Problem: in Pursuit of Systematics on a Big Webcorpus, in: Proceedings of Third Workshop "Computational linguistics and language science", Issue 4. EasyChair, 2019. doi P. 70-83. doi
  • Глава книги Shavrina T., Benko V. Omnia Russica: Even Larger Russian Corpus, in: Труды международной конференции "Корпусная лингвистика - 2019". СПб. : Издательство Санкт-Петербургского университета, 2019. Ch. 13. P. 94-102.
  • Книга Пономарева М. А., Дроганова К. А., Smurov I., Shavrina T. Proceedings of the 7th Workshop on Balto-Slavic Natural Language Processing Issue 7. Florence : Association for Computational Linguistics, 2019.
  • Глава книги Shavrina T. WORD VECTOR MODELS AS AN OBJECT OF LINGUISTIC RESEARCH, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 29 мая — 1 июня 2019 г.) Вып. 18(25). [б.и.], 2019. P. 576-588.
  • Глава книги Sorokin A., Shavrina T., Lyashevskaya O., Дроганова К. А., Alexeeva S. V., Bocharov V., Fenogenova A., Granovsky D. MorphoRuEval-2017: an Evaluation Track for the Automatic Morphological Analysis Methods for Russian, in: Computational Linguistics and Intellectual Technologies. International Conference "Dialogue 2017" Proceedings / Ed. by В. Селегей. Vol. 1. Issue 16 (23). M. : -, 2017. P. 297-313.
  • Глава книги Shavrina T., Shapovalova O. A. TO THE METHODOLOGY OF CORPUS CONSTRUCTION FOR MACHINE LEARNING: «TAIGA» SYNTAX TREE CORPUS AND PARSER, in: Труды международной конференции «КОРПУСНАЯ ЛИНГВИСТИКА – 2017». СПб. : Издательство СПбГУ, 2017. Ch. 13. P. 78-84.
  • Статья Lyashevskaya O., Bocharov V., Sorokin A., Shavrina T., Granovsky D., Alexeeva S. Text collections for evaluation of Russian morphological taggers // Jazykovedny Casopis. 2017. Vol. 68. No. 2. P. 258-267. doi
  • Статья Шаврина Т. О. Методы обнаружения и исправления опечаток: исторический обзор / Перев.: В. А. Плунгян // Вопросы языкознания. 2017. № 4. С. 115-134.
  • Глава книги Sorokin A., Shavrina T. Automatic Spelling Correction for Russian Social Media Texts, in: Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue” (2016). М. : Изд-во РГГУ, 2016. P. 688-701.
  • Глава книги Shavrina T., Sorokin A., Байтин А., Галинская И. SpellRuEval: the First Competition on Automatic Spelling Correction for Russian, in: Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue” (2016). М. : Изд-во РГГУ, 2016. P. 660-674.

Конференции

2017

Компьютерная лингвистика и интеллектуальные технологии (Диалог 23) (Москва). Доклад: MorphoRuEval-2017: an Evaluation Track for the Automatic Morphological Analysis Methods for Russian


«Компьютерная лингвистика и интеллектуальные технологии» ("

Расписание занятий на сегодня

Полное расписание