• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Владение языками
английский
французский
армянский
Контакты
Телефон:
27238
Электронная почта:
Адрес: 109028, г. Москва, Покровский бульвар, д. 11, S913
ORCID: 0000-0002-6976-0185
ResearcherID: B-9043-2014
Scopus AuthorID: 57194513345
Google Scholar
Присутственные часы
Дистанционно (по расписанию занятий).
Руководители
Ляшевская О. Н.
Подольский В. В.
Версия для печати

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.

Шаврина Татьяна Олеговна


Дополнительное образование / Повышение квалификации / Стажировки

2020 – SMILES SUMMER SCHOOL OF MACHINE LEARNING https://smiles.skoltech.ru/school

2020 –  The New York -St. Petersburg Institute of Linguistics, Cognition and Culture (NYI), Stony
  Brook University; St. Petersburg State University.

2019 – анализ больших данных на Spark   https://newprolab.com/ru/spark-module

2018 – LXMLS summer school on Deep Learning in NLP, Instituto Superior Técnico, Lisbon

2016 – 2017 – 1-year course “Practical Data Analysis and Machine Learning” at National Research
University “Higher School of Economics”, Faculty of Computer Science
2017 – UCREL Summer School in Computational linguistics and other digital methods, University of
Lancaster, Lancaster, UK
2017 – The New York -St. Petersburg Institute of Linguistics, Cognition and Culture (NYI), Stony
Brook University; St. Petersburg State University.
2017 – The actual problems of competitive intelligence at National Research University “Higher
School of Economics”, Institute of security problems
2016 - The New York -St. Petersburg Institute of Linguistics, Cognition and Culture (NYI), Stony
Brook University; St. Petersburg State University.
2013 – CIMO Summer School in the University of Turku, Finland

Профессиональные интересы

Обучение в аспирантуре

3-й год обучения
Утвержденная тема диссертации: A Contact Grammar of Daghestan
Научный руководитель: Ляшевская Ольга Николаевна

Учебные курсы (2020/2021 уч. год)

Учебные курсы (2019/2020 уч. год)

Машинное обучение (Магистратура; где читается: Факультет гуманитарных наук; 1-й курс, 3, 4 модуль)Рус

Проекты

Корпус для машинного обучения с разметкой Universal Dependencies (Taiga Corpus)

С развитием технологий компьютерной лингвистики растет число специалистов, которые рассматривают корпуса не как источник примеров отдельных языковых явлений, а как источник статистики и обучающую выборку под различные задачи машинного обучения. В нашем проекте мы создаем уникальный корпус русского языка из открытых источников, собранный, чтобы удовлетворять актуальным нуждам исследователей -

1) большой

2) с открытыми исходными текстами

3) с синтаксической и морфологической разметкой в формате universal dependencies

4) с большим набором дополнительной разметки текстов

В нашем корпусе можно выделить отдельные однородные сегменты: - новости - социальные сети - художественная литература - субтитры - стихи - журналы всего около 600 млн токенов на состояние начала 2018 года В разметке корпуса применены методы, опирающиеся на машинное обучение - синтаксические модели, участвующие в разметке, чувствительны к жанру текста, что позволяет добиваться более высокого качества автоматической разметки на типично "проблемных" жанрах текстов - коротких диалогах, сообщениях соцсетей.

Публикации16

  • Глава книги Глушкова Т. О., Machnev A., Fenogenova A., Shavrina T., Artemova E., Ignatov D. I. DaNetQA: a yes/no Question Answering Dataset for the Russian Language, in: Recent Trends in Analysis of Images, Social Networks and Texts. 9th International Conference, AIST 2020. Revised Supplementary Proceedings / Ed. by W. M. van der Aalst, V. Batagelj, A. V. Buzmakov, D. I. Ignatov, A. A. Kalenkova, M. Khachay, O. Koltsova, A. Kutuzov, S. Kuznetsov, I. A. Lomazova, N. Loukachevitch, I. Makarov, A. Napoli, A. Panchenko, P. M. Pardalos, M. Pelillo, A. Savchenko, E. Tutubalina. Vol. 1357. Springer, 2021. doi
  • Глава книги Fenogenova A., Тихонова М. И., Mikhailov V., Shavrina T., Emelyanov A., Shevelev D., Kukushkin A., Malykh V., Artemova E. Russian SuperGLUE 1.1: Revising the Lessons not Learned by Russian NLP-models, in: Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021) Issue 20: Основной том. -, 2021. Ch. 21. P. 235-245. doi
  • Глава книги Emelyanov A., Shliazhko O., Katricheva N., Shavrina T. Using RuGPT3-XL Model for RuNormAS competition, in: Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021) Issue 20: Основной том. -, 2021. Ch. 18. P. 204-212.
  • Глава книги Lyashevskaya O., Shavrina T., Trofimov I., Vlasova N. A. GRAMEVAL 2020 Shared Task: Russian Full Morphology and Universal Dependencies Parsing, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 17 июня — 20 июня 2020 г.) / Под общ. ред.: В. Селегей. Вып. 19(26). М. : Изд-во РГГУ, 2020. P. 553-569. doi
  • Глава книги Shavrina T., Emelyanov A., Fenogenova A., Fomin V., Mikhailov V., Evlampiev A., Malykh V., Larin V., Natekin A., Vatulin A., Romov P., Anastasiev D., Zinov N., Chertok A. Humans Keep It One Hundred: an Overview of AI Journey, in: Proceedings of The 12th Language Resources and Evaluation Conference Vol. 12. European Language Resources Association (ELRA), 2020. P. 2276-2284.
  • Глава книги Shavrina T., Fenogenova A., Emelyanov A., Shevelev D., Artemova E., Malykh V., Mikhailov V., Tikhonova M., Chertok A., Evlampiev A. RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark, in: Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP). Association for Computational Linguistics, 2020. P. 4717-4726.
  • Глава книги Smurov I., Пономарева М. А., Shavrina T., Дроганова К. А. AGRR-2019: AUTOMATIC GAPPING RESOLUTION FOR RUSSIAN, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 29 мая — 1 июня 2019 г.) Вып. 18(25). [б.и.], 2019. P. 600-614.
  • Глава книги Shavrina T. Genre Classification Problem: in Pursuit of Systematics on a Big Webcorpus, in: Proceedings of Third Workshop "Computational linguistics and language science", Issue 4. EasyChair, 2019. doi P. 70-83. doi
  • Глава книги Shavrina T., Benko V. Omnia Russica: Even Larger Russian Corpus, in: Труды международной конференции "Корпусная лингвистика - 2019". СПб. : Издательство Санкт-Петербургского университета, 2019. Ch. 13. P. 94-102.
  • Книга Пономарева М. А., Дроганова К. А., Smurov I., Shavrina T. Proceedings of the 7th Workshop on Balto-Slavic Natural Language Processing Issue 7. Florence : Association for Computational Linguistics, 2019.
  • Глава книги Shavrina T. WORD VECTOR MODELS AS AN OBJECT OF LINGUISTIC RESEARCH, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 29 мая — 1 июня 2019 г.) Вып. 18(25). [б.и.], 2019. P. 576-588.
  • Глава книги Sorokin A., Shavrina T., Lyashevskaya O., Дроганова К. А., Alexeeva S. V., Bocharov V., Fenogenova A., Granovsky D. MorphoRuEval-2017: an Evaluation Track for the Automatic Morphological Analysis Methods for Russian, in: Computational Linguistics and Intellectual Technologies. International Conference "Dialogue 2017" Proceedings / Ed. by В. Селегей. Vol. 1. Issue 16 (23). M. : -, 2017. P. 297-313.
  • Глава книги Shavrina T., Shapovalova O. A. TO THE METHODOLOGY OF CORPUS CONSTRUCTION FOR MACHINE LEARNING: «TAIGA» SYNTAX TREE CORPUS AND PARSER, in: Труды международной конференции «КОРПУСНАЯ ЛИНГВИСТИКА – 2017». СПб. : Издательство СПбГУ, 2017. Ch. 13. P. 78-84.
  • Статья Lyashevskaya O., Bocharov V., Sorokin A., Shavrina T., Granovsky D., Alexeeva S. Text collections for evaluation of Russian morphological taggers // Jazykovedny Casopis. 2017. Vol. 68. No. 2. P. 258-267. doi
  • Глава книги Sorokin A., Shavrina T. Automatic Spelling Correction for Russian Social Media Texts, in: Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue” (2016). М. : Изд-во РГГУ, 2016. P. 688-701.
  • Глава книги Shavrina T., Sorokin A., Байтин А., Галинская И. SpellRuEval: the First Competition on Automatic Spelling Correction for Russian, in: Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue” (2016). М. : Изд-во РГГУ, 2016. P. 660-674.

Конференции

2017

Компьютерная лингвистика и интеллектуальные технологии (Диалог 23) (Москва). Доклад: MorphoRuEval-2017: an Evaluation Track for the Automatic Morphological Analysis Methods for Russian


«Компьютерная лингвистика и интеллектуальные технологии» ("

Искусственный интеллект, невозможные артефакты и древние гоминиды. Научная станция: программа на неделю.

Антропогенез.ру

Стартер-пак для бизнеса: зачем нужен GPT-3 и какие навыки потребуются для работы с этой нейросетью

Rb.ru - Деловая сеть

Реакция отрасли: представлен подход к машинному обучению LO-shot

ICT-Online

«Никто не ждёт научную инквизицию!»

Антропогенез.ру

Общее дело: как искусственный интеллект помогает людям в творчестве

Rb.ru - Деловая сеть

AGI: Новая методология как взлетная полоса?

ICT-Online

Самая понятливая нейросеть: зачем нам рейтинг лучших NLP-систем и кто учит русскому языку англоязычные модели

VC.RU

NLP: обзор инструментов для разработчиков. От сбора данных до универсальных моделей, решающих ЕГЭ

ICT-Online

DeepPavlov соберет пользователей и разработчиков в Москве

Rusbase

Как научить AI думать

VC.RU