• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Владение языками
английский
французский
армянский
Контакты
Электронная почта:
Расписание
ORCID: 0000-0002-6976-0185
ResearcherID: B-9043-2014
Scopus AuthorID: 57194513345
Google Scholar
Руководитель
Ляшевская О. Н.
Версия для печати

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.

Шаврина Татьяна Олеговна


Дополнительное образование / Повышение квалификации / Стажировки

2019 – анализ больших данных на Spark   https://newprolab.com/ru/spark-module

2018 – LXMLS summer school on Deep Learning in NLP, Instituto Superior Técnico, Lisbon

2016 – 2017 – 1-year course “Practical Data Analysis and Machine Learning” at National Research
University “Higher School of Economics”, Faculty of Computer Science
2017 – UCREL Summer School in Computational linguistics and other digital methods, University of
Lancaster, Lancaster, UK
2017 – The New York -St. Petersburg Institute of Linguistics, Cognition and Culture (NYI), Stony
Brook University; St. Petersburg State University.
2017 – The actual problems of competitive intelligence at National Research University “Higher
School of Economics”, Institute of security problems
2016 - The New York -St. Petersburg Institute of Linguistics, Cognition and Culture (NYI), Stony
Brook University; St. Petersburg State University.
2013 – CIMO Summer School in the University of Turku, Finland

Обучение в аспирантуре

2-й год обучения
Утвержденная тема диссертации: A Contact Grammar of Daghestan
Научный руководитель: Ляшевская Ольга Николаевна

Проекты

Корпус для машинного обучения с разметкой Universal Dependencies (Taiga Corpus)

С развитием технологий компьютерной лингвистики растет число специалистов, которые рассматривают корпуса не как источник примеров отдельных языковых явлений, а как источник статистики и обучающую выборку под различные задачи машинного обучения. В нашем проекте мы создаем уникальный корпус русского языка из открытых источников, собранный, чтобы удовлетворять актуальным нуждам исследователей -

1) большой

2) с открытыми исходными текстами

3) с синтаксической и морфологической разметкой в формате universal dependencies

4) с большим набором дополнительной разметки текстов

В нашем корпусе можно выделить отдельные однородные сегменты: - новости - социальные сети - художественная литература - субтитры - стихи - журналы всего около 600 млн токенов на состояние начала 2018 года В разметке корпуса применены методы, опирающиеся на машинное обучение - синтаксические модели, участвующие в разметке, чувствительны к жанру текста, что позволяет добиваться более высокого качества автоматической разметки на типично "проблемных" жанрах текстов - коротких диалогах, сообщениях соцсетей.

Публикации11

  • Глава книги Smurov I., Пономарева М. А., Shavrina T., Дроганова К. А. AGRR-2019: AUTOMATIC GAPPING RESOLUTION FOR RUSSIAN, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 29 мая — 1 июня 2019 г.) Вып. 18(25). [б.и.], 2019. P. 600-614.
  • Глава книги Shavrina T. Genre Classification Problem: in Pursuit of Systematics on a Big Webcorpus, in: Proceedings of Third Workshop "Computational linguistics and language science", Issue 4. EasyChair, 2019. doi P. 70-83. doi
  • Глава книги Shavrina T., Benko V. Omnia Russica: Even Larger Russian Corpus, in: Труды международной конференции "Корпусная лингвистика - 2019". СПб. : Издательство Санкт-Петербургского университета, 2019. Ch. 13. P. 94-102.
  • Книга Пономарева М. А., Дроганова К. А., Smurov I., Shavrina T. Proceedings of the 7th Workshop on Balto-Slavic Natural Language Processing Issue 7. Florence : Association for Computational Linguistics, 2019.
  • Глава книги Shavrina T. WORD VECTOR MODELS AS AN OBJECT OF LINGUISTIC RESEARCH, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 29 мая — 1 июня 2019 г.) Вып. 18(25). [б.и.], 2019. P. 576-588.
  • Глава книги Sorokin A., Shavrina T., Lyashevskaya O., Дроганова К. А., Alexeeva S. V., Bocharov V., Fenogenova A., Granovsky D. MorphoRuEval-2017: an Evaluation Track for the Automatic Morphological Analysis Methods for Russian, in: Computational Linguistics and Intellectual Technologies. International Conference "Dialogue 2017" Proceedings / Ed. by В. Селегей. Vol. 1. Issue 16 (23). M. : -, 2017. P. 297-313.
  • Глава книги Shavrina T., Shapovalova O. A. TO THE METHODOLOGY OF CORPUS CONSTRUCTION FOR MACHINE LEARNING: «TAIGA» SYNTAX TREE CORPUS AND PARSER, in: Труды международной конференции «КОРПУСНАЯ ЛИНГВИСТИКА – 2017». СПб. : Издательство СПбГУ, 2017. Ch. 13. P. 78-84.
  • Статья Lyashevskaya O., Bocharov V., Sorokin A., Shavrina T., Granovsky D., Alexeeva S. Text collections for evaluation of Russian morphological taggers // Jazykovedny Casopis. 2017. Vol. 68. No. 2. P. 258-267. doi
  • Статья Шаврина Т. О. Методы обнаружения и исправления опечаток: исторический обзор / Перев.: В. А. Плунгян // Вопросы языкознания. 2017. № 4. С. 115-134.
  • Глава книги Sorokin A., Shavrina T. Automatic Spelling Correction for Russian Social Media Texts, in: Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue” (2016). М. : Изд-во РГГУ, 2016. P. 688-701.
  • Глава книги Shavrina T., Sorokin A., Байтин А., Галинская И. SpellRuEval: the First Competition on Automatic Spelling Correction for Russian, in: Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue” (2016). М. : Изд-во РГГУ, 2016. P. 660-674.

Конференции

2017

Компьютерная лингвистика и интеллектуальные технологии (Диалог 23) (Москва). Доклад: MorphoRuEval-2017: an Evaluation Track for the Automatic Morphological Analysis Methods for Russian


«Компьютерная лингвистика и интеллектуальные технологии» ("

Расписание занятий на сегодня

Полное расписание