• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
26
Апрель

Проект YetAnotherRussianNet

Первая электронная семантическая сеть – принстонский WordNet– зародилась (сами авторы говорят "It crystallized") в 1985 году. В этом же году родились Windows 1.0, домен.com и манифест GNU. С тех пор прошло почти тридцать лет, открытые ворднеты есть для немецкого и итальянского, польского и румынского, тамильского и маратхи, санскрита и африкаанса. Не все они так объемны и точны, как принстонский, но к каждому можно получить доступ и использовать для исследований.

Русского ворднета не существует до сих пор. Известны как минимум три попытки исправить ситуацию, однако ни одна из них не закончилась появлением открытого общедоступного ресурса. Такое положение дел и стало предпосылкой для запуска YARN (Yet Another Russian Wordnet?).

Работа над YARN ведется ВШЭ в сотрудничестве с УрФО, ИММ УрО РАН и другими исследовательскими группами. Наша цель – создание открытого общедоступного онлайн-ресурса, аналогичного принстонской онтологии, но соблюдающего конвенцию EuroWordNet и учитывающего особенности русского языка. YARN должен стать инструментом, пригодным не только для академических исследований, но и для прикладных задач: снятия омонимии, информационного поиска, рубрикации текстов и др.

Формат YARN изначально ориентирован на совместимость с международными стандартами и привязку к другим ворднетам. При этом речь ни в коем случае не идет о простом переводе принстонского WordNet, ресурс строится самостоятельно на базе русской лексикографии и русского словоупотребления, чтобы максимально точно отражать иерархию понятий, заложенную в языке. Первый тестовый запуск YARN ожидается к осени 2013 года.

Участники: Анна Выборнова, выпускница Казанского государственного университета имени Ульянова-Ленина, Анастасия Темченко, выпускница НТУУ "Киевский политехнический институт, Даниил Скоринкин, выпускник НИУ "Высшая школа экономики", Оксана Тимофеева, выпускница НИУ "Высшая школа экономики"