Войти при помощи GitHub  Войти при помощи VK  Войти при помощи Facebook

Интеграция ресурсов RussNet и YARN

Задача проекта — интеграция гетерогенных лексикографических данных. RussNet построен путём традиционного лексикографического подхода, YARN создан путём краудсорсинга с дополнительным применением автоматических методов построения тезаурусов. Интеграция включает в себя согласование концептуальных оснований двух ресурсов, схем данных, разработку автоматических методов выравнивания и сравнения единиц тезаурусов; методики, сценариев и инструментов редактирования и пополнения объединенного ресурса.

Проект выполняется при финансовой поддержке грантов РГНФ (РФФИ) № 13-04-12020 «Новый открытый электронный тезаурус русского языка» и № 16-04-12019 «Интеграция тезаурусов RussNet и YARN», а также в рамках научного проекта РФФИ № 16-37-00354 мол_а «Методы автоматизации процесса коллективного построения лингвистических ресурсов». Поддержка данного проекта осуществлена в рамках благотворительной деятельности, на средства, предоставленные Фондом Михаила Прохорова.

Публикации

Полный список публикаций представлен на странице https://nlpub.ru/YARN. Краткое описание целей и задач проекта интеграции ресурсов представлено в следующей работе:

  • Интеграция ресурсов RussNet и YARN / И. В. Азарова, П. И. Браславский, В. П. Захаров и др. // Компьютерная лингвистика и вычислительные онтологии: сборник научных статей. Труды XIX Международной объединённой научной конференции «Интернет и современное общество» (IMS-2016), Санкт-Петербург, 22–24 июня 2016 г. — СПб : Университет ИТМО, 2016. — С. 7–13.