• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Состоялось очередное заседание общемосковского научного семинара "МАТЕМАТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА РЕШЕНИЙ В ЭКОНОМИКЕ, БИЗНЕСЕ И ПОЛИТИКЕ"

Докладчик: М.Г. Крейнес (ООО «Базисные технологии»)
Тема: Оценка качества научных публикаций и вычислительные модели анализа текстов

Авторы работы: М.Г. Крейнес, Е.М. Крейнес, А.А. Афонин (ООО «БАЗИСНЫЕ ТЕХНОЛОГИИ»)

Краткое описание доклада
Рассматрено использование вычислительных методов поиска и анализа неструктурированных текстов на естественных языках для решения задач оценки качества научных публикаций и коллекций научных публикаций. Предложены решения для двух типов задач:
- задач формирования коллекций научных публикаций, адекватных для определения референтных (сопоставимых) значений библиометрических и наукометрических показателей для конкретной публикации или конкретной коллекции публикаций,
- задач количественного определения информативности и содержательной независимости конкретной публикации.

Решение этих задач основано на
- вычислительном построении моделей научных текстов на естественных языках,
- вычислительном построении моделей коллекций научных текстов на естественных языках,
- поиске с использованием моделей содержательно и тематически близких статей (на поиске содержательного контекста анализируемой статьи),
- выделении среди тематически и содержательно близких текстов множества статей, адекватных для формирования референтных значений,
- поиске с использованием моделей коллекций текстов научных изданий, научных коллективов и организаций, порождающих тематически близкие коллекции текстов.

Рассматриваемые в докладе модели и методы, развитые и используемые в информационной технологии поиска и анализа текстовой информации  КЛЮЧИ К ТЕКСТАМ® , позволяют решать для масштабных коллекций неструктурированной текстовой информации следующие задачи:
- вычислительное выделение в коллекции тематических групп,
- отнесение текстов к выделенным тематическим группам,
- определение тематического сходства текстовых коллекций.