• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Семинар ЛССИ «Планирование и интеллектуальный анализ результатов статистического эксперимента»

Мероприятие завершено

10 сентября в 18.00 состоится очередной регулярный семинар Лаборатории сравнительных социальных исследований.

С докладом на тему «Планирование и интеллектуальный анализ результатов статистического эксперимента» выступит Алексей Незнанов (к.т.н., доцент, старший научный сотрудник лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ НУЛ ИССА).

Планирование эксперимента [experimentdesign или design ofexperiments (DOE)], протоколирование эксперимента [experimentprotocol] и анализ результатов эксперимента [resultanalysis] – важнейшие темы в любой экспериментальной деятельности и один из столпов научного подхода. В докладе будет рассмотрена проблема формальной проверки качества проведения и получения нового знания в статистическом эксперименте.

В немногих прикладных областях мы видим системный подход к планированию и анализу результатов статистических экспериментов. К наиболее показательным областям относятся следующие.

1. Современная медицина с концепцией, получившей название «доказательная медицина» [evidence-basedmedicine]и обозначающей явное, систематическое и сознательное использование актуальных научных данных при принятии врачебных решений. Формально это методология медицинской практики, опирающаяся на проверку эффективности любых клинических действий, причём эффективность обосновывается контролируемыми рандомизированными клиническими исследованиями(РКИ).

2. Управление качеством в массовом производстве [manufacturing quality improvement and management].

3. Тестирование программного обеспечения [softwaretesting].

Но как в этих, так и во многих других областях возникают серьёзные затруднения в поддержке комплексных экспериментов и экспериментов с недостаточно формализованными моделями. Одна из конкретных проблем может формулироваться так: как совместить методы статистического анализа данных и анализа данных, основанного на формализованном знании (интеллектуальные методы).

Хорошо описаны и повсеместно используются первые шаги анализа данных:

1. подготовка или очистка данных [DataPreparation или DataTiding];

2. статистическое описание данных - описательная статистика [DescriptiveStatistics];

3. проверка гипотез - статистика вывода [InferentialStatistics].

Но для полноценного прохождения этих шагов нам необходима априорная формальная модель, на которой основываются те или иные статистические критерии (+ учёт большого числа ограничений). Особенно жалко «расставаться» с теми данными, которые не нужны для работы статистических методов в конкретном эксперименте, но формализованы в протоколе. Отмечу, что на практике, при использовании полноценных средств автоматизации экспериментальной работы, при очистке данных мы «теряем» до 90% данных из протокола и 99,9% собранных данных в целом.

В свою очередь, методы интеллектуального анализа данных, особенно - онтологически контролируемые, позволяют активно задействовать практически весь массив сырых данных. Мы рассмотрим современные методы очистки данных, информационного поиска и извлечения знаний с примерами приложений.

В докладе будут также затронуты вопросы:

1. контроля ошибок при планировании и проведении статистического эксперимента;

2. возможности использования сырых данных в форме коллекций неструктурированных текстовых фрагментов;

3. комплексной программной поддержки как статистического эксперимента, так и интеллектуальных методов анализа его протокола и результатов.

Приглашаются все желающие.

Начало в 18.00.

Адрес: ул. Мясницкая, д. 22, ауд. 511.