• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Диссертации, представленные на защиту и подготовленные в НИУ ВШЭ

Сортировка:по дате защитыпо имени научного руководителяпо имени соискателя

Показаны работы: 1 - 1 из 1

Методы машинного обучения для контроля качества данных в научных экспериментахКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Борисяк Максим Александрович
Руководитель:
Устюжанин Андрей Евгеньевич
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
10/15/2020
В современных экспериментах контроль качества данных играет ключевую роль. С ростом сложности экспериментальных установок контроль качества данных все сильнее и сильнее опирается на методы машинного обучения. В данной диссертации рассматриваются главные свойства систем контроля качества данных и связанные с ними задачи машинного обучения. Во-первых, рассматривается краеугольный камень контроля качества данных - детектирование аномалий. Показано, что существующие методы не полностью покрывают весь спектр задач детектирования аномалий и предлагается новое семейство методов, которые устойчивы к новым видам аномалий и несбалансированным обучающим выборкам. Во-вторых, предлагается алгоритм определения источников аномалий, который увеличивает возможности систем контроля качества данных. Дополнительно рассматриваются задачи сбора обучающих выборок для тренировки алгоритмов контроля качества данных, а именно: ручная разметка и генерация данных средствами компьютерных симуляций. Продемонстрировано, что активное обучение способно значительно снизить нагрузку на экспертов при ручной разметке данных. Чтобы гарантировать корректность обучения на сгенерированных данных, рассматривается задача тонкой настройки компьютерных симуляций и предлагается новое семейство состязательных дивергенций, позволяющих значительно ускорить процедуры тонкой настройки.
Диссертация [*.pdf, 6.77 Мб] (дата размещения 8/7/2020)
Резюме [*.pdf, 3.93 Мб] (дата размещения 8/7/2020)
Summary [*.pdf, 3.88 Мб] (дата размещения 8/7/2020)