• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Масштабируемые методы обучения по запросам на сложно структурированных данных с использованием узорных структур

ФИО студента: Сокол Дмитрий Владиславич

Руководитель: Кузнецов Сергей Олегович

Кампус/факультет: Факультет компьютерных наук

Программа: Науки о данных (Магистратура)

Год защиты: 2021

В настоящее время машинное обучение применяется в большинстве сфер деятельности, в том числе в тех, в которых принимаемые решения имеют большую важность. Например, к этим сферам можно отнести кредитный скоринг, медицина или автономный транспорт. Однако в силу множества факторов в этих областях интерпретируемость модели машинного обучения, то есть возможность дать объяснение, почему было принято то или иное решение, часто оказывается важнее, чем дальнейшее повышение оптимальности этих решений. Большинство распространенных классических алгоритмов машинного обучения, в том числе нейронные сети, несмотря на высокую эффективность, представляют собой так называемые <<черные ящики>>, то есть сама их структура не позволяет представить обученный алгоритм в виде описания, понятного человеку-эксперту. Одним из интерпретируемых алгоритмов машинного обучения является алгоритм ленивой классификации при помощи узорных структур, основанный на схожести описаний классифицируемого объекта и примеров из обучающей подвыборки. В данной работе рассматривается повышение качества работы этого алгоритма за счет бустинга. Идея заключается в присвоении объектам из обучающей выборки весов, которые на стадии классификации <<подсказывают>> модели, на какие примеры следует обращать больше внимания, поскольку они позволяют делать более точные предсказания. Предложенная модификация алгоритма не теряет свойства интерпретируемости и может проводить классификацию быстрее за счет нахождения сравнительно небольшого подмножества <<показательных>> примеров.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ