• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Выявление побочных действий лекарств в микроблогах

ФИО студента: Долгалева Ирина Игоревна

Руководитель: Артемова Екатерина Леонидовна

Кампус/факультет: Факультет компьютерных наук

Программа: Финансовые технологии и анализ данных (Магистратура)

Год защиты: 2020

Побочные действия лекарств способны нанести существенный вред организму и здоровью пациентов. Поэтому их выявлением, исследованием и мониторингом занимаются органы фармакологического надзора по всему миру. Для того, чтобы выявить негативные последствия, проявляющиеся в результате приема лекарств, проводятся клинические исследования. Однако некоторые побочные действия невозможно выявить с их помощью. Это происходит потому, что они могут обнаружиться только при определенных условиях, таких как длительное использование препарата, его сочетание с другими медикаментами, а также при применении лекарства группами пациентов, которые не участвуют в клинических испытаниях: дети, пожилые люди и беременные женщины и другие. Поэтому органы фармакологического надзора собирают сведения о побочных действиях лекарств уже после проведения клинических испытаний, когда медикаменты выпущены в продажу и широко используются пациентами. В последние годы одними из основных источников для сбора таких сведений стали социальные сети и микроблоги, так как в них люди делятся своим опытом, в том числе, по поддержанию здоровья и приему лекарств. В рамах текущей исследовательской работы был разработан классификатор, позволяющий определить, упоминается ли в посте из микроблога Twitter побочное действие лекарства или нет. Особенностью классификатора является то, что он был построен на многоязыкой коллекции текстов, состоящей из постов на русском и английском языках. Для его построения использовались методы классического машинного обучения, такие как логистическая регрессия, бустинг и другие, так и методы глубинного обучения с предобученными моделями для работы с текстами на разных языках. Лучшей моделью оказалась нейронная сеть на основе предобученной многоязычной модели XLM-R с добавлением двунаправленного рекуррентного слоя с длинной краткосрочной памятью. Величина F1-мера для постов с побочными действиями лекарств достигла 0.54 на тестовой выборке. Кроме того, ее точность для текстов на русском и английском языках примерно одинакова, что говорит о хорошей обобщающей способности модели относительно разных языков.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ