• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Одноклеточная RNA-seq: оптимальные методы выбора признаков с использованием scmap для построения точных проекций в базах данных по генной экспрессии

ФИО студента: Маслов Иван Валерьевич

Кампус/факультет: Международная лаборатория прикладного сетевого анализа

Программа: Прикладная статистика с методами сетевого анализа (Магистратура)

Год защиты: 2020

Одноклеточная РНК-seq (scRNA-seq) широко используется для встраивания в состав сложных тканей, так как технология позволяет исследователям определять типы клеток, используя бесконтрольную кластеризацию транскриптома. Тем не менее, из-за различий в экспериментальных методах и вычислительном анализе часто трудно непосредственно сопоставить клетки, идентифицированные в двух различных экспериментах. Scmap представляет собой способ проецирования клеток из эксперимента scRNA-seq на типы клеток или отдельные клетки, идентифицированные в другом эксперименте. В этом исследовании мы изучим несколько вопросов, поставленных профессором Блаз Зупаном (личное общение): 1) каков фактический вклад подхода к выбору признаков в метод ближайшего соседа; Будет ли изменение специального подхода к выбору элементов, предложенного в scmap, более стандартным методом выбора элементов улучшить или ухудшить результаты? 2) является ли предлагаемый kNN хорошим, потому что он хорош в выявлении случаев, которые не следует классифицировать (вариант отклонения), или потому что это просто большой классификатор? 3) будет ли такой же классификационный подход работать над некоторыми другими наборами данных, например, из области исследований экспрессии генов (микроматриц)? Результаты исследования: 1. Способы выбора признаков позволяют классификаторам быть более точными, они уменьшают шум данных. Изменение предложенного метода отсева с Boruta ухудшило результаты в диапазоне от 0-200 особенностей, но показали пролизационные результаты при увеличении количества особенностей. Рекурсивный элемент элемента уменьшил общие результаты. Генетический алгоритм имеет результаты, аналогичные предложенному способу отсева, поэтому его можно использовать в качестве альтернативного метода выбора признаков. 2. Кнн показал, что это гораздо более превосходный классификатор, чем комбинация случайного леса и рекурсивного исключения признаков, что говорит нам о том, что это отличный классификатор сам по себе и метод выбора признаков выпадения просто очарует его производительность. 3. К сожалению, scmap не может работать с данными исследований экспрессии генов микроматриц. Поскольку он не будет работать очень хорошо, стадия отбора генов (которая является критической для хороших результатов) основана на характеристике отсева данных scRNA-seq. Поскольку это свойство не является основной особенностью объемных (микроматриц) данных, оно не компилирует никаких всеобъемлющих результатов.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ