2024/2025
Анализ биологических данных с использованием нейронных сетей
Статус:
Маго-лего
Кто читает:
Базовая кафедра Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН
Когда читается:
3, 4 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
6
Программа дисциплины
Аннотация
Курс посвящен анализу и интерпретации биологических данных с использованием современных методов машинного обучения, включая нейронные сети. Основная цель курса – ознакомить студентов с различными типами биологических данных, такими как геномные, протеомные, и электрофизиологические, и научить их применять методы глубокого обучения для решения задач, связанных с анализом этих данных.
Программа курса охватывает полный цикл анализа данных: от предобработки и статистического анализа данных до выбора и настройки архитектур нейронных сетей, таких как сверточные (CNN) и рекуррентные (RNN) сети. В курсе также рассматриваются продвинутые методы, включая автоэнкодеры для выделения признаков и трансферное обучение для адаптации предобученных моделей на малых наборах данных. Особое внимание уделяется интерпретации и объяснению моделей, что важно для применения нейронных сетей в биологических и медицинских исследованиях.
Практическая часть курса включает семинары, на которых студенты получат опыт работы с реальными биологическими наборами данных. Итоговый проект позволит студентам применить полученные знания для решения конкретной биологической задачи и продемонстрировать свои навыки в области анализа данных и построения моделей нейронных сетей.
Цель освоения дисциплины
- Овладеть основными методами анализа биологических данных и научиться применять их для решения задач в биоинформатике и нейробиологии.
- Изучить принципы работы и настройки нейронных сетей, включая сверточные и рекуррентные архитектуры, а также методы их адаптации для анализа биологических данных.
- Развить навыки предобработки данных, включая очистку, нормализацию, аугментацию, а также базовые навыки статистического анализа для корректного анализа биологических данных.
- Научиться использовать методы интерпретации и объяснимости нейронных сетей, чтобы повысить доверие к результатам моделей при анализе медицинских и биологических данных.
- Получить практический опыт работы с реальными биологическими наборами данных и углубить понимание возможностей и ограничений нейронных сетей в биологических исследованиях.
- Подготовить студентов к самостоятельной работе в междисциплинарных проектах, связанных с анализом биологических данных и машинным обучением, включая разработку и реализацию собственных моделей.
Планируемые результаты обучения
- Знает основные типы биологических данных
- Знает основные архитектуры нейронных сетей (сверточные, рекуррентные, автоэнкодеры, трансформеры) и умеет выбирать их для анализа различных типов биологических данных.
- Знает методы предобработки данных, такие как очистка, нормализация, аугментация, и умеет применять их для подготовки биологических данных.
- Умеет использовать методы статистического анализа для проверки гипотез и обнаружения паттернов в биологических данных.
- Умеет строить и обучать нейронные сети для решения задач классификации, регрессии и анализа временных рядов на биологических данных.
- Умеет применять методы объяснимости (SHAP, LIME) для анализа влияния признаков на предсказания модели и интерпретировать результаты.
- Знает основные инструменты и библиотеки для машинного обучения и умеет использовать их в практическом анализе данных
- Готов к работает в междисциплинарных командах, критически оценивать модели и адаптировать современные технологии для биологических и медицинских задач.
Содержание учебной дисциплины
- Введение в биологические данные и нейронные сети
- Предобработка данных в анализе биологических данных
- Основы статистического анализа биологических данных
- Основы нейронных сетей
- Сверточные нейронные сети (CNN) для анализа изображений
- Рекуррентные нейронные сети (RNN) для анализа последовательных данных и временных рядов
- Продвинутые архитектуры для анализа биологических данных
- Трансферное обучение в анализе биологических данных
- Интерпретация и объяснимость моделей
- Практические приложения и будущее в анализе биологических данных
Список литературы
Рекомендуемая основная литература
- Deep learning, Kelleher, J. D., 2019
- Neural Networks and Deep Learning - CCBY4_068 - Michael Nielson - 2022 - Open Educational Resources: libretexts.org - https://ibooks.ru/bookshelf/390854 - 390854 - iBOOKS
Рекомендуемая дополнительная литература
- Introduction to deep learning, Charniak, E., 2018