Магистратура
2019/2020
Программирование на языке R
Статус:
Курс обязательный (Анализ данных в биологии и медицине)
Направление:
01.04.02. Прикладная математика и информатика
Кто читает:
Кафедра технологий моделирования сложных систем
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Мазин Павел Владимирович
Прогр. обучения:
Анализ данных в биологии и медицине
Язык:
русский
Кредиты:
5
Контактные часы:
56
Программа дисциплины
Аннотация
Язык R — современный язык программирования предназначенный для статистического анализа большого объёма данных. На данный момент R является одним из самых используемых языков программирования в биоинформатике. Цель курса - освоить базовый синтаксис языка R, познакомиться с структурами данных, управляющими конструкциями и графическими возможностями. Курс включает в себя знакомство с функциями R предназначенными для выполнения основных статистических тестов, освоение базовой графики и знакомство с некоторыми биоинформатическими пакетами из Bioconductor.
Цель освоения дисциплины
- Овладение языком R, знакомство с базовыми статистическими методами
- Приобретение навыков работы с файлами в R
- Знакомство с базовой графикой в R
Планируемые результаты обучения
- знать типы данных в языке R, базовый синтаксис R и основные функции предназначенные для анализа данных
- уметь визуализировать результаты анализа при помощи базовой графики R
- уметь загрузить данные из файла и сохранить результаты анализа в файл, провести статистический анализ данных с использованием таких методов как т-тест, тест Вилкоксона, линейные модели и др.,
Содержание учебной дисциплины
- Введение, структуры данных и управляющие конструкцииВектора, листы, матрицы и дата-фреймы. Атрибуты переменных. Типы индексации. Объектно-ориентированый подход (система S3). Уловные выражения, циклы и функции семейства apply, пакет plyr. Функции, использование анонимные функций.
- ГрафикаБазовая графика, аннотация рисунков, сохранение рисунков в файл. Сглаживание и аппроксимация. Работа с цветом.
- Cтатистические функции, биоинформатические пакетыФункции для статистических распределений. Т-тест, тест Вилкоксона, тест Фишера, линейные модели, анализ вариабельности. Обобщённые линейные модели. Поправка на множественное тестирование. Пакеты seqinr, ape, GenomicRanges.
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.5 * Домашнее задание + 0.16 * Контрольная работа 1 + 0.17 * Контрольная работа 2 + 0.17 * Контрольная работа 3
Список литературы
Рекомендуемая основная литература
- Роберт И., Кабаков - R в действии. Анализ и визуализация данных в программе R - Издательство "ДМК Пресс" - 2014 - 588с. - ISBN: 978-5-97060-077-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/58703
Рекомендуемая дополнительная литература
- Trejo, O., & C. Figliozzi, P. (2017). R Programming By Example : Practical, Hands-on Projects to Help You Get Started with R. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1682395