• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

R Programming

2019/2020
Academic Year
RUS
Instruction in Russian
5
ECTS credits
Delivered at:
Department of Complex System Modelling Technologies (Faculty of Computer Science)
Course type:
Compulsory course
When:
1 year, 1, 2 module

Instructor


Mazin, Pavel

Программа дисциплины

Аннотация

Язык R — современный язык программирования предназначенный для статистического анализа большого объёма данных. На данный момент R является одним из самых используемых языков программирования в биоинформатике. Цель курса - освоить базовый синтаксис языка R, познакомиться с структурами данных, управляющими конструкциями и графическими возможностями. Курс включает в себя знакомство с функциями R предназначенными для выполнения основных статистических тестов, освоение базовой графики и знакомство с некоторыми биоинформатическими пакетами из Bioconductor.
Цель освоения дисциплины

Цель освоения дисциплины

  • Овладение языком R, знакомство с базовыми статистическими методами
  • Приобретение навыков работы с файлами в R
  • Знакомство с базовой графикой в R
Планируемые результаты обучения

Планируемые результаты обучения

  • знать типы данных в языке R, базовый синтаксис R и основные функции предназначенные для анализа данных
  • уметь визуализировать результаты анализа при помощи базовой графики R
  • уметь загрузить данные из файла и сохранить результаты анализа в файл, провести статистический анализ данных с использованием таких методов как т-тест, тест Вилкоксона, линейные модели и др.,
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение, структуры данных и управляющие конструкции
    Вектора, листы, матрицы и дата-фреймы. Атрибуты переменных. Типы индексации. Объектно-ориентированый подход (система S3). Уловные выражения, циклы и функции семейства apply, пакет plyr. Функции, использование анонимные функций.
  • Графика
    Базовая графика, аннотация рисунков, сохранение рисунков в файл. Сглаживание и аппроксимация. Работа с цветом.
  • Cтатистические функции, биоинформатические пакеты
    Функции для статистических распределений. Т-тест, тест Вилкоксона, тест Фишера, линейные модели, анализ вариабельности. Обобщённые линейные модели. Поправка на множественное тестирование. Пакеты seqinr, ape, GenomicRanges.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
  • неблокирующий Контрольная работа 1
  • неблокирующий Контрольная работа 2
  • неблокирующий Контрольная работа 3
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.5 * Домашнее задание + 0.16 * Контрольная работа 1 + 0.17 * Контрольная работа 2 + 0.17 * Контрольная работа 3
Список литературы

Список литературы

Рекомендуемая основная литература

  • Роберт И., Кабаков - R в действии. Анализ и визуализация данных в программе R - Издательство "ДМК Пресс" - 2014 - 588с. - ISBN: 978-5-97060-077-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/58703

Рекомендуемая дополнительная литература

  • Trejo, O., & C. Figliozzi, P. (2017). R Programming By Example : Practical, Hands-on Projects to Help You Get Started with R. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1682395