• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

How to Process and Store Big Data and Machine Learning

2021/2022
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Delivered at:
Department of Computer Security
Course type:
Elective course
When:
4 year, 4 module

Instructor


Mankaev, Ilia

Программа дисциплины

Аннотация

Данная дисциплина относится к блоку дисциплин по выбору вариативной части профиля профессионального цикла, проводится на 4 курсе обучения. Изучение данной дисциплины базируется на следующих дисциплинах: Информатика, Языки программирования, Теория вероятностей и математическая статистика, Методы программирования, Методы анализа данных. Основные положения дисциплины должны быть использованы в дальнейшем при изучении таких дисциплин, как: Моделирование бизнес-процессов, Управление жизненным циклом ИС. Результаты освоения дисциплины используются в дальнейшем при прохождении производственной и преддипломной практик, при выполнении выпускной квалификационной работы.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Методы обработки и хранения больших данных и машинного обучения» является теоретическая и практическая подготовка студентов к работе с большими массивами данных и методами их обработки. Знания, полученные в результате освоения дисциплины, помогут при сборе и анализе больших объемов структурированной и неструктурированной информации, при разработке моделей данных и получении новых знаний в данной области.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать глобально- распределенные БД, пакетную и потоковую обработки
  • Знать задачи распределенных файловых систем, партиционарование, шардирование, разбиение, сегментирование
  • Знать основные методики, алгоритмы и библиотеки для полнотекстового поиска в больших данных
  • Знать понятия согласованности и линеаризуемости изменений, модели согласованности и алгоритмы консенсуса
  • Знать требования приложений к СУБД, строгую предопределенную схему и нормализацию, пути масштабирования и архитектуру разделяемой памяти.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Физическое хранение данных, их эволюция
  • Колоночные СУБД и репликация данных
  • Распределенные системы, алгоритмы консенсуса
  • Глобально-распределенная БД. Пакетная обработка
  • Анализ текста
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа
  • неблокирующий Тестовое задание
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 4 модуль
    0.25 * Контрольная работа + 0.5 * Экзамен + 0.25 * Тестовое задание
Список литературы

Список литературы

Рекомендуемая основная литература

  • Hurwitz, J., Kaufman, M., Halper, F., & Nugent, A. (2013). Big Data For Dummies. Hoboken, N.J.: For Dummies. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=565511
  • Pedrycz, W., & Chen, S.-M. (2017). Data Science and Big Data: An Environment of Computational Intelligence. Cham: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1489226

Рекомендуемая дополнительная литература

  • Mahmood, Z. (2016). Data Science and Big Data Computing : Frameworks and Methodologies. Switzerland: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1203573