• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2018/2019

Распределенные базы данных

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус: Курс по выбору (Компьютерные системы и сети)
Направление: 09.04.01. Информатика и вычислительная техника
Когда читается: 1-й курс, 1, 2 модуль
Формат изучения: Full time
Прогр. обучения: Компьютерные системы и сети
Язык: русский
Кредиты: 6

Программа дисциплины

Аннотация

После углубленного освоения языка SQL студент станет квалифицированным пользователем реляционных баз данных, способным писать высокоэффективные запросы к РБД. Изучив принципы организации и методы поддержки распределенных баз данных, выполнив проектную часть домашнего задания, студент получит квалификацию разработчика РБД по произвольной предметной области. На практических занятиях студент получит навыки программиста, занимающегося реализацией проекта БД и прикладной логики распределенных автоматизированных информационных систем (РАИС), которые основаны на базах данных. После изучения части курса, касающейся сетевых вычислений, студент сможет сформулировать требования к организации распределенных вычислений, научится использовать современное программное обеспечение для организации распределенных вычислительных систем, разрабатывать распределенные вычислительные приложения и организовывать распределенное решение вычислительных задач.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины "Распределенные базы данных и сетевые вычисления" в части, касающейся распределенных баз данных (РБД) являются изучение научных и технических проблем, задач и вопросов организации распределенных баз данных, направленных на создание новых методов организации хранения данных, новых моделей данных, на разработку новых высокоэффективных алгоритмов обработки данных в распределенных системах, а также освоение методов проектирования и реализации РБД. В части, касающейся сетевых вычислений (СВ), целью освоения данной дисциплины является изучение архитектуры и технологий построения систем распределенных вычислений, знакомство с распределенными алгоритмами.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знание основной терминологии, основных функций систем управления базами данных (СУБД) и отличий СУРБД.
  • Умение выбирать методы поддержки распределённости при проектировании РБД.
  • Знание протокола двухфазной фиксации, основных протоколов ликвидации и управления блокировками.
  • Умение обосновывать необходимость применения РБД, проводить анализ предметной области (ПрО), составлять инфологическую модель и даталогическую (концептуальную) схему БД, разрабатывать схему фрагментации БД для распределенной системы с учетом особенностей выбранной ПрО.
  • Умение создавать интерфейс к РБД с помощью встроенных средств СУРБД или внешнего языка высокого уровня (на выбор). Умение реализовывать правила прикладной области с помощью программных элементовРБД.
  • Знание синтаксиса языка SQL, понимание способов реализации SQL-запросов, умение писать квази-оптимальные запросы. Умение управлять индексами и способами хранения данных с целью повышения эффективности БД.
  • Знание основных проблем и направления развития РБД. Умение проводить анализ проблемы и делать доклад на выбранную тему.
  • Знание основной терминологии, основных понятий и определений.
  • Знание истории развития распределенных вычислений.
  • Знание модели распределенных вычислений.
  • Знание механизма логических часов распределенных вычислений.
  • Знание взаимных исключений, существующих в распределенных системах.
  • Знание технологии одноранговых сетей.
  • Знание технологии ГРИД систем.
  • Знания об облачных вычислениях.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение. Архитектура Системы Управления Распределенными Базами Данных (СУРБД).
    Общие принципы организации РБД. Критерии распределенности (по К. Дейту). Преимущества и недостатки РБД. Функции СУРБД. Архитектура СУРБД.
  • Методы поддержки распределенных баз данных
    Фрагментация. Назначение. Типы фрагментации. Репликация. Типы репликации. Распределенные ограничения целостности. Распределенные запросы: основные проблемы; способы их разрешения; алгоритмы выполнения. Методы организации глобального словаря-справочника данных. Распределенные транзакции. Общие сведения.
  • Управление распределенными транзакциями.
    Механизм двухфазной фиксации. Протоколы ликвидации. Управление блокировками. Трехфазная фиксация. Модель распределенной обработки транзакций X/Open.
  • Методы проектирования распределенных БД.
    ER-метод ("сущность-связь"): принципы и применение. Проблемы ER-моделирования. Расширенная модель "сущность-связь": обобщение, агрегирование, композиция. Доменно-ориентированное проектирование. Критерии оценки проекта базы данных и их использование.
  • Организация интерфейса к РБД.
    Архитектура клиент-сервер для баз данных. Технологии доступа к распределенной базе данных. Элементы интерфейса. Программные объекты БД: триггеры, процедуры, функции.
  • Оптимизация распределенных запросов. Глобальная оптимизация.
    Проблемы оптимизации локальных и распределенных запросов.Логическая и семантическая оптимизация. Эвристики и алгоритмы оптимизации.Глобальная оптимизация запросов. Оптимизация распределенных запросов.
  • Исследовательские проблемы в области РБД.
    Обработка неполных, неточных, слабоструктурированных данных.Облачные технологии и GRID.BigData. Технологии разработки данных и знаний (datamining и knowledgemining). Хранилища данных. GRID-технология. BigData.Новые модели данных.Перспективы развития технологии баз данных. Основные нерешенные проблемы в области БД.
  • Предмет распределенных вычислений.
    Понятие распределенных вычислений и распределенной системы. Цели построения распределенных систем. Требования к распределенным системам. Понятие и назначение программного обеспечения промежуточного уровня. Взаимодействие в распределенных системах.
  • История развития распределенных вычислений.
    Первое поколение систем распределенных вычислений.Второе поколение систем распределенных вычислений. Современные РВС.
  • Модель распределенных вычислений.
    Модель распределенной системы.Причинно-следственный порядок событий. Эквивалентные выполнения.конус прошлого и конус будущего события. Свойства каналов.
  • Логические часы.
    Общие принципы построения логических часов. Скалярное время Лэмпорта. Векторное время. Методы эффективной реализации векторных часов. Матричное время.
  • Взаимное исключение в распределенных системах.
    Общие концепции.Централизованный алгоритм. Алгоритмы на основе получения разрешений. Алгоритмы на основе получения маркера
  • Технологии одноранговых сетей.
    Основы технологии одноранговых сетей. Алгоритмы работы P2P сетей. Применение технологий P2P. Достоинства и недостатки P2P.
  • Технологии ГРИД.
    Архитектура Грид. Стандарты Грид. Примеры систем.
  • Облачные вычисления.
    Определение облачных вычислений.Многослойная архитектура облачных приложений. Компоненты облачных приложений. Достоинства и недостатки облачных вычислений. Классификация облаков. Примеры облачных платформ.
Элементы контроля

Элементы контроля

  • неблокирующий Аудиторная работа1
  • неблокирующий Практическое задание1
  • блокирует часть оценки/расчета Экзамен1
  • неблокирующий Доклад2
  • неблокирующий практическая работа2
  • неблокирующий индивидуальная работа2
  • блокирует часть оценки/расчета Экзамен2
  • неблокирующий Аудиторная работа3
  • неблокирующий индивидуальное задание 3
  • блокирует часть оценки/расчета Экзамен3
  • неблокирующий аудиторная работа4
  • неблокирующий практические занятия4
  • блокирует часть оценки/расчета Экзамен4
    Экзамен проводится в устной форме (опрос по материалам курса). Экзамен проводится на платформе meet.miem.hse.ru. К экзамену необходимо подключиться согласно расписанию экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка meet.miem.hse.ru. Для участия в экзамене студенту необходимо явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. При долговременном нарушении связи (более 10 минут) студенту может быть предложен дополнительный вопрос. Процедура пересдачи аналогична процедуре сдачи.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (1 модуль)
    Орез1=0.12Оаудит.работа1+0.48Одомаш.задание1+0.40Оэкзамен1
  • Промежуточная аттестация (2 модуль)
    Орез2=0.024*Опром1+0.18*Одоклад2+0.126Опрактич.задан.2+0.054*Оконтр.работа2+0.4*Оэкзамен2
  • Промежуточная аттестация (3 модуль)
    Орез3=0.12Оаудит.работа3+0.48Одомаш.задание3+0.40Оэкзамен3
  • Промежуточная аттестация (4 модуль)
    Орез4=0.48*Опракт.раб.4+0.12*Оаудит.4=0.4*Оэкз4
Список литературы

Список литературы

Рекомендуемая основная литература

  • Агальцов В.П. Базы данных. В 2-х кн. Книга 2. Распределенные и удаленные базы данных : учебник / В.П. Агальцов. — М. : ИД «ФОРУМ» : ИНФРА-М, 2017. — 271 с. : ил. — (Высшее образование). - Режим доступа: http://znanium.com/catalog/product/652917
  • Будылдина Н.В., Шувалов В.П. - Сетевые технологии высокоскоростной передачи данных - Издательство "Горячая линия-Телеком" - 2018 - ISBN: 978-5-9912-0536-8 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/111025
  • Философия Java, Эккель Б., Матвеева Е., 2011

Рекомендуемая дополнительная литература

  • Компьютерные сети : принципы, технологии, протоколы: учеб. пособие для вузов, Олифер В. Г., Олифер Н. А., 2006
  • Компьютерные сети, Таненбаум Э., Шрага В., 2005