• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2020/2021

Методы, модели, технологии и технологические платформы для создания обучаемых экспертных систем на основе всех видов данных

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус: Курс по выбору (Компьютерные системы и сети)
Направление: 09.04.01. Информатика и вычислительная техника
Когда читается: 1-й курс, 3, 4 модуль
Формат изучения: без онлайн-курса
Преподаватели: Кочнев Алексей Андреевич, Поляков Константин Львович
Прогр. обучения: Компьютерные системы и сети
Язык: русский
Кредиты: 5
Контактные часы: 70

Программа дисциплины

Аннотация

Настоящая программа учебной дисциплины «Методы, модели, технологии и технологические платформы для создания обучаемых экспертных систем на основе всех видов данных» устанавливает минимальные требования к знаниям и умениям студента и определяет содержание и виды учебных занятий и отчетности. Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 09.04.01 «Информатика и вычислительная техника» подготовки магистра, изучающих дисциплину «Методы, модели, технологии и технологические платформы для создания обучаемых экспертных систем на основе всех видов данных».
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины «Методы, модели, технологии и технологические платформы для создания обучаемых экспертных систем на основе всех видов данных» являются приобретение комплекса теоретических знаний и методологических основ в области применения методов и моделей для обработки корпоративных данных, а также практических навыков их применения на примере информационно-аналитической плат-формы IBMBigData.
Планируемые результаты обучения

Планируемые результаты обучения

  • Специфицирует и оценивает модель классификации данных адекватную задаче в предметной области.
  • Проводит анализ кластерной структуры данных.
  • Осуществляет выбор адекватной данным модели панельных данных на основании формальных критериев и постановки задачи в предметной области.
  • Осуществляет спецификацию и обучение нейронной сети в простой ситуации.
  • Имеет представление об архитектуре и видах современных информационно-аналитических систем. Понимает различие в подходах построения ИАС.
  • Понимает различия между данными, информацией и знаниями. Знает методы взаимодействия с данными и информацией. Имеет представление о понятии метаданных
  • Имеет представление о назначении и архитектуре классических онтологий. Специфицирует структуру онтологии с использованием языков представления.
  • Владеет методами стандартизации, очистки и обогащения данных.
  • Имеет представление о Ha-doop, его архитектуре. Умеет взаимодействовать с распределенной файловой системой HDFS и моделью параллельной обработки данных MapReduce.
  • Имеет представление о платформе IBMBigData и аналогах. Знает состав платформы, особенности, преимущества и недостатки решения. Умеет пользоваться компонентами платформы.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Методы классификации.
    Модели бинарного выбора (логит и пробит регерссии). Деревья классификации —алгоритмы CART, С4.5.
  • Основы кластерного анализа.
    Иерархическая кластеризация. Оптимизационная кластеризация — метод к-средник. Метрики качества кластеризации.
  • Модели панельных данных.
    Модели с фиксированными и случайными эффектами. Методология выбора типа модели.
  • Основы построения нейронных сетей.
    Структура нейронной сети. Обучение и оценка качества.
  • Современные информационно-аналитические системы
    Понятие, назначение информационно-аналитических систем. Уровни принятия ре-шений (и различия в функциях и методах ИАС на разных уровнях). Подходы к обработке данных в потоке и в покое. Классификация информационно-аналитических систем
  • Искусственный интеллект и интеллектуальные информационные системы
    Понятие искусственного интеллекта. Направления развития искусственного интеллекта. Интеллектуальные информационные системы, ее виды, классификация. Введение в экспертные системы, роль и назначение.
  • Данные и информация
    Определения: данные, информация, знания. Метаданные и характеристики данных. Источники, жизненный цикл и методы анализа данных (статистические vs интеллектуальные). Использование данных в ИАС.
  • Онтологии. Языки представления онтологий: RDF(S), OWL
    Понятие онтологии, роль в ИАС, классификация. Семантический Web (SemanticWeb). Модель RDF/RDFS как базис SemanticWeb. OWL – язык сетевых онтоло-гий. SPARQL - язык запросов к данным, представленным по модели RDF
  • Обработка данных
    Проблема качества данных. Стандартизация. Регулярные выражения. Очистка дан-ных. Обогащение данных
  • Hadoop
    Подход к реализации хранилищ данных NoSQL. Hadoop: распределенная файловая система HDFS и модель параллельной обработки данных MapReduce. Использование язы-ка Pig и надстройки Hive. Утилита Sqoop.
  • Платформа Больших данных
    Платформа Big Data. Pure Data for Analytics (Netezza).WatsonContentAnalytics. Примеры-использования
Элементы контроля

Элементы контроля

  • блокирует часть оценки/расчета экзамен3
    Экзамен проводится в устной форме (опрос по материалам курса). Экзамен проводится на платформе meet.miem.hse.ru. К экзамену необходимо подключиться согласно расписанию экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка meet.miem.hse.ru. Для участия в экзамене студенту необходимо явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. При долговременном нарушении связи (более 10 минут) студенту может быть предложен дополнительный вопрос. Процедура пересдачи аналогична процедуре сдачи.
  • неблокирующий контрольная работа4
  • блокирует часть оценки/расчета экзамен4
    Экзамен проводится в устной форме (опрос по материалам курса). Экзамен проводится на платформе meet.miem.hse.ru. К экзамену необходимо подключиться согласно расписанию экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка meet.miem.hse.ru. Для участия в экзамене студенту необходимо явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. При долговременном нарушении связи (более 10 минут) студенту может быть предложен дополнительный вопрос. Процедура пересдачи аналогична процедуре сдачи.
  • неблокирующий активность на практ.занятиях3
  • неблокирующий активность на практ.занятиях4
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    Орез4=0.50Орез3+0.125Оактив.на практ.зан4+0.125Окр4+0.25Оэкз4
Список литературы

Список литературы

Рекомендуемая основная литература

  • Эконометрика - 2: продвинутый курс с приложениями в финансах: Учебник / С.А. Айвазян, Д. Фантаццини; Московская школа экономики МГУ им. М.В. Ломоносова (МШЭ). - М.: Магистр: НИЦ ИНФРА-М, 2014. - 944 с.: 70x100 1/32. (переплет) ISBN 978-5-9776-0333- - Режим доступа: http://znanium.com/catalog/product/472607

Рекомендуемая дополнительная литература

  • Введение в эконометрику : учебник для вузов, Доугерти, К., 2010
  • Системный анализ : учебник для вузов, Антонов, А. В., 2006
  • Системный анализ, оптимизация и принятие решений : учеб. пособие для вузов, Козлов, В. Н., 2010
  • Эконометрика. Начальный курс : учебник для вузов, Магнус, Я. Р., 2007