Магистратура
2020/2021
Методы, модели, технологии и технологические платформы для создания обучаемых экспертных систем на основе всех видов данных
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Курс по выбору (Компьютерные системы и сети)
Направление:
09.04.01. Информатика и вычислительная техника
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
без онлайн-курса
Прогр. обучения:
Компьютерные системы и сети
Язык:
русский
Кредиты:
5
Контактные часы:
70
Программа дисциплины
Аннотация
Настоящая программа учебной дисциплины «Методы, модели, технологии и технологические платформы для создания обучаемых экспертных систем на основе всех видов данных» устанавливает минимальные требования к знаниям и умениям студента и определяет содержание и виды учебных занятий и отчетности. Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 09.04.01 «Информатика и вычислительная техника» подготовки магистра, изучающих дисциплину «Методы, модели, технологии и технологические платформы для создания обучаемых экспертных систем на основе всех видов данных».
Цель освоения дисциплины
- Целями освоения дисциплины «Методы, модели, технологии и технологические платформы для создания обучаемых экспертных систем на основе всех видов данных» являются приобретение комплекса теоретических знаний и методологических основ в области применения методов и моделей для обработки корпоративных данных, а также практических навыков их применения на примере информационно-аналитической плат-формы IBMBigData.
Планируемые результаты обучения
- Специфицирует и оценивает модель классификации данных адекватную задаче в предметной области.
- Проводит анализ кластерной структуры данных.
- Осуществляет выбор адекватной данным модели панельных данных на основании формальных критериев и постановки задачи в предметной области.
- Осуществляет спецификацию и обучение нейронной сети в простой ситуации.
- Имеет представление об архитектуре и видах современных информационно-аналитических систем. Понимает различие в подходах построения ИАС.
- Понимает различия между данными, информацией и знаниями. Знает методы взаимодействия с данными и информацией. Имеет представление о понятии метаданных
- Имеет представление о назначении и архитектуре классических онтологий. Специфицирует структуру онтологии с использованием языков представления.
- Владеет методами стандартизации, очистки и обогащения данных.
- Имеет представление о Ha-doop, его архитектуре. Умеет взаимодействовать с распределенной файловой системой HDFS и моделью параллельной обработки данных MapReduce.
- Имеет представление о платформе IBMBigData и аналогах. Знает состав платформы, особенности, преимущества и недостатки решения. Умеет пользоваться компонентами платформы.
Содержание учебной дисциплины
- Методы классификации.Модели бинарного выбора (логит и пробит регерссии). Деревья классификации —алгоритмы CART, С4.5.
- Основы кластерного анализа.Иерархическая кластеризация. Оптимизационная кластеризация — метод к-средник. Метрики качества кластеризации.
- Модели панельных данных.Модели с фиксированными и случайными эффектами. Методология выбора типа модели.
- Основы построения нейронных сетей.Структура нейронной сети. Обучение и оценка качества.
- Современные информационно-аналитические системыПонятие, назначение информационно-аналитических систем. Уровни принятия ре-шений (и различия в функциях и методах ИАС на разных уровнях). Подходы к обработке данных в потоке и в покое. Классификация информационно-аналитических систем
- Искусственный интеллект и интеллектуальные информационные системыПонятие искусственного интеллекта. Направления развития искусственного интеллекта. Интеллектуальные информационные системы, ее виды, классификация. Введение в экспертные системы, роль и назначение.
- Данные и информацияОпределения: данные, информация, знания. Метаданные и характеристики данных. Источники, жизненный цикл и методы анализа данных (статистические vs интеллектуальные). Использование данных в ИАС.
- Онтологии. Языки представления онтологий: RDF(S), OWLПонятие онтологии, роль в ИАС, классификация. Семантический Web (SemanticWeb). Модель RDF/RDFS как базис SemanticWeb. OWL – язык сетевых онтоло-гий. SPARQL - язык запросов к данным, представленным по модели RDF
- Обработка данныхПроблема качества данных. Стандартизация. Регулярные выражения. Очистка дан-ных. Обогащение данных
- HadoopПодход к реализации хранилищ данных NoSQL. Hadoop: распределенная файловая система HDFS и модель параллельной обработки данных MapReduce. Использование язы-ка Pig и надстройки Hive. Утилита Sqoop.
- Платформа Больших данныхПлатформа Big Data. Pure Data for Analytics (Netezza).WatsonContentAnalytics. Примеры-использования
Элементы контроля
- экзамен3Экзамен проводится в устной форме (опрос по материалам курса). Экзамен проводится на платформе meet.miem.hse.ru. К экзамену необходимо подключиться согласно расписанию экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка meet.miem.hse.ru. Для участия в экзамене студенту необходимо явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. При долговременном нарушении связи (более 10 минут) студенту может быть предложен дополнительный вопрос. Процедура пересдачи аналогична процедуре сдачи.
- контрольная работа4
- экзамен4Экзамен проводится в устной форме (опрос по материалам курса). Экзамен проводится на платформе meet.miem.hse.ru. К экзамену необходимо подключиться согласно расписанию экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка meet.miem.hse.ru. Для участия в экзамене студенту необходимо явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. При долговременном нарушении связи (более 10 минут) студенту может быть предложен дополнительный вопрос. Процедура пересдачи аналогична процедуре сдачи.
- активность на практ.занятиях3
- активность на практ.занятиях4
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)Орез4=0.50Орез3+0.125Оактив.на практ.зан4+0.125Окр4+0.25Оэкз4
Список литературы
Рекомендуемая основная литература
- Эконометрика - 2: продвинутый курс с приложениями в финансах: Учебник / С.А. Айвазян, Д. Фантаццини; Московская школа экономики МГУ им. М.В. Ломоносова (МШЭ). - М.: Магистр: НИЦ ИНФРА-М, 2014. - 944 с.: 70x100 1/32. (переплет) ISBN 978-5-9776-0333- - Режим доступа: http://znanium.com/catalog/product/472607
Рекомендуемая дополнительная литература
- Введение в эконометрику : учебник для вузов, Доугерти, К., 2010
- Системный анализ : учебник для вузов, Антонов, А. В., 2006
- Системный анализ, оптимизация и принятие решений : учеб. пособие для вузов, Козлов, В. Н., 2010
- Эконометрика. Начальный курс : учебник для вузов, Магнус, Я. Р., 2007