Бакалавриат
2019/2020





Разведочный анализ данных
Статус:
Курс по выбору (Бизнес-информатика)
Направление:
38.03.05. Бизнес-информатика
Кто читает:
Кафедра бизнес-аналитики
Где читается:
Факультет бизнеса и менеджмента
Когда читается:
3-й курс, 3, 4 модуль
Формат изучения:
Full time
Преподаватели:
Шевгунов Тимофей Яковлевич
Язык:
русский
Кредиты:
4
Программа дисциплины
Аннотация
Целями освоения дисциплины является формирование у студентов комплекса теоретических знаний и методологических основ в области проведения разведочного анализа данных с использованием интеллектуальных систем обработки информации, а также практических навыков, необходимых для внедрения и практического использования таких систем. Задачи дисциплины: 1. Получить представление о современных подходах и процедурах разведочного анализа данных, выполняемой с использованием интеллектуальных системах. 2. Познакомиться с основными методами интеллектуального анализа данных. 3. Изучить основные технологии построения алгоритмов разведочного анализа данных с использованием информационных систем на основе технологий прикладного искусственного интеллекта. 4. Выработать навыки использования современных информационных технологий и программных средств, реализующих алгоритмы интеллектуального анализа данных. Для изучения дисциплины «Разведочный анализ данных» студент должен: 1. знать основные понятия математического анализа, теория вероятностей и математической статистика, теоретических основ информатики, программирования; 2. владеть основным содержанием дисциплин микроэкономика, менеджмент, архитектура предприятия, теоретические основы информатики; 3. уметь использовать математические и инструментальные программные средства для решения задач анализа информации, создания электронных таблиц, отчётов и презентаций.
Цель освоения дисциплины
- Знать: место и роль интеллектуальных систем обработки данных в архитектуре предприятия; основные модели и технологии, основанные на обработке знаний в системах прикладного искусственного интеллекта, области и границы их применения
- Уметь: делать обоснованный выбор технологии искусственного интеллекта, наиболее подходящей для решения прикладной задачи; формулировать требования к характеристикам интеллектуальной системе; интерпретировать и синтезировать комплексные модели, построенные на основе технологий прикладного искусственного интеллекта
- Владеть: основными классами современных и перспективных интеллектуальных систем, входящих в ИТ-инфраструктуру предприятия.
Результаты освоения дисциплины
- Знать основные исторические и современные подходы анализа данных
- Уметь использовать методы формальной логики для представления предметной области
- Знать основные методы, на основе которых проводится анализ данных
- Знать основные задачи разведочного анализа данных
- Знать основные модели описания и представления данных
- Уметь выбирать шкалу представления данных
- Уметь формулировать задачу разведочного анализа
- Знать основные программные средства разведочного анализа
- Уметь проводить сравнение функциональных возможностей программных средств разведочного анализа данных
- Владеть программными средствами (минимум одним) разведочного анализа данных
- Знать основные модели нечёткой логики
- Уметь синтезировать представления предметной области на основе моделей нечёткой логики
- Владеть основными операциями нечёткой арифметики
- Знать основные визуальные средства представления данных
- Уметь формировать визуальные представления статических данных
- Уметь формировать визуальные представления временных рядов
- Уметь формировать визуальные представления финансовых данных
- Владеть методами обнаружения ошибок в визуальных представлениях
- Знать основные алгоритмы построения деревьев решений
- Уметь строить дерево решения с использованием алгоритма ID3
- Владеть методами анализа качества построенных деревьев решений
- Знать основные задачи и алгоритмы кластерного анализа
- Знать основные этапы алгоритма К-средних
- Уметь проводить кластеризацию объектов, описываемых числовыми признаками
- Владеть методом К-средних для проведения кластерного анализа
- Знать структуру искусственных нейронных сетей
- Уметь проводить анализ нейронной сети по её структурному графу
- Уметь формировать граф нейронной сети
- Владеть методами обучения нейронных сетей на основе обратного распространения ошибки
Содержание учебной дисциплины
- Основные понятия, назначение и место интеллектуальных систем в ИТ-инфраструктуре предприятияКраткая историческая справка. Основные понятия и определения. Сравнительная классификация задач, решаемых человеком и искусственным интеллектом. Классификация интеллектуальных систем. Эволюция информационных систем. Предмет и содержание курса. Связь курса с другими дисциплинами. Обзор моделей представления знания и предметной области. Интеллектуальные методы обработки информации. Проблемы управления знаниями предприятия. Обзор основных технологий реализации интеллектуальных методов в прикладных информационных системах искусственного интеллекта.
- Основные задачи, модели и методы разведочного анализаОсновные аналитические модели. Скалярные и многомерные модели. Статические и динамические модели. Детерминированные, стохастические и хаотические модели. Линейные и нелинейные модели. Методы обучения интеллектуальных систем: обучение с учителем, обучение с подкреплением, самоорганизация. Режимы обучения: пакетный, интерактивный и смешанный.
- Программные средства разведочного анализаПрограммные средства, реализующие интеллектуальные методы обработки. Сравнительный анализ программных продуктов, на примере продуктов: Microsoft Excel, IBM SPSS, Mathworks Matlab. Визуализация и подготовка графических материалов для отчётов.
- Использование нечётких множеств и отношений для представления знаний в интеллектуальных системахПонятие чётких и нечётких объектов: множеств, чисел и отношений. Нечёткие множества. Функции принадлежности. Операции над нечёткими множествами. Нечёткие числа, операции над нечёткими числами. Операции фуззификации и деффузификации. Нечёткие отношения. Правила нечеткого вывода. Системы нечёткого вывода, на основе алгоритма Мамдами. Системы нечёткого вывода на основе алгоритма Сугено. Практический синтез простых систем нечёткого вывода на основе алгоритмов Мамдами и Сугено.
- Визуальный анализ данныхВизуализация результатов статистической обработки. Визуализация временных рядов. Интерполяционные техники. Визуализация финансовых рядов. Графики типа «японские свечи» и OHLC. Визуализация многомерных данных. Основные ошибки визуализации.
- Деревья классификации и регрессииДеревья принятия решений: деревья классификации и деревья регрессии. Меры неопределенности: энтропия, индекс Джини, вероятность ошибочной классификации. Алгоритмы построения деревьев решения: ID3/C4.5, CART. Особенности построения деревьев регрессии. Жадные алгоритмы. Технологии улучшения деревьев методом обрезки. Кросс-валидация применительно к деревьям решений. Практические реализации методов построения дерева классификация с использованием программных средств.
- Основы кластерного анализаКоличественные меры расстояний между объектами в признаковом пространстве. Кластеризация методом ближайшего соседа. Иерархическая кластеризация. Анализ алгоритма кластеризации методом K-средних. Модификации алгоритма. Предварительный выбор центров кластеров. Алгоритм K-медиан. Оценка качества классификатора. Силуэты. Семантические и информационные критерии выбора количества кластеров.
- Интеллектуальные методы на основе искусственных нейронных сетейИскусственная нейронная сеть, как аналог биологической структуры. Модель нейрона МакКалока-Питтса. Структурные элементы нейронной сети. Модель персептрона Розенблатта. Модель многослойного персептрона. Модель нейронной сети на основе радиально-базисных функций. Обучение с подкреплением. Самообучающиеся сети. Модель самоорганизующихся карт Кохонена. Обучение нейронной сети. Обучение с учителем и самообучение. Процедура обратного распространения ошибки. Методы обучения первого порядка: градиентный спуск и его модификации. Методы обучения второго порядка. Практическое применение нейронных сетей для решения задач аппроксимации и классификации.
Элементы контроля
- Контрольная работа №1 (неблокирующий)
- Контрольная работа №2 (неблокирующий)
- Реферат (неблокирующий)
- Экзамен (неблокирующий)
- Аудиторная работа (неблокирующий)
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.2 * Аудиторная работа + 0.25 * Контрольная работа №1 + 0.25 * Контрольная работа №2 + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- Matlab : теория и практика, Гилат А., Смоленцева Н. К., 2016
- Python для сложных задач : наука о данных и машинное обучение, Плас, Дж. В., Пальти, И., 2018
- Анализ данных : учебник для академического бакалавриата, Мхитарян, В. С., 2018
- Анализ данных в MS Excel : основные сведения о MS Excel, статистические таблицы и графики, статистические функции, пакет анализа (анализ данных) : учеб. пособие для вузов, Мхитарян, В. С., Шишов, В. Ф., 2018
- Введение в анализ данных : учебник и практикум для вузов, Миркин Б. Г., 2015
- Интеллектуальные ситемы : учебник и практикум для академического бакалавриата, Бессмертный, И. А., Нугуманова, А. Б., 2018
- Машинное обучение : наука и искусство построения алгоритмов, которые извлекают знания из данных, Флах П., Слинкина А. А., 2015
- Многомерный статистический анализ в экономических задачах: компьютерное моделирование в SPSS : учеб. пособие для вузов, Концевая, Н. В., 2019
- Нейронные сети,генетические алгоритмы и нечеткие системы, Рутковская Д., Пилиньский М., 2008
- Нейронные сети. Полный курс : пер. с англ., Хайкин С., 2018
- Проектирование экономических информационных систем, учебник, под ред. Ю. Ф. Тельнова, 512 с., Смирнова, Г. Н., Сорокина, А. А., Тельнов, Ю. Ф., 2003
Рекомендуемая дополнительная литература
- Discovering statistics using IBM SPSS statistics, Field, A., 2018
- Python и анализ данных, Маккинли У., Слинкина А. А., 2015
- Глубокое обучение : погружение в мир нейронных сетей, Николенко, С., Кадурин, А., 2018
- Интеллектуальные информационные системы в экономике : Учеб. пособие для вузов, Тельнов Ю. Ф., 2002
- Крупномасштабное машинное обучение вместе с Python : учитесь быстро создавать мощные модели машинного обучения и развертывать крупномасштабные приложения прогнозирования, Шарден, Б., Массарон, Л., 2018
- Методы разработки математических моделей и вычислительный эксперимент на базе пакета MATLAB : курс лекций, Плохотников, К. Э., 2019
- Нейросетевые системы искусственного интеллекта в задачах обработки изображений, Акинин М. В., Никифоров М. Б., 2016
- Нечеткие множества и нейронные сети : учеб. пособие, Яхъяева Г. Э., 2012
- Прогнозное моделирование в IBM SPSS Statistics и R : метод деревьев решений, Груздев, А. В., 2017
- Системы искусственного интеллекта. Практический курс : учеб. пособие для вузов, Чулюков В. А., Астахова И. Ф., 2008