• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2018/2019

Разведочный анализ данных

Статус: Курс по выбору (Бизнес-информатика)
Направление: 38.03.05. Бизнес-информатика
Когда читается: 3-й курс, 1, 2 модуль
Формат изучения: Full time
Язык: русский
Кредиты: 4

Программа дисциплины

Аннотация

Целями освоения дисциплины является формирование у студентов комплекса теоретических знаний и методологических основ в области проведения разведочного анализа данных с использованием интеллектуальных систем обработки информации, а также практических навыков, необходимых для внедрения и практического использования таких систем. Задачи дисциплины: 1. Получить представление о современных подходах и процедурах разведочного анализа данных, выполняемой с использованием интеллектуальных системах. 2. Познакомиться с основными методами интеллектуального анализа данных. 3. Изучить основные технологии построения алгоритмов разведочного анализа данных с использованием информационных систем на основе технологий прикладного искусственного интеллекта. 4. Выработать навыки использования современных информационных технологий и программных средств, реализующих алгоритмы интеллектуального анализа данных. Для изучения дисциплины «Разведочный анализ данных» студент должен: 1. знать основные понятия математического анализа, теория вероятностей и математической статистика, теоретических основ информатики, программирования; 2. владеть основным содержанием дисциплин микроэкономика, менеджмент, архитектура предприятия, теоретические основы информатики; 3. уметь использовать математические и инструментальные программные средства для решения задач анализа информации, создания электронных таблиц, отчётов и презентаций.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знать: место и роль интеллектуальных систем обработки данных в архитектуре предприятия; основные модели и технологии, основанные на обработке знаний в системах прикладного искусственного интеллекта, области и границы их применения
  • Уметь: делать обоснованный выбор технологии искусственного интеллекта, наиболее подходящей для решения прикладной задачи; формулировать требования к характеристикам интеллектуальной системе; интерпретировать и синтезировать комплексные модели, построенные на основе технологий прикладного искусственного интеллекта
  • Владеть: основными классами современных и перспективных интеллектуальных систем, входящих в ИТ-инфраструктуру предприятия.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основные понятия, назначение и место интеллектуальных систем в ИТ-инфраструктуре предприятия
    Краткая историческая справка. Основные понятия и определения. Сравнительная классификация задач, решаемых человеком и искусственным интеллектом. Классификация интеллектуальных систем. Эволюция информационных систем. Предмет и содержание курса. Связь курса с другими дисциплинами. Обзор моделей представления знания и предметной области. Интеллектуальные методы обработки информации. Проблемы управления знаниями предприятия. Обзор основных технологий реализации интеллектуальных методов в прикладных информационных системах искусственного интеллекта.
  • Основные задачи, модели и методы разведочного анализа
    Основные аналитические модели. Скалярные и многомерные модели. Статические и динамические модели. Детерминированные, стохастические и хаотические модели. Линейные и нелинейные модели. Методы обучения интеллектуальных систем: обучение с учителем, обучение с подкреплением, самоорганизация. Режимы обучения: пакетный, интерактивный и смешанный.
  • Программные средства разведочного анализа
    Программные средства, реализующие интеллектуальные методы обработки. Сравнительный анализ программных продуктов, на примере продуктов: Microsoft Excel, IBM SPSS, Mathworks Matlab. Визуализация и подготовка графических материалов для отчётов.
  • Использование нечётких множеств и отношений для представления знаний в интеллектуальных системах
    Понятие чётких и нечётких объектов: множеств, чисел и отношений. Нечёткие множества. Функции принадлежности. Операции над нечёткими множествами. Нечёткие числа, операции над нечёткими числами. Операции фуззификации и деффузификации. Нечёткие отношения. Правила нечеткого вывода. Системы нечёткого вывода, на основе алгоритма Мамдами. Системы нечёткого вывода на основе алгоритма Сугено. Практический синтез простых систем нечёткого вывода на основе алгоритмов Мамдами и Сугено.
  • Визуальный анализ данных
    Визуализация результатов статистической обработки. Визуализация временных рядов. Интерполяционные техники. Визуализация финансовых рядов. Графики типа «японские свечи» и OHLC. Визуализация многомерных данных. Основные ошибки визуализации.
  • Деревья классификации и регрессии
    Деревья принятия решений: деревья классификации и деревья регрессии. Меры неопределенности: энтропия, индекс Джини, вероятность ошибочной классификации. Алгоритмы построения деревьев решения: ID3/C4.5, CART. Особенности построения деревьев регрессии. Жадные алгоритмы. Технологии улучшения деревьев методом обрезки. Кросс-валидация применительно к деревьям решений. Практические реализации методов построения дерева классификация с использованием программных средств.
  • Основы кластерного анализа
    Количественные меры расстояний между объектами в признаковом пространстве. Кластеризация методом ближайшего соседа. Иерархическая кластеризация. Анализ алгоритма кластеризации методом K-средних. Модификации алгоритма. Предварительный выбор центров кластеров. Алгоритм K-медиан. Оценка качества классификатора. Силуэты. Семантические и информационные критерии выбора количества кластеров.
  • Интеллектуальные методы на основе искусственных нейронных сетей
    Искусственная нейронная сеть, как аналог биологической структуры. Модель нейрона МакКалока-Питтса. Структурные элементы нейронной сети. Модель персептрона Розенблатта. Модель многослойного персептрона. Модель нейронной сети на основе радиально-базисных функций. Обучение с подкреплением. Самообучающиеся сети. Модель самоорганизующихся карт Кохонена. Обучение нейронной сети. Обучение с учителем и самообучение. Процедура обратного распространения ошибки. Методы обучения первого порядка: градиентный спуск и его модификации. Методы обучения второго порядка. Практическое применение нейронных сетей для решения задач аппроксимации и классификации.
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа №1
  • неблокирующий Контрольная работа №2
  • неблокирующий Реферат
  • неблокирующий Экзамен
  • неблокирующий Аудиторная работа
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.2 * Аудиторная работа + 0.25 * Контрольная работа №1 + 0.25 * Контрольная работа №2 + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • - Ростовцев В.С. — Искусственные нейронные сети: учебник - Издательство "Лань" - 2019 - ISBN: 978-5-8114-3768-9 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/122180

Рекомендуемая дополнительная литература

  • Калинина, В.Н. Анализ данных. Компьютерный практикум. : учебное пособие / Калинина В.Н., Соловьев В.И. — Москва : КноРус, 2017. — 166 с. — (для бакалавров). — ISBN 978-5-406-04895-5. — URL: https://book.ru/book/929386 (дата обращения: 10.10.2019). — Текст : электронный.
  • Миркин Б. Г.-ВВЕДЕНИЕ В АНАЛИЗ ДАННЫХ. Учебник и практикум-М.:Издательство Юрайт,2019-174-Авторский учебник-978-5-9916-5009-0: -Текст электронный // ЭБС Юрайт - https://biblio-online.ru/book/vvedenie-v-analiz-dannyh-432851
  • Соловьев, В.И. Анализ данных в экономике: Теория вероятностей, прикладная статистика, обработка и анализ данных в Microsoft Excel. : учебник / Соловьев В.И. — Москва : КноРус, 2019. — 497 с. — (бакалавриат). — ISBN 978-5-406-06940-0. — URL: https://book.ru/book/930826 (дата обращения: 10.10.2019). — Текст : электронный.