• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Прикладные методы анализа данных при создании информационно-аналитических систем

2023/2024
Учебный год
RUS
Обучение ведется на русском языке
6
Кредиты
Статус:
Курс по выбору
Когда читается:
2-й курс, 1, 2 модуль

Преподаватели


Жукова Людмила Вячеславовна

Программа дисциплины

Аннотация

Основная цель курса «Прикладные методы анализа данных при создании информационно-аналитических систем» - формирование у слушателей системного взгляда на возможности и ограничения математического аппарата - машинного обучения, эконометрических и статистических методов, изучение опыта использования алгоритмов анализа данных для разработки и реализации ИАС в различных экономических сферах. Курс состоит из двух частей. Первая, теоретическая часть, посвящена изучению постановки и решения задач методами анализа данных, обычно представляемых в научной литературе под общим названием «Data Mining»: методы многомерной статистики и кластерного анализа, нейросетевые методы, методы нечеткой логики, генетические алгоритмы, деревья решений, экспертные системы. Во второй, практической части, изучаются особенности, этапы и технологии применения этих методов при создании информационно-аналитических систем, в том числе на языке проuраммирования Python.
Цель освоения дисциплины

Цель освоения дисциплины

  • Основными целями и результатами освоения дисциплины «Прикладные методы анализа данных при создании информационно-аналитических систем» являются: • Развитие и закрепление практических навыков в построении аналитических и информационных систем управления, включающих интеллектуальную обработку данных. • Систематизация знаний студентов о применении различных изученных статистических, математических методов анализа данных по изученным дисциплинам в рамках направления подготовки магистра 09.04.01 «Информатика и вычислительная техника» по образовательной программе «Компьютерные системы и сети»,в Департаменте компьютерной инженерии МИЭМ им. А.Н.Тихонова НИУ ВШЭ. • Приобретение студентами навыка разработки, построения и сопровождения корпоративных обучаемых экспертных систем, используемых для поддержки принятия решений.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает специфику зависимой переменной в модели бинарной логистической регрессии
  • Знает основные особенности и ограничения в использовании статистики выборочных обследований
  • Использует байесовские подходы к анализу данных. Применяет алгоритм Random Forest.
  • Знание основных методов предобработки данных
  • Знает основные типы данных, этапы предобработки данных, методы разведочного анализа данных
  • Владеет методами анализа: линейная регрессия, регрессионные деревья, случайный лес
  • Знает основные виды искусственных нейронных сетей, способы их обучения.
  • Анализирует статистические методы и модели, применение линейной и логистической регрессионных моделей, кластерного и факторного анализа, методов дерева решений для решения экономических задач и поддержки принятия решений.
  • Понимать принципы визуализация данных и построения эффективных панелей индикаторов
  • Изучить метод Монте-Карло, его достоинства и недостатки.
  • Владеет понятием логистической регрессии. Знает метод опорных векторов (SVM). Владеет понятием трюка с ядрами. Знает метод ближайших соседей. Владеет понятием классификационных деревьев.
  • Сравнивать задачи классификации и задачи регрессии. Иллюстрировать задачи классификации (бинарной и множественной). Сравнивать наиболее известные классификаторы (логистическая регрессия, деревья решений, случайный лес, метод опорных векторов).
  • Понятия интеллектуального анализа данных, обзор задач интеллектуального анализа; упрощенный алгоритм Байеса, деревья решений, алгоритмы кластеризации.
  • Корректно применяет ансамбли моделей Random Forest и Gradient Boosting в машинном обучении
  • Умеет строить модель логистической регрессии и проводить ее диагностику
  • Выполняет предобработку данных. Строит регрессионные и тематические модели. Объясняет основные понятия машинного обучения.
  • Интерпретировать коэффициенты логистической регрессии и предельные эффекты
  • Знать и уметь применять Метод Монте-Карло
  • Уметь специфицировать и оценить модель логистической регрессии.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Особенности применения статистических и математических методов моделирования аналитических ИС
  • Построение математических моделей и проверка адекватности результатов моделирования при разработке ИАС
  • Основы использования ML при построении автоматизированных ИС для решения прикладных задач с помощью методов машинного обучения
  • Метод Монте-Карло, прогнозирование и экспорт результатов в ИАС
Элементы контроля

Элементы контроля

  • неблокирующий Активность на семинаре
    Преподаватель оценивает участие студентов на практических занятиях: активность студентов на практических занятиях в дискуссиях и обсуждениях, полноту раскрытия выбранных тем при выступлении с докладами по итогам индивидуальных письменных исследовательских работ, оформление индивидуальных письменных исследовательских работы и презентаций. На семинарских занятиях предусмотрено онлайн тестирование по пройденному материалу, на 10-15 минут.
  • неблокирующий Самостоятельная исследовательская работа
    Индивидуальная письменная исследовательская работа и Доклад по ее результатам с презентацией. Подготовка индивидуальных письменных исследовательских работ (отчетов), посвященных решению практической задачи аналитической обработки данных, которые сдаются студентом в итоговом виде в конце модуля, по одной работе на каждый модуль.
  • неблокирующий Экзамен
    Экзамен в конце второго модуля проходит в письменной форме. Студент решает теоретические и практические задачи в течение 1 ч 20 минут, оценка выставляется по 10-балльной шкале.
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 2 модуль
    0.3 * Активность на семинаре + 0.3 * Самостоятельная исследовательская работа + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Derivatives analytics with Python : data analysis, models, simulation, calibration and hedging, Hilpisch, Y. J., 2015
  • Machine Learning in R: Random Forest for Cybersport and iGaming. (2019). https://doi.org/10.5281/zenodo.2572680
  • Richert, W., & Coelho, L. P. (2013). Building Machine Learning Systems with Python. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=619996
  • Ахмад Имран - 40 алгоритмов, которые должен знать каждый программист на Python. — (Серия «Библиотека программиста») - 978-5-4461-1908-0 - Санкт-Петербург: Питер - 2023 - 390129 - https://ibooks.ru/bookshelf/390129/reading - iBOOKS
  • Барский, А. Б. Введение в нейронные сети : учебное пособие / А. Б. Барский. — 2-е изд. — Москва : ИНТУИТ, 2016. — 358 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100684 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Боев, В. Д.  Имитационное моделирование систем : учебное пособие для вузов / В. Д. Боев. — Москва : Издательство Юрайт, 2023. — 253 с. — (Высшее образование). — ISBN 978-5-534-04734-9. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/514932 (дата обращения: 28.08.2023).
  • Бутусов Олег Борисович, Butusov Oleg Borisovich, Джулай Анна Алексеевна, & Dzhulai Anna Alekseevna. (2018). Применение методов визуального моделирования и программирования в образовательном процессе по дисциплине «Нейронные сети». Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E28243B
  • Вьюненко, Л. Ф.  Имитационное моделирование : учебник и практикум для вузов / Л. Ф. Вьюненко, М. В. Михайлов, Т. Н. Первозванская ; под редакцией Л. Ф. Вьюненко. — Москва : Издательство Юрайт, 2022. — 283 с. — (Высшее образование). — ISBN 978-5-534-01098-5. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/489074 (дата обращения: 28.08.2023).
  • Демидова, О. А.  Эконометрика : учебник и практикум для вузов / О. А. Демидова, Д. И. Малахов. — Москва : Издательство Юрайт, 2023. — 334 с. — (Высшее образование). — ISBN 978-5-534-00625-4. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/511223 (дата обращения: 28.08.2023).
  • Имитационное моделирование : учебное пособие, Строгалев, В. П., 2015
  • Искусственные нейронные сети : теория и практика, Круглов, В. В., 2002
  • Коэльо, Л. П. Построение систем машинного обучения на языке Python / Л. П. Коэльо, В. Ричарт , перевод с английского А. А. Слинкин. — 2-е изд. — Москва : ДМК Пресс, 2016. — 302 с. — ISBN 978-5-97060-330-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/82818 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Методы машинного обучения в Data Mining пакета STATISTICA : учебное пособие для вузов, Халафян, А. А., 2022
  • Наглядность, визуалистика, инфографика системного анализа - Войтов А.Г. - Дашков и К - 2022 - https://znanium.com/catalog/product/1926412 - 1230401 - ZNANIUM
  • Нейронные сети для обработки информации, Осовский, С., 2004
  • Нейронные сети. Полный курс : пер. с англ., Хайкин, С., 2018
  • Основы машинного обучения - Лимановская О.В., Алферьева Т.И. - ФЛИНТА - 2022 - https://znanium.com/catalog/product/1891377 - 957065 - ZNANIUM
  • Практикум по эконометрике : учеб. пособие, Демидова, О. А., 2010
  • Практическая бизнес - статистика, Сигел, Э. Ф., 2004
  • Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка , перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Ростовцев, В. С. Искусственные нейронные сети / В. С. Ростовцев. — 3-е изд., стер. — Санкт-Петербург : Лань, 2023. — 216 с. — ISBN 978-5-507-46446-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/310184 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Соробин, А. Б. Сверточные нейронные сети: примеры реализаций : учебно-методическое пособие / А. Б. Соробин. — Москва : РТУ МИРЭА, 2020. — 159 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/163853 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Эконометрика. Начальный курс, учебник, 8-е изд., 504 с., Магнус, Я. Р., Катышев, П. К., Пересецкий, А. А., 2007

Рекомендуемая дополнительная литература

  • Имитационное моделирование : теория и технологии, Рыжиков, Ю. И., 2004