• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2021/2022

Классификация статистических данных

Статус: Майнор
Когда читается: 3, 4 модуль
Охват аудитории: для всех кампусов НИУ ВШЭ
Язык: русский
Кредиты: 5
Контактные часы: 76

Программа дисциплины

Аннотация

Окружающие нас объекты и явления (например, финансовая деятельность банков или предприятий, доходы респондентов, решения о покупке товаров и т.п.) характеризуются разнообразными признаками и могут быть представлены как точки в многомерном пространстве. В этом пространстве они могут образовывать скопления (группы, кластеры), которые можно изучать в отдельности, выделив специфические свойства и особенности каждой группы. Вы познакомитесь с современными методами классификации, позволяющими выделять однородные группы объектов, среди которых иерархические и итерационные алгоритмы кластерного анализа, параметрическая и непараметрическая классификация, вероятностные методы классификации, деревья решений, рекомендательные системы и нейросети, а также основы фильтрации изображений. Важной особенностью курса является широкое использование наглядных примеров и применение широкого арсенала современных средств обработки статистической информации (например, ППП SPSS, R, Python), освобождающих исследователя от вычислительной рутины и позволяющих превратить статистическое исследование в увлекательное занятие.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины Сравнительный анализ и классификация данных» является получение студентами основ понимания фундаментальных статистических принципов, роли многомерного статистического инструментария в фундаментальных и прикладных исследованиях. Особенностью курса является наличие большого числа примеров из реальной практики, наглядно демонстрирующих разнообразие областей применения многомерного статистического инструментария, его значимости для различных сфер деятельности. При этом обучение студентов основным графическим и табличным представлениям данных, основам их статистической обработки позволяет сделать результаты расчетов более наглядными и доступными для понимания и интерпретации. Знакомство с возможностями сбора и обработки данных будет опираться как на универсальные информационные технологии, так и на специализированные пакеты прикладных программ (ППП SPSS) и статистические среды (Python, R), а также сопровождаться большим количеством практических примеров и иллюстраций. За счет широкого применения компьютерных технологий в курсе значительное внимание уделяется интерпретации данных и статистических характеристик, получаемых по результатам расчетов.
Планируемые результаты обучения

Планируемые результаты обучения

  • Использует дскриминантный анализ для кластеризации новых объектов. Строит дискриминантные функции, интерпретирует межгрупповые различия. Выбирает показатели, обладающие наибольшей дискриминирующей силой
  • Использует итерационные алгоритмы для решения задач кластеризации объектов
  • Проводит класстеризацию многомерных наблюдений с использованием иерархических и итеративных алгоритмов кластерного анализа. Строит и интерпретирует дендрограммы.
  • Проводит кластеризацию объектов с использованием деревьев решений.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Кластеризация многомерных наблюдений. Кластерный анализ
  • Кластеризация многомерных наблюдений с обучением. Основы дискриминантного анализа
  • Деревья решений, случайные леса, нейросети
  • Предмет, содержание, задачи курса. Предварительный и корреляционного анализа
  • Деревья решений, случайные леса
Элементы контроля

Элементы контроля

  • неблокирующий модульная работа 1
    Желаем удачи!
  • неблокирующий модульная работа 2
    Желаем Вам удачи!
  • неблокирующий активность на занятиях
  • неблокирующий контрольная работа
    Контрольная работа проводится офлайн. Задачи, требующие численного ответа, следует решать ручным счетом. В работе будет достаточно представления схематичного расчета с указанием промежуточного результата. Наличие промежуточных ответов обязательно! Контрольные работы в отсканированном виде (или сфотографированном) в формате PDF должны быть размещены в GC не позднее указанного времени. Все работы, отправленные позже указанного времени, приниматься и засчитываться НЕ БУДУТ! Желаем Вам удачи!
  • неблокирующий компьютерная работа 1
    Оценка за курс выставляется на основе линейной формулы оценивания пропорционально объему выполнения заданий текущего контроля. Экзамен по курсу не предусмотрен.
  • неблокирующий Компьютерная работа 2
    Компьютерная работа присылается преподавателю офлайн. Оценивается пропорционально выполненному заданию.Желаем Вам удачи!
  • неблокирующий Компьютерная работа 3
    Компьютерная работа присылается преподавателю офлайн. Оценивается пропорционально выполненному заданию. Желаем Вам удачи!
  • неблокирующий Компьютерная работа 4
    Компьютерная работа присылается преподавателю офлайн. Оценивается пропорционально выполненному заданию.Желаем Вам удачи!
  • неблокирующий контрольная работа
    Контрольная работа №2 проводится офлайн. Задачи, требующие численного ответа, следует решать ручным счетом. В работе будет достаточно представления схематичного расчета с указанием промежуточного результата. Наличие промежуточных ответов обязательно! Контрольные работы в отсканированном виде (или сфотографированном) в формате PDF должны быть размещены в GC не позднее указанного времени. Все работы, отправленные позже указанного времени, приниматься и засчитываться НЕ БУДУТ! Желаем Вам удачи!
  • неблокирующий компьютерная работа 1
    Оценка за курс выставляется на основе линейной формулы оценивания пропорционально объему выполнения заданий текущего контроля. Экзамен по курсу не предусмотрен.
  • неблокирующий Компьютерная работа 2
    Компьютерная работа присылается преподавателю офлайн. Оценивается пропорционально выполненному заданию.Желаем Вам удачи!
  • неблокирующий Компьютерная работа 3
    Компьютерная работа присылается преподавателю офлайн. Оценивается пропорционально выполненному заданию. Желаем Вам удачи!
  • неблокирующий Компьютерная работа 4
    Компьютерная работа присылается преподавателю офлайн. Оценивается пропорционально выполненному заданию.Желаем Вам удачи!
  • неблокирующий контрольная работа
    Контрольная работа №2 проводится офлайн. Задачи, требующие численного ответа, следует решать ручным счетом. В работе будет достаточно представления схематичного расчета с указанием промежуточного результата. Наличие промежуточных ответов обязательно! Контрольные работы в отсканированном виде (или сфотографированном) в формате PDF должны быть размещены в GC не позднее указанного времени. Все работы, отправленные позже указанного времени, приниматься и засчитываться НЕ БУДУТ! Желаем Вам удачи!
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 4 модуль
    0.2 * компьютерная работа 1 + 0.2 * Компьютерная работа 2 + 0.2 * контрольная работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • Meyers, L. S. (2013). Performing Data Analysis Using IBM SPSS. Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=610849
  • Груздев, А. В. Прогнозное моделирование в IBM SPSS Statistics, R и Python: метод деревьев решений и случайный лес : руководство / А. В. Груздев. — Москва : ДМК Пресс, 2018. — 642 с. — ISBN 978-5-97060-539-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/123700 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Прикладная статистика. Основы эконометрики. Т.1: Теория вероятностей и прикладная статистика, Айвазян, С. А., 2001
  • Язык программирования Python: практикум : учебное пособие / Р.А. Жуков. — Москва : ИНФРА-М, 2020. — 216 с. + Доп. материалы [Электронный ресурс]. — (Среднее профессиональное образование). - Текст : электронный. - URL: http://znanium.com/catalog/product/1044193

Рекомендуемая дополнительная литература

  • Основы алгоритмизации и программирования на Python : учеб. пособие / С.Р. Гуриков. — М. : ФОРУМ : ИНФРА-М, 2018. — 343 с. — (Среднее профессиональное образование). - Режим доступа: http://znanium.com/catalog/product/961522
  • Язык программирования Python: практикум : учебное пособие / Р.А. Жуков. — Москва : ИНФРА-М, 2020. — 216 с. + Доп. материалы [Электронный ресурс]. — (Высшее образование: Бакалавриат). — www.dx.doi.org/10.12737/textbook_5cb5ca35aaa7f5.89424805. - Режим доступа: http://znanium.com/catalog/product/1045700