• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2019/2020

Прикладной сетевой анализ

Статус: Курс по выбору (Коммуникации, основанные на данных)
Направление: 42.04.01. Реклама и связи с общественностью
Когда читается: 2-й курс, 1, 2 модуль
Формат изучения: Blended
Прогр. обучения: Коммуникации, основанные на данных
Язык: русский
Кредиты: 7

Программа дисциплины

Аннотация

Курс знакомит студентов с активно развивающейся междисциплинарной областью исследование структурных данных и закономерностей в них. В рамках курса мы рассмотрим методы статистического и структурного анализа сетей, модели формирования и эволюции сетей и процессов, машинное обучение на графах. Особое внимание будет уделено практическому анализу и визуализации реальных сетей с использованием доступных программных средств, современных языков программирования и библиотек.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Прикладной сетевой анализ» является получение студентами системных представлений об анализе графов и социальных сетей, метода сбора, обработки и моделирование сетевых структур и применении в прикладных областях.
Результаты освоения дисциплины

Результаты освоения дисциплины

  • Демонстрирует общие знания об области применения анализа социальный сетей и программных средствам для работы с графами
  • Знает статистические особенности реальных сетей, основные отличия реальных сетей от модельных данных
  • Владеет навыками моделирования случайных графов для тестирования статистических гипотез на структурных данных
  • Знает понятие центральности как меры ранжирования вершин в графе на основе структурной информации
  • Знает понятия центральности и престижа как мер ранжирования вершин, взаимовлияние в ориентированных сетях
  • Умеет находить структурно схожие элементы и меры схожести в структурной информации
  • Умеет обнаруживать сообщества в сетях, владеет методами кластеризации на графах
  • Умеет моделировать распространение информации. Понимает сущность понятия эпидемии в информационном поле.
  • Умеет использовать информационные каскады как модель сетевого маркетинга и оценивать успешность сетевого маркетинга.
  • Знает модели распространения влияния. Умеет прогнозировать достижение равновесия в сетевой модели на основе Марковских процессов в сетях
  • Владеет методами машинного обучения для структурной модели графа
  • Владеет методами машинного обучения для структурной модели графа с учетом текстовых эмбеддингов
  • Умеет строить рекомендации связей между элементами сети, владеет методами детектирования фрода в сетях
  • Умеет строить модель классификации элементов сети, выявлять агентов влияния, осуществлять количественные предсказания на основе временных динамических графов
  • Владеет методами представления результатов проекта в области сетевого анализа
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Введение в сетевой анализ
    Введение в сетевой анализ. Теория сложных сетей. Основные свойства сети и метрики. Примеры сетей.
  • Тема 2. Описательные статистики реальных сетей
    Степенной закон распределения и реальные сети. Закон Ципфа. Закон шести рукопожатий. Плотностей связей между друзьями.
  • Тема 3. Модели формирования сети
    Модель случайного графа Эрдоша-Рени. Распределения Пуассона и Бернулли. Распределение степеней вершин. Модель Барабаси-Альберта. Модель эволюции графа. Модель “маленького мира” (модель Ваттс-Строгаца). Статистики случайных графов.
  • Тема 4. Меры влияния агентов в неориентированных сетях
    Метрики центральности вершин: степенная, мостовая, по близости, относительно собственных векторов, структурные. Интерпретация центральности как меры влияния. Визуализация ключевых агентов в сети.
  • Тема 5. Меры влияния агентов в ориентированных сетях
    PageRank, стохастическая метрика и условие Перрона-Фробениуса. Итеративные методы. Хабы и источники. Алгоритм HITS.
  • Тема 6. Структурная эквивалентность
    Метрики структурной эквивалентности. Евклидова метрика и расстояние Хэмминга. Коэффициент корреляции. Косинусное сходство. Ассортативное смешивание и гомофилия. Смешивание по факторным и численным атрибутам.
  • Тема 7. Сообщества в социальных сетях
    Сетевые сообщества. Плотность сообществ и метрики разрезов. Алгоритм Ньюмена-Гирвина. Спектральные методы кластеризации. Приближенные и жадные алгоритмы. Иерархическая кластеризация. Локальная кластеризация. Графовые шаблоны, k-core, микро подграфы.
  • Тема 8. Распространение и эпидемии в сетях
    Модели эпидемий: SI, SIS, SIR. Решение дифференциальных уравнений. Предельные случаи. Моделирование распространения инфекции.
  • Тема 9. Распространение инноваций и информационные каскады
    Обучение на основе наблюдений. Информационные каскады. Каскады в сети. Независимая и линейная пороговая модели каскадов. Измерение распространения информации и оценка успешности компании в сетях.
  • Тема 10. Распространение влияния и консенсус в социальных сетях
    Физическая диффузия. Диффузионное уравнение. Распространение в сети и Лапласиан. Решение диффузионного уравнения. Случайные блуждания на графе. Социальная диффузия. Пороговая модель Грановеттера для описания коллективного поведения. Самые влиятельные узлы в сети.
  • Тема 11. Векторные модели сетей без атрибутов
    Графовые эмбеддинги. Модели на основе матричной факторизации, случайных блужданий и автоэнкодеров. Векторизация структурной модели.
  • Тема 12. Векторные модели сетей с текстовыми атрибутами
    Атрибутивные графовые эмбеддинги. Веткорные модели текстов и инициализации моделеи. Фьюжн информации и индуктивные модели обучения.
  • Тема 13. Предсказание связей и рекомендации в сетях
    Рост сети. Диаметр сжатия. Проблема предсказания связей. Обучение с учителем. Рекомендательные системы.
  • Тема 14. Классификация сетевых данных и графовые нейронные сети
    Задача классификации документов, оценка влияния агентов: предсказание свойств вершин. Графовые нейронные сети. Обучение со слабой разметкой или без учителя. Машинное обучение на графах.
  • Тема 15. Защита проектов
    Представление проекта и защита перед жюри с приглашенными экспертами.
Элементы контроля

Элементы контроля

  • неблокирующий О онлайн
    Прогресс по онлайн-курсу оценивается по итогам прохождения онлайн-курса “Applied Social Network Analysis in Python”. До последнего семинара студент направляет преподавателю с корпоративной почты скриншот c фамилией и баллами, подтверждающий прохождение онлайн-курса. Для зачёта онлайн-курса регистрация на онлайн-курс осуществляется с корпоративной почты студента НИУ ВШЭ.
  • неблокирующий О аудит.
  • неблокирующий О проект1 - проект по анализу своей эго-сети Vkontakte.
  • неблокирующий О проект2
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.2 * О аудит. + 0.1 * О онлайн + 0.2 * О проект1 - проект по анализу своей эго-сети Vkontakte. + 0.5 * О проект2
Список литературы

Список литературы

Рекомендуемая основная литература

  • Easley, D., & Kleinberg, J. (2010). Networks, Crowds, and Markets : Reasoning About a Highly Connected World. New York: Cambridge eText. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=324125

Рекомендуемая дополнительная литература

  • Newman, M. E. J. (2010). Networks : An Introduction. Oxford: OUP Oxford. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=458550