• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Анализ сложноструктурированных данных, сетей и текстов

2023/2024
Учебный год
RUS
Обучение ведется на русском языке
6
Кредиты
Статус:
Курс по выбору
Когда читается:
2-й курс, 1, 2 модуль

Преподаватель

Программа дисциплины

Аннотация

Курс по анализу сложноструктурированных данных, сетей и текстов создан с целью ознакомления студентов с методологией, методами и программным инструментарием, сформированным в вычислительных социальных науках для анализа сетевых и текстовых данных, по своей природе являющихся данными с комплексной (сложной) структурой. В курсе будут разобраны методы сбора, предобработки, анализа и визуализации сложноструктурированных данных, с акцентом на сетевом анализе текстовой информации. В первом модуле после введения в анализ неструктурированных данных слушатели познакомятся с инструментами для предобработки текста, рассмотрят особенности выявления скрытых тем, кластеризации и классификации текстов, а также рассмотрят вопросы извлечения именованных сущностей и отношений между ними, составляющих основу сетевой структуры. Во втором модуле слушатели познакомятся с базовыми понятиями анализа социальных сетей и основными метриками, применяемыми в сетевом анализе для изучения социальных структур на глобальном и локальном уровнях для выделения важных узлов, диад, триад и сплоченных подгрупп в сети. Слушатели научатся основам построения сетевых данных и их последующей обработки в программах для анализа и визуализации сетевых данных. После прохождения курса у студентов будут развиты навыки работы со сложноструктурированными данными, достаточные для проведения самостоятельного анализа текстовых данных, в т.ч. с применением методологии сетевого анализа. Слушатели будут иметь возможность применить полученные навыки для сетевого анализа сложноструктурированных текстовых данных. Для работы применяется языки программирования Python и R и программы для анализа и визуализации сетей Pajek и Gephi.
Цель освоения дисциплины

Цель освоения дисциплины

  • Цель курса по анализу сложноструктурированных данных, сетей и текстов - ознакомление студентов с методологией, методами и программным инструментарием, сформированным в вычислительных социальных науках для анализа сетевых и текстовых данных, по своей природе являющихся данными с комплексной (сложной) структурой. В результате освоения дисциплины у студентов будут развиты навыки работы со сложноструктурированными данными, достаточные для проведения самостоятельного анализа текстовых данных, в т.ч. с применением методологии сетевого анализа. Слушатели будут знакомы с основными методами сбора, предобработки, анализа и визуализации сложноструктурированных данных, с акцентом на сетевом анализе текстовой информации. Слушатели будут иметь возможность применить полученные навыки на практике для сетевого анализа сложноструктурированных текстовых данных. В качестве консультантов студентам будут предложены консультанты из числа сотрудников МЛ ПСА, которые смогут дать рекомендации о применимости сетевого и иных видов анализа в различных исследовательских проектах. Для работы применяется языки программирования Python и R и программы для анализа и визуализации сетей Pajek и Gephi. Предполагается, что студенты имеют начальный уровень знаний программного обеспечения Python и R.
Планируемые результаты обучения

Планируемые результаты обучения

  • Уметь интерпретировать результаты анализа данных в SPSS с учетом ограничений и возможностей используемого инструментария;
  • - знать и уметь использовать возможности персонологического изучения личности, заключенные в классических аналитических теориях; - знать специфику и уметь применять техники глубинного анализа личности; - иметь навыки экзистенциально-психологического анализа личности; - иметь навык аналитической интерпретации индивидуальных жизненных случаев; - умение строить и применять персонологические модели консультирования и исследования, основанные на синтезе аналитических практик персонологии
  • - Man kann über seinen Tagesablauf, seine Begegnungen sprechen - kann über seinen Arbeitsplatz, seinen Arbeitstag, über die Arbeit am Computer sprechen - kann an einem Dialog über ein Geschäftstreffen teilnehmen - kann einen Brief schreiben, einen Termin vereinbaren - man kann Substantive, possessive Pronomina , Personalpronomina, Adjektive deklinieren
  • - to perceive and process, in accordance with the goal, various information in a foreign language obtained from print, audiovisual and electronic sources of information within the framework of professional, socio-political and socio-cultural spheres of communication;
  • - understand the emotionally rich information in direct communication with a native speaker; - Understand public speaking, including through technical means; - extract implicit information from an oral message of a monological or dialogical nature;
  • - use etiquette of written language correctly; - increase the level of educational autonomy; - independently set the goals of educational activities aimed at continuous self-education, look for effective strategies for achieving goals;
  • - Ability to determine cultural influences in SEA.
  • - use multiples to value equity;
  • - Особенности построения и работы функциональных схем счетных триггеров. Построение функциональных схем и принцип работы триггеров T-типа, D-типа. Построение универсального JK-триггера на основе RS-триггера с устранением состояния неопределенности.
  • - Построение суммирующего двоичного счетчика методом синтеза. Варианты графического изображения функциональных схем счетчиков (вертикальное и горизонтальное). Схемы делителя частоты импульсной последовательности на основе двоичных счетчиков (назначение, принцип построения и работа делителей с различными коэффициентами деления).
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в сетевой анализ
  • Данные для сетевого анализа
  • Программы для анализа и визуализации социальных сетей
  • Глобальные сетевые характеристики (дескриптивный анализ)
  • Локальные сетевые характеристики: диады и триады в сети
  • Локальные сетевые характеристики: сплоченные подгруппы в сети
  • Продвинутая визуализация сетевых данных
  • Презентации проектов студентов
  • Введение в анализ неструктурированных данных, обсуждение структуры курса и правил его прохождения
Элементы контроля

Элементы контроля

  • блокирующий Активность на занятиях
  • блокирующий Квиз
  • блокирующий Проект
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 2 модуль
    Не подразумевает оценку
Список литературы

Список литературы

Рекомендуемая основная литература

  • Carrington, P. J., Scott, J., & Wasserman, S. (2005). Models and Methods in Social Network Analysis. Cambridge: Cambridge University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=132264
  • Kolaczyk, E. D., & Csárdi, G. (2014). Statistical Analysis of Network Data with R. New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=783200
  • Luke, D. A. . V. (DE-588)130032344, (DE-627)488060184, (DE-576)297960504, aut. (2015). A user’s guide to network analysis in R Douglas A. Luke. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edswao&AN=edswao.454121474
  • Nooy, W. de, Mrvar, A., & Batagelj, V. (2005). Exploratory Social Network Analysis with Pajek. New York: Cambridge University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=138973

Рекомендуемая дополнительная литература

  • Nooy, W. de, Batagelj, V., & Mrvar, A. (2011). Exploratory Social Network Analysis with Pajek: Vol. Rev. and expanded 2nd ed. Cambridge University Press.