• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2021/2022

Научно-исследовательский семинар

Статус: Курс обязательный (Журналистика данных)
Направление: 42.04.02. Журналистика
Кто читает: Институт медиа
Когда читается: 2-й курс, 1-3 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Преподаватели: Бобринская Мария Алексеевна, Нестеренко Любовь Владимировна, Прохоров Артем Вячеславович
Прогр. обучения: Журналистика данных
Язык: русский
Кредиты: 12
Контактные часы: 120

Программа дисциплины

Аннотация

Научно-исследовательский семинар изучает научные методы работы в сфере журналистики данных, подробно останавливаясь на изучении и использовании пространственных данных, сетевом анализе, компьютерной лингвистике, а также научных методах исследования, академическом письме и мастерстве представления академического исследования, практики прикладного использования его результатов.
Цель освоения дисциплины

Цель освоения дисциплины

  • Обучение студентов с теоретическими основами цифрового картографирования и практическими навыками работы с пространственными данными,использования геоинформационных систем, визуализации и картографического дизайна
  • Рассмотрение методов компьютерной лингвистики, применяемых при обработке текстов в предметно-ориентированных информационных системах.
  • Изучаются виды используемых лингвистических ресурсов и методы их разработки.
  • Рассматриваются задачи автоматического аннотирования тестов, рубрикации и кластеризации текстов, извлечения информации из текстов.
  • Дать студентам базовые знания об источниках, методах сбора и нормализации пространственных данных.
  • Познакомить студентов с вариантами визуализации географической информации в статическом и интерактивном форматах.
  • Научить студентов практическим навыкам первичного ГИС-анализа и интерпретации результатов.
  • Научить студентов создавать собственные картографические произведения в веб.
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеет методами представления результатов проекта в области сетевого анализа
  • Владеет навыками моделирования случайных графов для тестирования статистических гипотез на структурных данных
  • Умеет находить структурно схожие элементы и меры схожести в структурной информации
  • Умеет обнаруживать сообщества в сетях, владеет методами кластеризации на графах
  • Визуализирует атрибутивную информацию пространственных данных
  • Владеет методами машинного обучения для структурной модели графа
  • Владеет методами машинного обучения для структурной модели графа с учетом текстовых эмбеддингов
  • Владеет навыками логико-лингвистического моделирования предметной области с использованием стандартов и инструментальных средств, поддерживающих разработку лингвистического обеспечения информационной системы для конкретной предметной области
  • Владеет навыками оценки качества систем автоматической обработки текста
  • Владеет навыками текстового анализа при помощи инструментов и библиотек Python
  • Владеет терминологией в области картографии и ГИС
  • Выбирает виды и источники данных в зависимости от задач
  • Выбирает нужные параметры проекций и систем координат
  • Делит большие задачи на мелкие подзадачи
  • Демонстрирует общие знания об области применения анализа социальный сетей и программных средствам для работы с графами
  • Знает инструменты и библиотеки Python для компьютерной лингвистики
  • Знает модели распространения влияния. Умеет прогнозировать достижение равновесия в сетевой модели на основе Марковских процессов в сетях
  • Знает основные подходы к решению задач компьютерной лингвистики
  • Знает основные приложения автоматической обработки текстов, используемые в пред-метно-ориентированных информационных системах
  • Знает понятие центральности как меры ранжирования вершин в графе на основе структурной информации
  • Знает понятия центральности и престижа как мер ранжирования вершин, взаимовлияние в ориентированных сетях
  • Знает статистические особенности реальных сетей, основные отличия реальных сетей от модельных данных
  • Извлекает сущности из текста
  • Использует инструменты пространственного анализа
  • Ориентируется в задачах автоматической обработки текста
  • Оценивает работу систем автоматической обработки текста
  • Применяет специализированные библиотеки Python для задач автоматической обработки текста
  • Решает задачи предобработки текста с использованием приёмом программирования на Python
  • Создает законченный проект на основе пространственных данных
  • Создает слои данных, оценивает качество данных, работает с проектами
  • Умеет использовать информационные каскады как модель сетевого маркетинга и оценивать успешность сетевого маркетинга
  • Умеет моделировать распространение информации. Понимает сущность понятия эпидемии в информационном поле
  • Умеет строить модель классификации элементов сети, выявлять агентов влияния, осуществлять количественные предсказания на основе временных динамических графов
  • Умеет строить рекомендации связей между элементами сети, владеет методами детектирования фрода в сетях
  • знать основы картографии и геоинформатики
  • применять инструменты визуализации пространственных данных
  • производить сбор и обработку пространственных данных и интегрировать собранную информацию в единую карту
  • получить навыки оформления и дизайна графического материала
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Начало работы с общедоступными платформами ГИС. Ресурсы
  • Математические основы картографии
  • Виды пространственных данных
  • Работа с данными в ГИС, создание слоев и проектов
  • Аналитические инструменты работы с данными
  • Визуализация данных, дизайн карт
  • Практическая работа: ГИС проект
  • Введение в сетевой анализ
  • Описательные статистики реальных сетей
  • Модели формирования сети
  • Меры влияния агентов в неориентированных сетях
  • Меры влияния агентов в ориентированных сетях
  • Структурная эквивалентность
  • Сообщества в социальных сетях
  • Распространение и эпидемии в сетях
  • Распространение инноваций и информационные каскады
  • Распространение влияния и консенсус в социальных сетях
  • Векторные модели сетей без атрибутов
  • Векторные модели сетей с текстовыми атрибутами
  • Предсказание связей и рекомендации в сетях
  • Классификация сетевых данных и графовые нейронные сети
  • Знакомство с компьютерной линвгистикой
  • Регулярные выражения, tokenization etc.
  • Частотные списки, мера TF-IDF. Извлечение ключевых слов, алгоритм RAKE
  • Векторизация текстов, векторная семантика. Bag of Words, word2vec, ресурс RusVectores.
  • Автоматическая классификация документов
  • Text Mining
  • Сетевой анализ
Элементы контроля

Элементы контроля

  • неблокирующий Посещаемость 1 модуля
  • неблокирующий Выполнение заданий на семинарах 1 модуля
  • неблокирующий Финальный проект по итогам 1 модуля
  • неблокирующий Активность на занятиях и выполнение домашних заданий 3 модуля
  • неблокирующий Финальный проект 3 модуля
  • неблокирующий Посещение занятий и выполнение заданий 2 модуля
    Основной формой работы на семинарах является программирование в IPython Notebook. Формы работы и критерии оценивания на каждом конкретном семинаре преподаватель озвучивает студентам.
  • неблокирующий Проект 1
  • неблокирующий Проект 2
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 2 модуль
    0.1 * Активность на занятиях и выполнение домашних заданий 3 модуля + 0.2 * Выполнение заданий на семинарах 1 модуля + 0.05 * Посещаемость 1 модуля + 0.25 * Финальный проект по итогам 1 модуля + 0.25 * Посещение занятий и выполнение заданий 2 модуля + 0.15 * Финальный проект 3 модуля
  • 2021/2022 учебный год 3 модуль
    0.7 * 2021/2022 учебный год 2 модуль + 0.21 * Посещаемость 1 модуля + 0.09 * Выполнение заданий на семинарах 1 модуля
Список литературы

Список литературы

Рекомендуемая основная литература

  • Easley, D., & Kleinberg, J. (2010). Networks, Crowds, and Markets : Reasoning About a Highly Connected World. New York: Cambridge eText. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=324125
  • Витковский, В. В. Картография (теория картографических проекций) / В. В. Витковский. — Санкт-Петербург : Издательство "Лань", 2013. — 473 с. — ISBN 978-5-507-31477-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/32797 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Инновационное развитие: экономика, интеллектуальные ресурсы, управление знаниями : монография / под ред. Б.З. Мильнера. — М. : ИНФРАМ, 2018. — 624 с. — (Научная мысль). - Режим доступа: http://znanium.com/catalog/product/975926
  • Картография и ГИС : учеб. пособие / В.П. Раклов. — 3-е изд., стереотип. — М. : ИНФРА-М, 2019. — 215 с. — (Высшее образование: Бакалавриат). - Режим доступа: http://znanium.com/catalog/product/1022695
  • Основы алгоритмизации и программирования на Python : учеб. пособие / С.Р. Гуриков. — М. : ФОРУМ : ИНФРА-М, 2019. — 343 с. — (Среднее профессиональное образование). - Режим доступа: http://znanium.com/catalog/product/970143

Рекомендуемая дополнительная литература

  • Anthony G. Cohn, & David M. Mark. (2005). Spatial Information Theory : International Conference, COSIT 2005, Elliottville, NY, USA, September 14-18, 2005: Proceedings. Springer.
  • Newman, M. E. J. (2010). Networks : An Introduction. Oxford: OUP Oxford. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=458550
  • Understanding Geo-spatial Information on Social Media. (2016). https://doi.org/10.4233/uuid:06c072ad-4db6-4d3b-b747-784e30d862a4
  • Yanqing Xu, & Eugene Kennedy. (2015). An Introduction to Spatial Analysis in Social Science Research. Tutorials in Quantitative Methods for Psychology, (1), 22. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsdoj&AN=edsdoj.571b8abf375d4e059682324f8fae0c6d
  • Информатика и лингвистика : учеб. пособие / Т.М. Волосатова, Н.В. Чичварин. — Москва : ИНФРА-М, 2018. — 196 с. + Доп. материалы [Электронный ресурс; Режим доступа: https://new.znanium.com]. — (Высшее образование: Бакалавриат). — www.dx.doi.org/10.12737/16175. - Текст : электронный. - URL: http://znanium.com/catalog/product/938009
  • Языкознание: От Аристотеля до компьютерной лингвистики: Научно-популярное / Алпатов В. - М.:Альпина нон-фикшн, 2018. - 253 с.: 60x90 1/16. - (Научно-популярная литература) (Переплёт) ISBN 978-5-91671-804-1 - Режим доступа: http://znanium.com/catalog/product/1003471