• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2019/2020

Введение в вычислительные социальные науки

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус: Маго-лего
Когда читается: 4 модуль
Преподаватели: Смирнов Иван Борисович
Язык: русский
Кредиты: 3
Контактные часы: 40

Программа дисциплины

Аннотация

Социальные науки стремительно компьютеризуются. Данные из социальных сетей и другие цифровые следы позволяют проводить исследования на гораздо больших выборках и с гораздо большей детализацией, чем это возможно с помощью традиционных методов. Новыми становятся не только данные, но и методы их анализа. Так, например, методы машинного обучения все чаще используются в социальных исследованиях. В связи с этим появилось и активно развивается новое направление исследований, получившее название вычислительные социальные науки (computational social science). Цель курса — познакомить слушателей с основными исследованиями в этой области за последние годы и помочь им понять, как они могут использовать новые методы в собственных исследованиях. Так как лучше всего учиться на примере ведущих специалистов, то курс построен вокруг обсуждения статей в области computational social science, опубликованных в лучших зарубежных журналах. Помимо этого курс включает обсуждение этики исследований, а также типичных ошибок и ограничений изучаемых методов. Практические занятия проходят в формате перевернутого класса. Слушателям предоставляются материалы для самостоятельного изучения, а на очных занятиях обсуждаются возникшие проблемы и вопросы. На практических занятиях используется язык программирования Python, однако предварительных знаний они требуют. Тем, кого интересует прежде всего получение технических навыков, этот курс, скорее всего, не подойдет, так он направлен на достижение другой цели.
Цель освоения дисциплины

Цель освоения дисциплины

  • познакомить слушателей с основными исследованиями в области вычислительных социальных наук за последние годы и помочь им понять, как они могут использовать новые методы в собственных исследованиях
Планируемые результаты обучения

Планируемые результаты обучения

  • знать определение социальных вычислительных наук, понимать особенности области и ее место в ряду других научных дисциплин
  • знать основные типы новых данных и их источники, понимать ограничения различных источников данных, уметь подобрать источник данных целесообразный исследовательскому вопросу
  • знать основные возможности методов машинного обучения и искусственого интеллекта и их ограничения, понимать как эти методы могут использоваться в социальных исследованиях
  • знать основные понятия сетевого анализа, знать особенности анализа данных сетевого типа
  • понимает в чем заключается преимущество компьютерного моделирования в социальных науках и в чем основные ограничения, может привести несколько примеров моделей социальных процессов, объяснить, какое новое знание они позволяют получить
  • знает типичные ошибки в количественных методах, умеет критически проинтерпретировать результаты количественных исследований
  • понимают основные этические риски использования цифровых следов, больших данных и методов машинного обучения, могут предложить способы улучшения дизайна исследования для сокращения этических рисков
  • знают основные операции, функции, структуры данных и управляющие конструкции языка программирования Python
  • знают особенности языка разметки html, знают хотя бы одну python, библиотеку для извлечения веб-данных, могут загрузить содержимое конкретной веб-страницы в структуру данных python
  • умеют произвести запрос к API Вконтакте средствами python и сохранить полученную информацию в структуру данных
  • знает основные определения сетевого анализа и основные способы визуалиации сетевых данных, понимает особенности сетевых данных и методов их анализа
  • знает основные методы численного представления текстовых данных (унитарные представления, векторные представления, "мешок слов"), понимает принципы работы word2vec, возможности и ограничения векторных представлений
  • знает основные форматы представления гео-данных и пакеты для их анализа, понимает особенности работы с гео-данными
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в вычислительные социальные науки
  • Новые источники данных в социальных исследованиях
    Большие, быстрые, глубокие и др. данные. Возможности их применения.
  • Методы машинного обучения и искусственный интеллект в социальных исследованиях
  • Введение в сетевой анализ
  • Компьютерное моделирование социальных процессов
  • Типичные ошибки количественных исследований и ограничения новых методов
  • Этика исследований
  • Введение в Python
  • Использование веб-данных (на примере livejournal, ЦИАН и др.)
  • Использование API Вконтакте
  • Работа с сетевыми данными
  • Работа с текстовыми данными
  • Работа с геоданными
Элементы контроля

Элементы контроля

  • неблокирующий Решение практической задачи средствами python
  • неблокирующий Проект исследования
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.7 * Проект исследования + 0.3 * Решение практической задачи средствами python
Список литературы

Список литературы

Рекомендуемая основная литература

  • Benjamin L. Smarr, & Aaron E. Schirmer. (2018). 3.4 million real-world learning management system logins reveal the majority of students experience social jet lag correlated with decreased performance. Scientific Reports, (1), 1. https://doi.org/10.1038/s41598-018-23044-8
  • Blumenstock, J., Cadamuro, G., & On, R. (2015). Predicting poverty and wealth from mobile phone metadata. Science, 350(6264), 1073–1076. https://doi.org/10.1126/science.aac4420
  • Ivan Smirnov, & Stefan Thurner. (2017). Formation of homophily in academic performance: Students change their friends rather than performance. PLoS ONE, (8), e0183473. https://doi.org/10.1371/journal.pone.0183473
  • Ivan Smirnov. (2019). Schools are segregated by educational outcomes in the digital space. PLoS ONE, (5), e0217142. https://doi.org/10.1371/journal.pone.0217142
  • Kosinski, M., Stillwell, D., & Graepel, T. (2013). Private traits and attributes are predictable from digital records of human behavior. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.FABDAC62
  • Kramer, A. D. I., Guillory, J. E., & Hancock, J. T. (2014). Experimental evidence of massive-scale emotional contagion through social networks. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E82A0FBC
  • Lazer, D., Pentland, A., Adamic, L., Aral, S., Barabási, A.-L., Brewer, D., … Van Alstyne, M. (2009). Computational Social Science. Science, 323(5915), 721–723. https://doi.org/10.1126/science.1167742
  • Lee, E., Karimi, F., Wagner, C., Jo, H.-H., Strohmaier, M., & Galesic, M. (2017). Homophily and minority size explain perception biases in social networks. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsarx&AN=edsarx.1710.08601
  • Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392
  • Tatem, A. J., Guerra, C. A., Atkinson, P. M., & Hay, S. I. (2004). Momentous sprint at the 2156 Olympics?: Women sprinters are closing the gap on men and may one day overtake them. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.A729547C

Рекомендуемая дополнительная литература

  • Martin, T., Hofman, J. M., Sharma, A., Anderson, A., & Watts, D. J. (2016). Exploring limits to prediction in complex social systems. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E058D9C4