• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Анализ мультимедийных данных социальных сетей на получение нарушений законодательства РФ

ФИО студента: Купоросов Геннадий Олегович

Руководитель: Карпов Николай Вячеславович

Кампус/факультет: Факультет информатики, математики и компьютерных наук (Нижний Новгород)

Программа: Компьютерная лингвистика (Магистратура)

Год защиты: 2016

Социальные сети пользуются большой популярностью и содержат большое количество разнообразного контента, что обеспечивает повышение уровня их влияния на социум. К сожалению, часть контента напрямую содержит информационные материалы, нарушающие законодательство Российской Федерации. Ручное выявление контента, содержащего нарушения является неэффективным. Из текущих технических средств для решения данной проблемы можно выделить спам фильтры, однако их реализация не позволяет полностью справиться с ней. Поэтому проблема анализа мультимедийных данных в социальных сетях на наличие нарушений является актуальной и требует новых подходов к её решению. Данная магистерская диссертация посвящена анализу мультимедийных данных социальных сетей на наличие нарушений законов Российской Федерации. Задачами данной работы являются разработка требований, анализ существующих методов и инструментов для создания автоматизированных программных средств, позволяющих решить эту проблему, реализация этой системы и практическое исследование эффективности применённых средств. Для решения проблемы обнаружения нарушений в социальных сетях были рассмотрены такие методы, как поиск ключевых слов, n-грамм и алгоритмы машинного обучения. Среди существующих социальных сетей для реализации программных средств были выбраны VK.com и YouTube. Программы были написаны на языке Python v.3.5 на платформе Ubuntu 16.04 LTS. В разработке были задействованы такие библиотеки, как pymorhy2, sklearn и pymongo. Для анализа аудиодорожки видео была использована технология Yandex SpeechKit Cloud, позволяющая преобразовать аудиопоток в текст, что делает возможным использование тех же методов для её анализа, что и для текста. Также было проведено практическое исследование эффективности применяемых методов для данной задачи. По итогам работы, поставленные задачи были выполнены в полном объёме. Было установлено, что все используемые методы и разработанные программные средства являются эффективными для решения задачи.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ